本文最后更新于:2020年7月10日 早上

309.最佳买卖股票时机含冷冻期

给定一个整数数组,其中第 i 个元素代表了第 i 天的股票价格 。
设计一个算法计算出最大利润。在满足以下约束条件下,你可以尽可能地完成更多的交易(多次买卖一支股票):
你不能同时参与多笔交易(你必须在再次购买前出售掉之前的股票)。
卖出股票后,你无法在第二天买入股票 (即冷冻期为 1 天)。

示例:

输入: [1,2,3,0,2]
输出: 3 
解释: 对应的交易状态为: [买入, 卖出, 冷冻期, 买入, 卖出]

一种常用的方法是将「买入」和「卖出」分开进行考虑:「买入」为负收益,而「卖出」为正收益。在初入股市时,你只有「买入」的权利,只能获得负收益。而当你「买入」之后,你就有了「卖出」的权利,可以获得正收益。显然,我们的目标总是将收益值最大化。因此,我们可以使用动态规划的方法,维护在股市中每一天结束后每种状态可以获得的「累计最大收益」,并以此进行状态转移,得到最终的答案。

方法一:动态规划

思路与算法
我们用 $f[i]$ 表示第 $i$ 天结束之后的「累计最大收益」。根据题目描述,由于我们最多只能同时买入(持有)一支股票,并且卖出股票后有冷冻期的限制,因此我们会有三种不同的状态:

  • 我们目前持有一支股票,对应的「累计最大收益」记为 $f[i][0]$;

  • 我们目前不持有任何股票,并且处于冷冻期中,对应的「累计最大收益」记为 $f[i][1]$;

  • 我们目前不持有任何股票,并且不处于冷冻期中,对应的「累计最大收益」记为 $f[i][2]$。

这里的「处于冷冻期」指的是在第 $i$ 天结束之后的状态。也就是说:如果第 $i$ 天结束之后处于冷冻期,那么第 $i+1$ 天无法买入股票。

从第 $i-1$ 天到第 $i$ 天的状态转移:

  • 对于 $f[i][0]$,我们目前持有的这一支股票可以是在第 $i-1$ 天就已经持有的,对应的状态为 $f[i-1][0]$;或者是第 $i$ 天买入的,那么第 $i-1$ 天就不能持有股票并且不处于冷冻期中,对应的状态为 $f[i-1][2]$ 加上买入股票的负收益 ${\it prices}[i]$。因此状态转移方程为:

  • 对于 $f[i][1]$,我们在第 $i$ 天结束之后处于冷冻期的原因是在当天卖出了股票,那么说明在第 i-1i−1 天时我们必须持有一支股票,对应的状态为 $f[i-1][0]$ 加上卖出股票的正收益 ${\it prices}[i]$。因此状态转移方程为:

  • 对于 $f[i][2]$,我们在第 $i$ 天结束之后不持有任何股票并且不处于冷冻期,说明当天没有进行任何操作,即第 $i-1$ 天时不持有任何股票:如果处于冷冻期,对应的状态为 $f[i-1][1]$;如果不处于冷冻期,对应的状态为 $f[i-1][2]$。因此状态转移方程为:

第i天持有股票:前一天持有/今天买股票
第i天冷冻:前一天持有股票,今天卖掉这支股票
第i天空闲:前一天处于冷冻期/前一天空闲

状态机

graph LR
A[f0] --休息--> A[f0]
A[f0] --卖出--> B[f1]
B[f1] --解冻--> C[f2]
C[f2] --休息--> C[f2]

最终答案:$\max(f[n-1][0], f[n-1][1], f[n-1][2])$

如果最后一天(第 $n-1$ 天)结束后,持有股票这种状态是无意义的而且肯定不是最优解(毕竟$-{\it prices}[i]$)。

所以最终答案是$f[n-1][1]$和$f[n-1][2]$中的最大值,即$\max(f[n-1][1], f[n-1][2])$。

动态规划中的边界条件——第 $0$ 天的情况:

在第 $0$ 天时,如果持有股票,那么只能是在第 $0$ 天买入的,对应负收益 $-{\it prices}[0]$;如果不持有股票,那么收益为零。注意到第 $0$ 天实际上是不存在处于冷冻期的情况的,但我们仍然可以将对应的状态 $f[0][1]$ 置为零,官方:这其中的原因留给读者进行思考(我:不然勒,还能置成啥)。

代码

class Solution:
    def maxProfit(self, prices: List[int]) -> int:
        if not prices:
            return 0
        
        n = len(prices)
        # f[i][0]: 手上持有股票的最大收益
        # f[i][1]: 手上不持有股票,并且处于冷冻期中的累计最大收益
        # f[i][2]: 手上不持有股票,并且不在冷冻期中的累计最大收益
        f = [[-prices[0], 0, 0]] + [[0] * 3 for _ in range(n - 1)]
        for i in range(1, n):
            f[i][0] = max(f[i - 1][0], f[i - 1][2] - prices[i])
            f[i][1] = f[i - 1][0] + prices[i]
            f[i][2] = max(f[i - 1][1], f[i - 1][2])
        
        return max(f[n - 1][1], f[n - 1][2])

空间优化:只需要存储前一天的三个状态即可,不必把每一天的状态都存储下来。

class Solution:
    def maxProfit(self, prices: List[int]) -> int:
        if not prices:
            return 0
        
        n = len(prices)
        f0, f1, f2 = -prices[0], 0, 0
        for i in range(1, n):
            newf0 = max(f0, f2 - prices[i])
            newf1 = f0 + prices[i]
            newf2 = max(f1, f2)
            f0, f1, f2 = newf0, newf1, newf2
        
        return max(f1, f2)

复杂度分析

  • 时间复杂度:$O(n)$,其中 $n$ 为数组 ${\it prices}$ 的长度。
  • 空间复杂度:$O(n)$。我们需要$3n$的空间存储动态规划中的所有状态,对应的空间复杂度为$O(n)$。如果使用空间优化,空间复杂度优化为$O(1)$。

参考资料

官方题解


本博客所有文章除特别声明外,均采用 CC BY-SA 4.0 协议 ,转载请注明出处!

机器学习-聚类 上一篇
leetcode51 下一篇