题目
Alice 和 Bob 用几堆石子在做游戏。几堆石子排成一行,每堆石子都对应一个得分,由数组 stoneValue
给出。
Alice 和 Bob 轮流取石子,Alice 总是先开始。在每个玩家的回合中,该玩家可以拿走剩下石子中的的前 1、2 或 3 堆石子 。比赛一直持续到所有石头都被拿走。
每个玩家的最终得分为他所拿到的每堆石子的对应得分之和。每个玩家的初始分数都是 0 。比赛的目标是决出最高分,得分最高的选手将会赢得比赛,比赛也可能会出现平局。
假设 Alice 和 Bob 都采取 最优策略 。如果 Alice 赢了就返回 "Alice" ,Bob 赢了就返回 "Bob",平局(分数相同)返回 "Tie" 。题目来源
示例 1:
输入:values = [1,2,3,7]
输出:"Bob"
解释:Alice 总是会输,她的最佳选择是拿走前三堆,得分变成 6 。但是 Bob 的得分为 7,Bob 获胜。
示例 2:
输入:values = [1,2,3,-9]
输出:"Alice"
解释:Alice 要想获胜就必须在第一个回合拿走前三堆石子,给 Bob 留下负分。如果 Alice 只拿走第一堆,那么她的得分为 1,接下来 Bob 拿走第二、三堆,得分为 5 。之后 Alice 只能拿到分数 -9 的石子堆,输掉比赛。如果 Alice 拿走前两堆,那么她的得分为 3,接下来 Bob 拿走第三堆,得分为 3 。之后 Alice 只能拿到分数 -9 的石子堆,同样会输掉比赛。
注意,他们都应该采取 最优策略 ,所以在这里 Alice 将选择能够使她获胜的方案。
题解
题目的要求是获得最大分数,石子的数量固定,因此对方获得的分数即为你损失的分数。此题采用动态规划的解题方法,首先明确【状态】,即目前你能获得的最大分数,其次是如何【选择】,按题目要求一次可以取1、2或者3堆石子,明确了状态和选择即可形成基本的动态规划思路。
我们用dp[i]
表示在有[i,stoneValue.size())
时所能获得最大的分数,由于对方的收益为你的损失,且在你拿完此次选择后变为后手,对方变为先手,对方也会采取最佳策略,所以dp[i] = a[i] - dp[i+1]
其中a[i]为你拿去的分数,
在i
处拿一堆时:
dp[i] = a[i] - dp[i+1]
在i
处拿两堆时:
dp[i] = max(dp[i],a[i] + a[i+1] - dp[i+2])
在i
处拿三堆时:
dp[i] = max(dp[i],a[i] + a[i+1] + a[i+3] - dp[i+3])
最后,dp[0]
即为先手所能获得的最大分数,dp[0] > 0
即为Alice
获胜
代码
class Solution {
public:
string stoneGameIII(vector<int>& stoneValue) {
int n = stoneValue.size();
vector<int> dp(n, INT_MIN);
for(int i = n - 1; i >= 0; i -= 1){
int s = 0;
for(int j = 1; j <= 3; j += 1) if(i + j <= n){
s += stoneValue[i + j - 1];
if(i + j == n) {
dp[i] = max(dp[i], s);
}
else{
dp[i] = max(dp[i], s - dp[i + j]);
}
}
}
if(dp[0] > 0) return "Alice";
if(dp[0] < 0) return "Bob";
return "Tie";
}
};
网友评论