美文网首页
基于Python的21点游戏蒙特卡洛模拟

基于Python的21点游戏蒙特卡洛模拟

作者: Vector_Wan | 来源:发表于2019-05-01 17:29 被阅读0次

    问题重述:

    大多数赌场使用6副牌或8副牌玩这种游戏,以防止“数牌点”,在你的模拟中使用两副牌(共104张)。只有2位参与者,你和庄家。游戏开始时每人得到两张牌,对于牌面为2~10的牌,点数和面数相同;对于为人脸(J、Q、K)的牌,点数为10;牌面为A的牌,点数为1或者11.游戏的目的是得到总数尽量接近21点的牌,不得超过(超过称“爆了”),并使你得到的总点数多于庄家。             
    如果开始两张牌的总点数恰为21(A-10或A-人脸),称为21点,自动成为胜者(若你和庄家都得到21点,则为平局,你的赌注仍在台上)。靠21点赢时,付给你3赔2,即1.5赔1(1元赌注赢1.5元,且1元赌注仍保留)。
    如果你和庄家都未得到21点,你想要多少张牌就可以取多少张牌,一次一张,使总数尽量接近21点,如果你超过了21点,就输了,游戏结束。一旦你对牌的点数满意,你就“打住”,然后庄家按照下列规则取牌:
    当庄家牌的点数为17、18、19、20和21时,就打住。若庄家牌的点数小于或等于16,必然取牌。庄家总把A的点数记为11,除非这样使他或她爆了(这时A的点数记为1)。例如,庄家的A-6组合是17点,不是7点(庄家没有选择权),且庄家必须打住在17点上。而若庄家有A-4组合(15点),又拿了一张K,那么新的总点数是15,因为A回到点数1(使之不超过21点) ,庄家还要再取牌。
    如果庄家超过21点,你就赢了(赢赌注的钱,每1元赌注赢1元)。如果庄家的总点数超过你,你将输掉全部赌注。如果庄家和你的总点数相同,为平局(你不输也不赢)。
    赌场中这个游戏的刺激之处在于,庄家开始的两张牌一张明、一张暗,所以你不知道庄家牌地总点数,必须根据那张明牌赌一把。在这个项目模拟中你不用考虑这种情况,你需要做的是:用两副牌做12次游戏,你有无限的赌资,每次下赌2元。两副牌玩过一次之后,用两副新牌继续玩,这时记录你的得分,然后下一幅牌从0开始,输出是12个结果,你可以用平均数决定你的总成绩。

    函数说明与实现:

    1. get_the_card( a )
      输入一个列表,返回一个整数。
      这个函数可以随机地从总扑克牌列表(列表名为:desktop)中获取一张扑克牌,并将其从扑克牌列表desktop中删除(因为同一张扑克牌不能取两次)。返回新获取到的扑克牌的值。
    def get_the_card(a):
        '''
        从桌面上获取一张扑克牌,并将其从扑克牌列表中删除。
        输入一个列表,返回随机获取的扑克牌值。
        '''
        n = len(a)
        if n == 0:
            sys.exit(1)
        rand_num = np.random.randint(0, n)  # 从现有的扑克牌中随机抽取一张
        num = a.pop(rand_num)               # 弹出选中的那一张
        return num
    
    1. count_points( a )
      输入一个列表,返回一个列表。
      这个函数输入玩家手中的扑克牌列表。(列表名为:player_cards 和 banker_cards),返回玩家手中牌所代表分值的所有可能(列表),不同的可能是由于A牌既可以看成是1也可以看成是11造成的。例如玩家手中的牌是 [1, 1, 1] 那么所有可能为 [3, 13, 23, 33]。
    def count_points(a):
        '''
        这个函数用于计算玩家手中的牌点数的所有可能
        输入:输入一个列表
        输出:输出一个列表
        '''
        i = 0
        sum_points = list([sum(a)])
        while(1 in a):
            a.remove(1)
            i = i+1
            sum_points = sum_points + [sum_points[-1] + 10]
        for k in range(i):
            a.append(1)
        return sum_points
    
    1. whats_the_point (cards, k)
      输入一个列表,一个整数,返回一个整数。这个函数调用了上面的函数。
      如果点数超过21点则返回-2,如果点数刚好是21,返回-1,如果点数介于[0, 19]之间则直接返回点数。
      这个函数输入的是玩家手中扑克牌的列表和一个阈值,返回玩家手中牌在阈值的条件下,最具有优势的点数。正如上面函数说明中叙述的那样,相同的牌可能代表不同的点数,阈值代表了玩家主观的判断,例如:玩家认为17点已经很大了不需要再抽牌了,也就是阈值取17,那么如果他手中的牌为 [1, 7], 那么这个玩家就不会继续抽牌了,如果阈值取为 19 那么这个玩家就会认为 [1, 7] 代表了18 那么他就可以继续抽牌期望点数超过19。
      下图为主函数的流程图:


      主函数流程图
    def whats_the_point (cards, k):
        '''
        这个函数可以输出**玩家**最有可能的点数
        输入:points:点数可能列表
            k: 阈值
        输出:返回最有可能的分数(整数)
        '''
        points = count_points(cards)
        if(points[-1]<k):
            return points[-1]
        elif(points[-1]>21):
            if len(points)==1:
                return points[-1]
            points.pop(-1)
            return whats_the_point (points, k)
        elif(points[-1]>=k and points[-1]<=21):
            return points[-1]
    
    1. black_jack_game(k)
      主函数,输入一个整数,返回一个整数(包括 -3, 3, 2,-2, 0)
      这个函数调用了前三个函数,根据输入的阈值,返回一次游戏所得点数。
    def black_jack_game(k):
        # 初始化全部扑克牌,保存在列表中
        desktop = [10]*32
        for i in [1,2,3,4,5,6,7,8,9]:
            desktop = desktop + [i]*8
    
        # 初始的两张牌    
        banker_cards = list([get_the_card(desktop),get_the_card(desktop)])
        player_cards = list([get_the_card(desktop),get_the_card(desktop)])
    #     print('第一次发牌时玩家手中的牌是', player_cards)     # 检查点
    #     print('第一次发牌时庄家手中的牌是', banker_cards)     # 检查点
        banker_points = whats_the_point(banker_cards,k)
        player_points = whats_the_point(player_cards,k)
    #     print('第一次发牌时玩家手中的牌是', player_cards)     # 检查点
    #     print('第一次发牌时庄家手中的牌是', banker_cards)     # 检查点
    #     print('第一次发牌时玩家的点数是', player_points)     # 检查点
    #     print('第一次发牌时庄家的点数是', banker_points)     # 检查点
        # 判断是否获胜
        if (banker_points == 21):
            return -3
        if (player_points == 21):
            return 3
        if(banker_points == 21 or(player_points == 21)):
            return points
        # 如果没有获胜则继续抽牌直到点数达到了k值
        while True:
            banker_cards = banker_cards + list([get_the_card(desktop)])
            if(whats_the_point(banker_cards,k)>=k):
                break
        while True:
            player_cards = player_cards + list([get_the_card(desktop)])
    #        print(player_cards)     # 检查点
            if(whats_the_point(player_cards,k)>=k):
    #             print('此时玩家手中的牌是', player_cards)     # 检查点
    #             print('此时玩家手中的点数是', banker_cards)     # 检查点
    #             print('此时玩家手中的点数是', whats_the_point(player_cards,k))     # 检查点
    #             print('此时庄家手中的点数是', whats_the_point(banker_cards,k))     # 检查点
                break
        if whats_the_point(player_cards,k)>21:
            return -2
        if whats_the_point(banker_cards,k)>21:
            return 2
        if whats_the_point(player_cards,k)<whats_the_point(banker_cards,k):
            return -2
        elif whats_the_point(player_cards,k)>whats_the_point(banker_cards,k):
            return 2
        elif whats_the_point(player_cards,k)==whats_the_point(banker_cards,k):
            return 0
    

    运行结果:

    下表即为程序运行 12 次的运行结果:


    运行结果

    为了查看不同阈值对结果的影响设计了下面的程序:

    point_list = []
    sumPoint = 0
    for k in range(1,22):
        for i in range(0,1000):
            sumPoint = sumPoint + black_jack_game(k)
        point_list = point_list + [sumPoint]
    

    我们对0到22的阈值分别取了1000次实验结果,实验结果如下图所示,x轴为阈值,y轴为1000次模拟实验结果的总和。从结果中可以看出阈值越小,胜利的概率越大。


    不同阈值下的结果

    相关文章

      网友评论

          本文标题:基于Python的21点游戏蒙特卡洛模拟

          本文链接:https://www.haomeiwen.com/subject/nekpnqtx.html