美文网首页
随机洗牌算法整理

随机洗牌算法整理

作者: DayDayUpppppp | 来源:发表于2022-10-08 21:00 被阅读0次

    在游戏里面有各种“随机”的需求,比如从n个用户里面随机给m个发奖励。那么,要如何实现呢?简单的来说,可以调一个stl的函数来实现,伪代码如下:

    vector<int> foo(vector<int> & player, int m)
    {
      std::random_shuffle(players.begin(), players.end());
    
      vector<int> result;
      for (size_t i = 0; i < m; i++)
      {
          result.push_back(players[i]);
      }
      return result;
    }
    

    那shuffle背后是怎么实现的呢?或者说如何设计高效并且保证随机概率是相同的洗牌算法呢?

    1. 不带权重的随机洗牌算法
    • 最笨的方法
      从数组里面随机拿出两个元素,进行交换。完成一次洗牌。不停的重复以上过程。重复k次。当k足够大的时候,就洗均匀了。这个方法没什么好说的,除了简单以外就全是缺点了。

    • Yates洗牌
      这个方法是一个很古老的方法,非常好理解。思路是是每次从数组里面随机抽一个元素,放到另外的结果集中。然后不停的重复上述过程,直到抽出m个。但是,由于这个方法要每次对数组的元素进行删除,所以,时间复杂度为O(m*n) 。

    • knuth洗牌 (高德纳洗牌)

    算法的思路是,从头开始遍历数组,对于下标是i的元素,从i到n之间随机出一个下标,对这个元素进行交换。

    伪代码的流程是:

    for i in (0, n) 
        从i 到 n随机出一个数j
        交换a[j] 和 a[i]
    

    知乎上有个很有意思的问题有哪些惊艳你的算法?,也提到了这个洗牌算法。

    有哪些算法惊艳到了你? - 刘宇波的回答 - 知乎
    https://www.zhihu.com/question/26934313/answer/743798587


    小结:
    knuth算法保留了原数组的所有元素,仅改变了元素的顺序,时间复杂度为O(m)。


    2. 带权重的随机洗牌算法

    上述讨论的问题是“如何公平的从长度是n的数组里面随机出m个”,这里的假设是每个元素被随机出来的概率是相同的。

    那问题再复杂些,希望实现“非公平抽奖”,比如:一个集合里有 n 个元素,每个元素有不同的权重,现在要不放回地随机抽取 m 个元素,每个元素被抽中的概率为元素的权重占总权重的比例。

    • 朴素带权重抽样方法

    简化下问题模式,假设权重的和为1,只抽一个人获奖m=1。比如 :a,b,c,d 的权重分别是 0.1,0.3,0.2,0.4,从里面选一个中奖。

    那这个就很简单了,从0~1之间随机一个数,这个数落在谁的区间上,就算谁中奖。

    |-0.1-|---0.3---|--0.2--|----0.4----|
       ^       ^        ^         ^
       a       b        c         d
    

    数学的原理很简单,可以理解为 上面的线段上随机出一个数字,谁占的长度多(概率大就是长度多),那么谁中奖的概率就大。

    刚才是问题的简化版本 m=1(只有一个人中奖),如果希望是m=2的话,就重复上述过程m次。当有人抽到了,就把它移除出来,然后再重复。

    # m=1只有一个人抽奖的情况
    # weight_data 的数据类型为 dict
    def random_weight(weight_data):
        total = sum(weight_data.values())    # 权重求和
        ra = random.uniform(0, total)   # 在0与权重和之前获取一个随机数
        curr_sum = 0
        ret = None
        keys = weight_data.keys()        # 使用Python3.x中的keys
        for k in keys:
            curr_sum += weight_data[k]             # 在遍历中,累加当前权重值
            if ra <= curr_sum:          # 当随机数<=当前权重和时,返回权重key
                ret = k
                break
        return ret
    
    # 当需要 m > 1的时
    def foo(data, N):
        results = []
        i = 0
        while i < N:
            m = random_weight(data)   # 重复n次
            if m in results:
                continue
            results.append(m)
            i = i+1
        return results
    

    小结:
    如果要选取 m 个元素,则可以按上面的方法先选取一个,将该元素从集合中去除,再反复按上面的方法抽取剩余的元素。这种方法的复杂度是 O(mn),并且将元素从集合中删除其实不太方便实现。

    对于带权重抽样,有两个更好的方法来解决朴素带权重抽样的一些弊端,具体的细节在这里:


    参考:

    相关文章

      网友评论

          本文标题:随机洗牌算法整理

          本文链接:https://www.haomeiwen.com/subject/vqcwartx.html