1.等概率选择 1 个
一开始选择第一个数据作为候选数据,以概率为1/2拿第二个数据替换当前候选,以1/3拿第三个数据替换当前候选,依次类推。
这样第 m 个数据为最终选中数据的概率 = 第m个数据被选中 * 第 m+1、m+2 ...n个数据不被选择
即
2.等概率选择 k 个
一开始选择前k个数据作为候选数据,以的概率选择后面的数据(也就是从k+1开始的数据)。
这样第m个数据被选择的概率
= 第m个数据被选中 * (后面的数据没有被选中+后面的数据被选中了但是没有替换掉第m个数据)
= 第m个数据被选中 * {(第m+1个没中+第m+1中了*没有替换掉第m个)*(第m+2个没中+第m+2中了*没有替换掉第m个* ... *(第n个没中+第n中了*没有替换掉第m个)}
公式表达:
参考文章:https://blog.csdn.net/jingshuiliushen_zj/article/details/83584567
网友评论