定义:采样本质上是对随机现象的模拟,根据给定的概率分布,来模拟产生一个对应的随机事件。采样可以让人们对随机事件及其产生过程有更直观的认识。
实例:通过对二项分布的采样,可以模拟”抛硬币出现正面还是反面“这个随机事件,进而模拟产生一个多次抛硬币出现的序列。
采样的作用:
1.采样也是一种信息降维,可以起到简化问题的作用。
2.采样得到的样本集可以看作是一种非参数模型,即用较少量的样本点(经验分布)来近似总体分布,并刻画分布中的不确定性。
3.采样这种信息降维的特性,可以帮助人们快速、直观地了解总体分布中数据的结构核特性。
4.利用重采样可以保持特定的信息下(目标信息不丢失),有意识地改变改变样本的分布,以更适应后续模型的训练和学习,比如用重采样来处理分类模型的训练样本不均衡的问题。
5.很多模型由于结构复杂、含有隐变量等原因,导致对应的求解公式比较复杂,没有显示解析解,难以进行精确求解或推理。这种情况下可以利用采样的方法进行随机模拟,从而对这些复杂模型进行近似求解或推理。
网友评论