第三章 频率法
频率法囊括了概率论中最重要的结论。是现代统计学的基础。
频率——某个随机事件在整体事件中出现的比率。
随机事件/整体事件=频率
3.1频率法的底层逻辑:一个随机事件的发生,是存在一个真实的、客观的概率的。只要数据足够多,计算出来的频率就会无限接近这个真实的、客观的概率。——数学的“大数定律”
数学要的不是经验结论,而是完完全全的基于逻辑的推理与证明。数学和许多学科最大的差异,也正在于此。在数学中,绝不允许用试验、观察来验证一个问题或结论正确与否,数学的结论只能靠逻辑推演和证明来得出。
“大数定律”也证明了在相同环境、重复试验的条件下,用历史数据预测未来是可行的、合理的。
数据足够多——到底是多少
“大数定律”里的数据足够多,是一个无穷大(或无穷小)的概念,是永远也无法触达的。但如果要使其真正应用在现实生活中,就必须给出一定的“限制条件”。数学家设置了两个概念:一个叫做“精度误差”,另一个叫“置信度”。
精度误差:具体数据上下浮动的范围;
置信度:在精度误差范围内的样本比例。
通过这两个限定条件,容忍一定误差发生,可以大幅度减少试验的次数或者采集的数据量。
现实中,几乎所有的数据调查和统计结果都有以下共性:
①基于“用频率来度量概率”这个底层逻辑进行;
②要在概率精度上做出一定程度的妥协。
每年学生就业时,学校上级部门要求每个学校的就业率(包括就业、考研、出国等)不得低于83%,我想这个数据应该就是基于频率法给出的概率。也就是将某个时间段内(比如近5年),劳动力部门每年统计的就业人数除以全国毕业生总数。但并不知道这个概率的精度误差和置信度是多少?
网友评论