第五讲 随机变量与数据分析
导读问题
1.任选一个基本概念进行解释(比如:随机事件、随机变量、古典概率等等)
2.统计学与数学有什么区别?
一、古典概率
古典概率是指概率是一个分数,分子是有利情况的数目,分母是所有可能情况的数目。
这是拉普拉斯在1814年出版的一本小册子《概率的哲学导论》中给出的:机遇理论的要义是:将同一类的所有事件都化简为一定数目的等可能情况。即化简到这样的程度,我们可以等同地对待所有不确定的存在、并且确定欲求其概率那个事件的有利情况的数目,此数目与所有可能情况之比就是欲求概率的测度。简而言之,概率是一个分数,其分子是有利情况的数目,分母是所有可能情况的数目。
二、统计学与数学的区别
虽然统计学要用数学语言进行表达,但与传统的确定性数学是合而不同,分析这个区别,不仅有利于了解统计学,也有利于深刻地理解数学。大概有三个不同。
第一,立论基础不同。通过数量与数量关系的抽象,可以看到,数学是建立在概念和符号的基础上的,一个好的概念的形成(比如实数的定义)、一个好的符号表达(比如函数的连续),对数学的发展至关重要。而统计学是建立在数据的基础上的,是通过数据进行推断的。
第二,推理方法不同。数学的证明是基于公理和假设的,证明的过程依赖的是演绎推理,得到的结论是必然的。统计学强调的是数据产生的背景,根据背景寻找合适的抽象方法和推断方法,推理的过程依赖的是归纳推理,得到的结论是或然的。在后面几讲,还会专门讨论这两种形式的推理。
第三,判断原则不同。因为传统数学研究的是确定性问题,因此对结果的判断原则只能是“对”或“错”。而统计学是通过数据推断数据产生的背景,允许人们根据自己的理解提出不同的推断方法,因此统计学对结果的判断原则只能是“好”或“坏”。在这个意义上,统计学不仅是一门科学,也是一门艺术,因为艺术作品允许“仁者见仁,智者见智”。
三、金句摘录
在现代生活中,统计学变得越来越重要,主要原因是数据分析变得越来越重要。因为计算机科学和信息科学的迅猛发展,人们把数据等同于信息,对许多事情都进行数据化处理,包括言语、信号、图形、声音,把凡是能够承载信息的东西都形成数据,而统计学恰恰是数据分析的科学和艺术。
——史宁中,数学基本思想18讲[M].北京:北京师范大学出版社,2016:62
网友评论