平均数
均值Mean、中位数Median、众数Mode
异常值Outlier普遍定义
Outlier < Q1 -1.5 * IQR
Outlier > Q3 + 1.5 * IQR
条形图bar chart
直方图histogram
箱线图boxplot
散点图
总体与样本
总体是研究的所有事件的集合。
样本是从总体中选取的相对大小的集合。
抽样步骤:确定目标总体 - 确定抽样单位 - 拟定一个抽样空间(所有抽样单位的列表)
无偏样本
样本与总体的特性(均值和方差)相似
简单随机抽样
通过随机过程选取一个大小为n的样本,所有大小为n的可能样本被选中的可能性都相同。将抽样样本放回总体的是重复抽样,不放回叫不重复抽样。
使用简单随机抽样主要有两种方法:
抽签:把抽样空间中的成员的名字或编号写在纸上或球上,然后将其全部投入一个容器,再随机取出n个名字或编号。
随机编号生成器:为抽样空间的每个成员编一个编号,再生成一组共n个随机编号,然后从该空间中取出编号等于所生成的随机编号的成员。适用于大型抽样空间。
分层抽样
将总体分割为几个相似的组,每个组具有类似的特性,这些特性或者组被称为层。
整群抽样
不是对抽样单位进行简单随机抽样,而是对群进行简单随机抽样。适用于群与群之间很相似的场景。
系统抽样
按照某种顺序列出总体名单,然后每k个单位进行一次调查。缺陷:如果总体中存在某种循环模式,则样本会有偏倚。
点估计量
点估计量是由样本数据得出,是对总体参数的估计,一个总体参数的点估计量就是可用于估计总体参数数值的某个函数或算式,用符号^区别实际总体参数和它的点估计量。e.g.,使用样本均值估计总体均值,那么样本均值就是总体均值的点估计量。
网友评论