抽样调査的基本概念
1.总体:调査对象的全体。2.样本:由从总体中按一定原则或程序抽出的部分个体所组成。
3.样本量:样本中包含的入样单位的个数。4.抽样框:供抽样所用的所有抽样单元的名单,是抽样总体的具体表现。
抽样调査中的误差
1.抽样误差:由于抽样的随机性造成的(抽样误差产生的根本原因),跟总体分布、样本量、抽样方式、估计量选择有关。
2.非抽样误差:抽样框误差、无回答误差、计量误差(获得的数据与其真值之间不一致)。
几种基本概率抽样方法
简单随机抽样:最基本的随机抽样方法。分为有放回和不放回简单随机抽样。有放回或不放回
分层抽样:先按照某种规则把总体分为不同的层,然后在不同的层内独立、随机地抽取样本。先分层(分组),后随机
系统抽样:先将总体中的所有单元按一定顺序排列,在规定范围内随机抽取一个初始单元,然后按事先规定的规则抽取其他样本单元。先排序,再随机初始,后规则
整群抽样:将总体中所有的基本单位按照一定规则划分为互不重叠的群,抽样时直接抽取群,对抽中的群调査其全部的基本单位,对没有抽中的群则不进行调査。按规则划分,抽取一个群,调査所有单位
多阶段抽样:经过两个及两个以上抽样阶段抽样方法的统称。先随机,再从中随机
第二十六章回归分析
【知识点1】回归模型
回归分析与相关分析:
二者在研究目的和方法上具有明显的区别:
(1) 相关分析需要依赖回归分析表明现象数量相关的具体形式;
(2) 回归分析依赖相关分析表明现象数量变化的相关程度;
(3) 相关分析无法从一个变量的变化来推测另一个变量的变化情况,回归分析的数学方程式可以从已知量推测未知量。
一元线性回归模型表不为:Y= 8。+B iX+ £
e即误差项,是一个随机变量,表示除线性关系之外的随机因素对Y的影响,是不能由X和
Y的线性关系所解释的Y的变异性。8。是回归直线的截距。Bi是回归直线的斜率。
回归方程E (Y) =8 0+8 IX
是回归直线的斜率,表明X每变动一个单位,E (Y)的变动量。
【知识点2】模型的检验与预测
1、 决定系数fV,可以测度回归直线对样本数据的拟合程度。
2、 决定系数取值:0到1之间。R2 = l,说明回归直线可以解释因变量的所有变化。R2 = 0,说明回归直线无法解释因变量的变化,因变量的变化与自变量无关。
3、 决定系数越高,模型的拟合效果就越好,即模型解释因变量的能力越强。
4、回归分析的一个重要应用就是预测,即利用估计的回归模型预估因变量数值。
第二十七章时间序列分析
【知识点1]时间序列及其分类
绝对数时间序列统计指标值是绝对数。分为:①时期序列(即过程总量)②时点序列(如年底总人口数)
相对数时间序列统计指标值是相对数。如男、女人口的比重
平均数时间序列统计指标值是平均数。如人均国内生产总值。
【知识点2】时间序列的水平分析
1、平均发展水平
序列 具体类别 平均数的计算
时期序列 /简单算术平均数
时点序列 连续时点(以天为时间单位)逐日登记逐日排列 简单算术平均数
指标值变动才登记 加权算术平均数
间断时点 :
间隔时间相等 两次平均:均为简单算术平均
间隔时间不相等两次平均:第一次简单算术平均;第二次加权算术平均
2、增长量与平均增长量:
逐期增长量 报告期水平一前一期水平
累计增长量 报告期水平一最初水平
累计增长量等于相应时期逐期增长量之和
平均增长量:逐期增长量之和/逐期增长量的个数=累计增长量/n — 1
平均增长量是逐期增长量的序时平均数
【知识点3】时间序列的速度分析
发展速度=报告期水平/基期水平
定基发展速度=报告期水平/固定水平 定基发展速度等于相应时期内各环比发展速度的连乘积(口诀:
川圧球球定基积)。两个相邻时期定基发展速度的比率等于相应时期的环
环比发展速度=报告期水平/前一期水平打復8、比发展速度(口诀:环比比)
平均发展速度通常釆用几何平均法计算,公式中的n为环比发展速度的个数,应该比时间序列的项数少1
增长速度增长速度=发展速度一1
增长1%的绝对值=逐期增长率/环比增长速度(速记:增长1%的绝对值=上一年数值/100)
【知识点4】平滑预测法
移动平均法:使用时间数列中最近k期数据值的平均数作为下一期的预测值,K为移动间隔。
指数平滑法:Ft+i=aYt+ (1-a) Ft , F为指数平滑预测值;Y为实际观测值;a为平滑系数,取值范围0<a<1。
网友评论