统计测量任务十
名词解释
1.标准化回归系数:标准回归系数,是指消除了因变量y和自变量x1,x2,…xn所取单位的影响之后的回归系数,其绝对值的大小直接反映了xi对y的影响程度。
2.测定系数20190331:又叫确定系数。它是回归方程解释力的指标。确定系数指回归方程中,y变量的变异由x变量决定的比率,即回归平方和在总平方和中所占比率。确定系数越大,说明回归效果越好。
简答
一、什么因素可以决定在假设检验中应用z分数还是t分数。推论统计-假设检验(20190331)
答:1)决定在假设检验中应用z分数还是t分数的因素是总体分布、总体方差是否已知以及样本大小。
2)Z检验常用于总体正态分布、方差已知或大样本的平均数的显著性和平均数差异的显著性检验。
3)t检验常用于总体为正态分布或接近正态分布、总体方差未知的平均数的显著性检验,通常是样本数量小。
t检验还常用于两总体正态分布、总体方差未知的平均数差异的显著性检验。
二、简述卡方检验的类别及其含义。推论统计-假设检验(卡方)(答案重新整理)
答:卡方检验常用于计数数据的检验、样本方差与总体方差的差异检验等情况,其类别包括:
1)配合度检验:检验单一因素多项分类的实际观察次数与某种理论次数之间差异的显著性检验。或检验某种次数分布的总体是否服从某一给定的理论分布。是一种单因素检验。
2)独立性检验:同一样本根据两个变量交叉分类的次数表,检验两个变量是独立还是有关的,属于双因素检验。
3)同质性检验:两个样本在同一变量上的分类是否有类似的分布模式,即这两个样本数据是否同质的问题。
三、什么是析因设计的方差分析?它有哪些特点?复杂统计分析-方差分析(析因)
答:析因设计又称因子设计,指两个或多个自变量的各水平组合都要得到考察的实验设计。特点是:
1)相对于单因素实验设计而言,它具有实验次数少,实验精度高的优点
2)实验只要进行n>1次重复,就可以估计出因素间的交互作用效应
3)统计方法复杂,被试人数多
四、什么是拉丁方实验设计?这种设计适用于什么样的研究问题?复杂统计分析-方差分析(拉丁方)(答案重新整理)
答:拉丁方设计是一种为减少实验顺序对实验的影响,而采取的一种平衡实验顺序技术。拉丁方设计扩展了随机区组设计思想,以便分离出两个无关变量的效应。它以拉丁方格为辅助,拉丁方格是在一个含有P行、P列的方格中分配P个字母的管理方案。其中P行表示无关变量1的P个水平,P列表示无关变量2的P个水平,P个字母表示自变量的P个水平。自变量的每个水平在拉丁方格中的每一行、每一列出现一次且仅能出现一次。
拉丁方设计适用条件:自变量的水平数与两个无关变量的水平数应该相等。实验处理水平与两个无关变量无交互作用。
五、简述相关分析和回归分析的区别和联系。复杂统计分析(回归分析)及描述统计(相关系数/分析)
答:1)联系:回归分析和相关分析均为研究及度量两个或两个以上变量之间关系的方法。确定变量之间是否存在关系,这是回归与相关分析的共同起点。回归分析是以数学方式表示变量间的关系,相关分析是检验或度量这些关系的密切程度,两者相辅相成。通过相关分析显示变量间的关系非常密切,则通过回归模型可获得相当准确的推算值。
2)区别:(1)根据不同目的,可从不同角度去分析变量间的关系。当目的是分析变量之间关系的密切程度时,一般使用相关系数,这个过程叫相关分析。当目的是确定变量之间数量关系的可能形式,找出表达它们之间依存关系的合适的数学模型,并用这个模型表示这种关系形式,叫回归分析。(2)相关分析是一种对称设计,回归分析是不对称设计。
论述
一、什么是回归分析,回归分析的主要任务是什么?复杂统计分析-回归分析
答:1)回归分析是通过大量的变量的观测数据,发现变量之间存在的统计规律性,拟合一个因变量与一个或几个自变量之间的关系,并用一定的数学模型表示这种关系;检验自变量影响的显著性程度,比较各自变量作用的大小;用一个或多个变量的变化去解释和预测另一个变量的变化。这种用一定模型来表述变量相关关系的方法就称为回归分析。回归分析不能确定变量之间的因果关系,只能确认自变量与因变量之间统计关系是否存在。
2)回归分析的主要任务是:回归分析是讨论变量间数量关系的一种常用统计方法,它通过建立变量间的数学模型对变量进行预测和控制。其任务是(1)给出当自变量变化时,因变量的平均值变化的规律;(2)根据自变量值对因变量值做出预测。
二、回归系数是按什么思路计算出来的?对回归系数和标准化回归系数应该如何解释?复杂统计分析-回归分析
答:1)在回归方程中,通过常数b表示以自变量x预测因变量y的回归方程的回归系数,或叫做因变量Y对自变量X的回归系数。回归系数是回归直线的斜率,它表示自变量x变化一个单位时,y的平均增加或减少的数量,即当x变化一个单位时,y将变化b个单位。
2)标准回归系数,是指消除了因变量y和自变量x1,x2,…xn所取单位的影响之后的回归系数,其绝对值的大小直接反映了xi对y的影响程度。
3)回归系数是按照最小二乘法的思路估计出来的。回归方程中依据观测数据,求出回归系数b与回归常数a,使得依照回归方程预测因变量y的误差,总体来说达到最小。通常是采用最小二乘法(OLS),实现使误差的平方和达到最小这一要求。用最小二乘法拟合的直线与实际数据的误差比其他任何直线都小。由最小二乘法得到的回归常数、回归系数的计算公式为:a=y-bx
三、一个变量的两个水平间的相关很高,是否说明两水平的均数间没有差异呢?为什么?举例说明。
综合题:描述统计(相关关系)及推论统计(假设检验)
答:1)当一个变量的两个水平之间的相关很高,不能说明两水平的均数间没有差异。
2)相关关系是指两列变量在发展变化的方向与大小方面存在一定的关系。相关系数是表示两列变量相关程度的数量指标,其数值大小表示两列变量相关程度强弱,符号表示两列变量的变化方向。相关系数为-1.00或+1.00,表示两列变量完全相关;相关系数在-1.00-+1.00之间(0点及附近值除外),表示两列变量不完全相关;相关系数为0及附近值,表示两列变量不相关。符号为+表示正相关,即两列变量变动方向相同,一列变量变动时,另一列变量也同时发生与前一列变量同方向的变动。符号为-表示负相关,即两列变量变动方向相反,一列变量变动时,另一列变量也同时发生与前一列变量反方向的变动。
3)当一个变量的两个水平的相关很高时,只表示相关程度强,还需考虑这种相关是正相关还是负相关,即变化发展方向。
4)当一个变量的两个水平的相关很高时,不能说明两个水平的均数之间没有差异。因为相关系数大小只表明两组变量的线性关系强弱。即使两个水平的数据成完全正相关,即相关系数为+1 ,也不能说明它们的平均数没有差异。比如两组数据的对应关系为 ( 1 , 2 ) , ( 2 , 3 ) , ( 3 , 4 )。即 y =x + 1 。这时两组数据的相关系数为+1 ,而两组数据的均数是不同的。因为是在同一个变量的不同水平,而且缺乏足够的信息分析。如要知道这两个水平均数之间是否有差异,可以采用 t 检验等方法获得。
网友评论