美文网首页临床统计
290:Sta base(4)平均数和标准差和变异系数补充

290:Sta base(4)平均数和标准差和变异系数补充

作者: SASPRO的打工人生活 | 来源:发表于2023-12-12 22:09 被阅读0次

    这两天的亲身经历证明:

    当工作了一天累的头晕眼花,回到家吃完饭还想学习点东西的时候,真的是学不进去,一集中精神脑袋就开始疼了,真的心有余而力不足。

    所以累了的话就好好休息吧,看看书或者听听音频就可以,刷视频的话不建议。发现刷视频真的太上瘾了,好看还看不完。走在路上看到现在人人盯着手机看视频,觉得有点“危险”,不仅是物理上的,更是精神上的。

    所以现在控制自己刷视频的时间,宁愿坐在椅子上发呆也不刷手机。

    最近有时间在看中山大学公共卫生学院的《医学统计学》,推荐给大家,视频不长,十分钟左右一节课刚刚好,避免学太多感到厌倦,然后自己做做笔记,每天半小时就能学一些关于医学统计学的知识点。

    这要是在大学听这些,老师可能还没开始讲就拿出手机了。但是现在自己听,听的进去,也能联系自己的工作,理解更深刻,挺好的。

    我现在觉得SDTM\ADaM,尤其是SAS BASE那些没有什么可讲的,相反是这些我们觉得不是很重要的应该多学点,要不然我们天天写TFL那些,光在那写了,至于为什么要求平均数、标准差,做假设检验等等都不知道。

    只能说要学习的真是太多了,我有时候真的想摆烂了,人活着太累了。

    上次我们简单介绍了一下平均数和标准差,但是都是理论的东西,这次我们结合实际例子更深刻地理解一下这些东西,今天讲的东西也是看完视频之后学到的,分享给大家。

    282:Sta base(3)平均数和标准差和变异系数

    算数平均数、集合均属、中位数、众数都是描述数据的集中趋势的。下面是一个例子,首先这3组数据的平均值都是一样的,数据与数据之间的分布都是均匀的,看不出什么。因此这时候我们可能需要用到其他指标来描述数据的分布趋势。

    一组数据除了看平均水平,还要看数据的变异程度。而用来描述数据的变异程度,有极差、四分位数间距、方差、标准差、变异系数。

    极差

    我们可以发现工作中很少会求极差,很简单的方法,就是样本的最大值-最小值;如果样本变大,极差可能也会相应地变大。

    四分数间距     Q=P75-P25

    而四分数间距用的就多了,也就是Q3-Q1(这样说好像有点问题),换句话说就是P25和P75之间的数据,刚好包含总体的50%的个体观察值。

    四分位数越大意味着数据间的变异越大。

    常常把中位数和四分位数间距结合起来描述变量的平均水平和变异程度(中位数描述数据的集中趋势,四分位数描述离散趋势)

    方差/标准差

    这个是老朋友了,定量资料的描述少不了它们。在同类资料比较的时候,方差/标准差越大,意味着数据间离散程度越大。公式我就不放了。

    对于服从正态分布或者近似正态分布的变量,常把均数和标准差结合起来,从平均水平和变异程度两方面描述变量的分布特征。

    上面这两大段东西讲的不就是对应着我们天天出的table的这部分吗。

    所以结合一开始的例子和这张图求出的标准差,A组的标准差最大,数据是不是更离散一些。

    变异系数

    用于不同变量间变异程度的比较,尤其是量纲不同的变量间的比较。

    注意这篇文章里面标红的两句话,做一下比较,一个是同类资料,一个是不同变量之间,怎么理解?举个例子就好理解了:

    比如一个调查得出某地区女童的平均体重是8.42kg;标准差为0.98;身高的均数是72.4cm,标准差为3.0cm。

    我们能直接比较身高的标准差和体重的标准差,然后说体重的变异程度比身高的变异程度低吗?

    这肯定是不行的,这是两个东西,也就是上面说的量纲,因此我们可以采用变异系数来比较

    体重的变异系数:CV=0.98/8.42*100%=11.64%

    身高的变异系数:CV=3.0/72.4*100%=4.14%

    可以看出体重的变异程度还比身高的变异程度高。

    通过上面的这些描述大家是不是对这些统计量有一个更清楚的认识了?、

    最近比较忙,也到年底了,加上工作劳累,随缘更新。

    相关文章

      网友评论

        本文标题:290:Sta base(4)平均数和标准差和变异系数补充

        本文链接:https://www.haomeiwen.com/subject/rszvgdtx.html