统计知识方面的文章大多数来自一些统计书籍,然后个人理解有偏颇的地方还望大家指出和包涵,文中知识不一定具有指导意义,纯属个人笔记。欢迎指正和讨论。
大家写多了,也可以总结出TFL大致就分为两类,一类是对数据进行描述(计算频数频率、均值标准差那些),一类是进行统计推断(P值,置信区间等)。
我们在写table的时候,除了疗效分析部分的东西,还有就是描述性统计了,其中就包括频数。
频数只能定性地描述一组数据,为了更客观地描述临床数据,需要借助3种分析工具的帮助
1)数据集中点的度量---平均数 (常用)
2)数据变异程度的度量---标准差(常用)
3)数据分布的对称程度及陡峭程度的度量---偏斜度和峭度 (不常用)
上面的这3个是描述样本频率分布特征的,可以简称为样本特征数。
一:
平均数:求平均数的目的,是为了给出一个数,然后用这个数来描述由许多数组成的样本。
第一种平均数是算术平均数;第二种平均数是中位数;第三种平均数是众数。(来自《生物统计学--杜荣骞》)注意这3种平均数都符合上面讲到的第一个点---数据集中点的度量。
我觉得还是分开讲比较好,也就是描述数据集中点的度量有平均数、中位数、众数。因为我觉得大多数人理解的平均数=算术平均数,然后突然说中位数和众数也是平均数下面的分类有点不太习惯(至少对于我来说)
至于平均数的算法我就不描述了。
二:标准差
对于数据的变异程度,经常使用的度量方法有3种:范围(也叫做极差)、平均离差和标准离差(也就是标准差)。
我只介绍工作中常用的标准差。
介绍标准差之前,就得讲到方差,讲到方差,就得讲到离均差,也就是每个数与平均数之间的离差。
简单来说,
①先求得所有样本的平均数,
②然后再用每一个样本减去这个平均数就得到了每一个离均差(所有的离均差加起来是等于0的)
③之后再对所有的离均差平方一下再加起来,接着除以n-1就是样本方差了
④对方差开个根号就得到了样本标准差。
三:变异系数
变异系数的计算公式是
也就是用标准差除以平均数,假设1个样本的标准差是2.68,另一个样本的标准差是1.23,同时假设两个样本的平均数差不多,这时候我们就可以说第一个样本的变异幅度更大,不如第二个样本整齐。
所以变异系数是用来形容样本或者总体变异幅度,或者说是整齐度的。这个在汇总血药浓度方面的数据尤其常见,比如说比较空腹和餐后的血药浓度数据,那么当看到给药后的数据变异系数大一点,你是不是就可以根据上面的理论解释一下。
网友评论