美文网首页
stata--在大数据集中统计小层面的平均

stata--在大数据集中统计小层面的平均

作者: 古城路揸fit人 | 来源:发表于2019-12-01 22:47 被阅读0次

在一个已经合并的学生数据集中,如何统计教师的年龄的均值呢?
使用到duplicates tag命令标记每个班级id重复的个数,统计出学生的个数,然后再进行一些巧妙的替换处理,具体计算如下:

*统计校级平均
duplicates tag classid year, gen(mistake)  //标记一个班重复多少个,也就可以间接看出一个班由多少人
bysort classid year: replace mistake=0 if (_n != 1) //除每个班第一个外,剩下的全部替换为0
bysort schids:egen chnb02__ = mean(chnb02) if mistake!=0 //计算每个不等于0的学校级别的平均
bysort schids:egen chnb02___ = mean(chnb02__) //算出来的校级平均推广到缺失值中
replace chnb02 =chnb02___ if chnb02==. //替换
replace chnb02 = floor(chnb02)
tab chnb02 $chn,m
cap drop chnb02__ chnb02___ mistake

相关文章

  • stata--在大数据集中统计小层面的平均

    在一个已经合并的学生数据集中,如何统计教师的年龄的均值呢?使用到duplicates tag命令标记每个班级id重...

  • ML - 简单线性回归 (Simple Linear Regre

    1. 统计量:描述数据特征 集中趋势衡量 均值(平均数,平均值)(mean) {6, 2, 9, 1, 2}(6 ...

  • 统计量总结

    集中趋势统计量 均值(Mean,算术平均值) 所有数据点的和除以数据点的总数。 中位数(Median) 数据点排序...

  • 4.4 统计分析:极差、分位差、方差、标准差

    统计指标对定量数据进行统计描述,常从集中趋势和离中趋势两个方面进行分析集中趋势度量 / 离中趋势度量 1-平均数和...

  • 数据基本感知能力养成

    1.Excel选择加载“数据分析”工具库 2.描述统计字段基本含义: 描述数据集中趋势 (1)平均数(2)中位数:...

  • 【名词解释】之心理统计学

    心理统计学 1、全距:一组数据中,最大数和最小数间的差数 2、算术平均数:简称平均数,是反映一组数据分布集中趋势的...

  • 关于“平均数”的那些事

    平均数是一个重要的刻画数据集中趋势的统计量。我们可以用它来反映一组数据的整体情况,也可以进行不同组数据的比较。对于...

  • 简单的线性回归

    0、前提介绍 为什么需要统计量? 01、集中趋势衡量 0.1.1均值(平均数,平均值)(mean) {6, 2, ...

  • mysql按分钟、小时统计数据

    在工作中我们经常要按分钟、小时统计mysql中的数据,比如统计一小时内的平均值。 假如这是我们的数据库,要统计一小...

  • 大数据之统计学基础(一) -- 描述统计

    描述统计 1.描述数据水平的统计量 平均数(平均数反映了一组数的平均水平,平均数会受到极端值的影响),在计算时一般...

网友评论

      本文标题:stata--在大数据集中统计小层面的平均

      本文链接:https://www.haomeiwen.com/subject/yiitgctx.html