美文网首页
Stata数据处理:如何高效快捷进行批量数据长宽转换(建议收藏)

Stata数据处理:如何高效快捷进行批量数据长宽转换(建议收藏)

作者: 实验诊断与临床 | 来源:发表于2024-07-20 01:43 被阅读0次

有时候我们会发现,在数据分析过程中,其实大部分精力花在了数据清洗整理环节,数据清洗好了,才能势如破竹。对于样本量较大、变量较多的数据集,清洗起来并非易事。


在处理面板数据的时候,经常会用到数据的长宽转换,能够进行数据长宽转换的工具很多,命令也很多,各有所长。

Stata软件在数据清洗转换方面具有独特的优势,下面演示如何利用stata软件高效快捷进行批量数据长宽转换。

一、长数据和宽数据

表1 长数据

如上表1所示,每个变量都多了一个time来识别调查时间,表示术前、术后1周、术后2周、术后3周等,ID也有重复,这样的数据是长数据。

表2 宽数据

如上表2所示,少了time变量,ID不重复,在之前的每个变量末尾标记了对应的时间,如eyesight0、eyesight1分别表示术前和术后1周的视力情况,这样变量个数就增加了6倍(有7个时间点),这种数据集对所有的变量进行了明确的细分,各变量的值不存在重复循环的情况即为宽数据。

二、Stata软件批量多指标长宽转换

如上所述表1和表2之间的相互转化就是长宽转换。

1.导入数据

可以看出,这是一个长数据,涉及到转换的变量有两个,分别是eyesight和leiyefenmi,时间有7个。

2.转换

我们在命令窗口运行help reshape即可查看reshape的演示

接着在命令窗口运行:reshape wide eyesight leiyefenmi, i(ID) j(time)

即可实现长数据转为宽数据,注释也写得非常清晰明了,观察值由14个变为了2个,变量由10个变为21个,time变量由7个变没了,落到了每个变量的末尾作为标识。

相反地,如果需要将宽数据转为长数据,运行:reshape long eyesight leiyefenmi, i(ID) j(time)  即可。

但是如果需要将刚才已经转完成的宽数据回到长数据怎么办呢?

直接运行reshape long即可回到长数据,运行reshape wide又可回到宽数据,就是这么来回切换,不再像最初那样需要输入每个变量名称。

3.特殊情况

当time变量里面有单位时,即0w、1w、2w、3w,需要利用通配符和占位符来辅助完成。

运行:reshape wide eyesight leiyefenmi, i(ID) j(time) string才能转换成功,否则会报错。

反之,如果是宽数据转为长数据,则需要运行:

reshape long eyesight@w leiyefenmi@w, i(ID) j(time)

★注意:

1.本文举的例子是多个变量批量转换的情况,网上绝大多数教程都只是拿一个变量的情况举例子,但现实情况往往不是这样的。

2.还需要注意的是,并不是变量少,观察值多就是长数据,而是看具体数据结构。针对同一个数据集,其长数据和宽数据格式确实分别体现出变量少,观察值多和观察值少,变量多的特点。

3.能够实现长数据和宽数据互相转换的方法很多,如excel的透视表和vlookup函数,R语言tidyr工具包里面的gather/spread函数和pivot_longer/pivot_wider函数、reshape工具包里面的melt/cast函数等,但Stata确实能够更加简单快捷。

相关文章

  • R数据处理之长宽数据转换

    100天生信-Day6 长数据和宽数据是满足不同分析的两种数据格式,可以很方便用R的reshape2包转换,代码如...

  • 再议ANUSPLIN之月值气象数据转换为插值格式

    月值数据转换 月值数据处理,除了日值气象要素外,我们还经常用到月值数据,针对月值气象要素如何批量变成AUSPLIN...

  • Stata小白系列之四:长宽数据转换

    作者:谢作翰 | 连玉君 | (知乎 | 简书 | 码云) 编者按: 从本期开始,Stata 连享会将推出「St...

  • STATA技巧收集

    1、数据处理 2、统计模型 3、模型检验 如何用 Stata 做调节中介效应检验? 4、图形绘制

  • 长宽数据转换

    长数据 长数据一般是指数据集中的变量没有做明确的细分,即变量中至少有一个变量中的元素存在值严重重复循环的情况(可以...

  • 长宽数据转换

    reshape2的melt 函数完成 这里我们重点用gather函数(tidyl里面的)1.构建数据集 转换前数据...

  • 第一章 spark-streaming的概述

    section 1 spark-streaming是什么 //数据处理的方式角度 流式数据处理 批量数据处理 //...

  • 2019-07-18听课总结

    内容 • 循环-数组|数据框• 循环-因子• 循环-while| if else• 数据处理-排序|集合|长宽• ...

  • 数据处理

    数据处理:对数据进行分析和处加工的过程 计算机数据处理主要包括8个方面。 ①数据采集:采集所需的信息。 ②数据转换...

  • 计量实证准备:预处理之数据转换(一)

    本部分的数据处理均以stata15为操作软件。收集完数据并导入后,通常需要对数据进行预处理才能进行下一步的...

网友评论

      本文标题:Stata数据处理:如何高效快捷进行批量数据长宽转换(建议收藏)

      本文链接:https://www.haomeiwen.com/subject/rnrjhjtx.html