本部分的数据处理均以stata15为操作软件。收集完数据并导入后,通常需要对数据进行预处理才能进行下一步的实证,本篇重点介绍使用频率高的一些必要处理命令。
1、数据格式转换
①Syntax(语法)
destring [varlist] —— Convert string variables to numeric variables(字符转数值)
tostring [varlist] —— Convert numeric variables to string variables (数值转字符)
②Options(选项)
generate/replace (生成新变量,或直接将原变量转换成另一种变量)
force (将非字符型的变量值转换为缺失值)
③Examples(示例)
destring wage, replace force (wage为可能存在非字符型数值的变量,改命令将wage从字符 型转换成数值型,转换后的数值直接替代原有数值)
2、时间格式转换
①Syntax(语法)
*format
date %td[details]
weekly date %tw[details]
monthly date %tm[details]
quarterly date %tq[details]
half-yearly date %th[details]
yearly date %ty[details]
②options(选项)
详见stata帮助文件help datetime_display_formats,并选择所需要的格式进行对应转换。
③Examples(示例)
format date %tq(若date需要转换成季度型数据)
2010.01.20 format varlist %tdCCYY.NN.DD
Wed Jan 20 15:15:30 2010 format mytcvar %tcDay_Mon_DD_HH:MM:SS_CCYY
3、其他
①行列对调: xpose, clear (对调完通常需要rename)
②精简存储格式:compress
③标签管理:labelbook
网友评论