学习材料来源:《应用stata做统计分析》 劳伦斯·汉密尔顿
一、数据管理
感觉把原始数据处理成能够用来做回归的数据集是最难也最重要的一步了,之后只要按部就班回归就行。
(六)创建新的分类变量和定序变量
在已经用type创建分类变量的基础上用tabulate自动创建一组虚拟变量。
tabulate type, generate(type)
在例子中形成一组名为type1、type2、type3的变量,每一个变量代表之前type中的领土地域、省和国家。
autocode函数使变量自动分组。
generate unemp3=autocode(unemp,3,5,20)
创建一个新的定序变量unemp3,使它将unemp从5到20的取值区间分成等宽的三组。(此时缺失值仍为缺失值)
如果数据中没有缺失值,则用group创建定序变量,不是像autocode一样近似等宽的分组,而是近似等规模的分组。第一步,基于关注的变量对数据进行排序(sort)(假定没有缺失值);第二步,group(#),其中#是期望的分组数目。
网友评论