学习材料来源:《应用stata做统计分析》 劳伦斯·汉密尔顿
一、数据管理
感觉把原始数据处理成能够用来做回归的数据集是最难也最重要的一步了,之后只要按部就班回归就行。
(五)数值与字符串之间的格式转换
encode命令可以依据字符串变量创建一个添加了取值标签的数值型变量。数字1被赋给字符串按字母顺序排在第一位的那个,随后是2。
decode命令可以使用添加了取值标签的数值型变量的值创建字符串变量。
有时我们会遇到字符串变量的取值全部或者绝大部分都为数字的情况,为了将这些字符取值转换成与其相对应的数字,可以使用real函数。比如,尽管如下所述siblings变量仍属于字符串变量,其实只有“4或更多”(4 or more)这一种取值可能不大容易用一个数字加以表示。
generate sibnum=real(siblings) 新变量sibnum属于数值型变量,当siblings为“4或更多”时,其取值为缺失。
destring命令提供了将字符串变量转换成数值型的更灵活方法。
destring siblings, generate(sibnum) force
网友评论