转载或使用文章内容请标明出处
几个微不足道的小功能(就是省去打几个字和点几下鼠标的时间),对于经常处理数据的人来说,却还挺实用。在写新教程的时候感觉这些操作真的烦,顺手就做了一个。
目录
1 下载地址
2 安装
3 使用案例1-自动编号
4 使用案例2-个案重复排查
5 使用案例3-个案缺失排查
6 使用案例4-Bootstrap构造新样本
1 下载地址
读者可在公众号(邱宗满)左下角菜单中下载该工具。(资料课程→所有资料→各类自制工具)
2 安装
安装流程自带于压缩包中,安装完毕后会出现在“转换”底下
3 使用案例1-自动编号
假设存在以下数据。
打开插件,在“个案自动编号”下方选择“从1开始”,点击“确定”,完成操作。
随后,数据集中产生名为“case_id”的变量。
4 使用案例2-个案重复排查
假设数据与3一致。打开插件,在“个案重复排查”下方选择“开启”,将想要排查的变量选择至图中位置,在“将……另存为新文件”底下选择“非重复个案”,点击“确定”,完成操作。
随后,数据集中产生名为“primarylast”的变量。变量值为“0”表示该个案为重复个案,变量值为“1”则表示该个案是唯一个案或者在多个重复个案中被选中为唯一有效个案。
软件会使用该分析中所标明的非重复个案产生名为“non_duplicate_cases”的数据集,需要自行手动保存。
5 使用案例3-个案缺失排查
假设数据与3一致。打开插件,在“个案缺失排查”下方选择“开启”,将想要排查的一连串变量的首尾变量选择至下方位置。
在“将……另存为新文件”底下选择“缺失个案”,点击“确定”,完成操作。
随后,数据集中产生名为“case_miss”的变量。变量值为个案缺失的变量数量,例如值为“0”表示个案缺失“0”个变量(没有缺失),值为“1”即表示个案缺失“1”个变量,以此类推。
该分析中所标明的缺失个案会产生名为“missing_cases”的数据集,需要手动保存。
6使用案例4-Bootstrap构造新样本
假设数据与3一致。打开插件,在“随机选择个案”下方选择“Bootstrap”,并在“Bootstrap设置”下方输入3个主要的设定,最后,点击“确定”,完成操作。
其中,“原始数据集的个案数(M)”需要我们查看原数据共有几个个案并填入,此处原数据集共10个个案,故填入“10”;“每个Bt 样本的个案数(N)”则是表示我们一共要产生多少个个案;而“产生的Bt 样本数(S)”可以决定我们将重复抽取多少次的“N”个个案。此处,我们设定使用Bootstrap抽取5个个案作为1个新样本,并重复产生3个这样的样本。
随后,我们原本的数据集将会被关闭,原数据迁移至名为“bootstrapping_sample”的新数据集,并产生名为“case_id_bt_temp”的个案序号变量。
而我们设定构造的数据会产生在另一个新数据集中,需要手动保存。
新数据集中,“boot_sample_id”表示我们构造的样本个数,此处为3个;“boot_case_id”表示每个样本包含的个案数量,此处每个样本都包含5个个案;最后,“case_id_bt_temp”则表示该个案在原数据集中的序号,可与前一个数据集进行比较。
网友评论