目录
0.简介
1.下载与(Windows)安装
2.使用
3.引用
0.简介
提供一些用于管理数据的功能,包括自动ID,产生随机数,识别重复个案和缺失个案,随机分组,随机选择个案(可指定分组变量),改变变量格式,有放回的重抽样(Bootstrap)和不放回的重抽样等。最大的特点有二:其一,例如随机选择个案后可以将个案另存至新数据集;其二,提供近40页的教程,包含所有功能的使用细节。
1.(Windows)安装
读者可在公众号左下角通过“资料课程→课件&工具&数据→各类自制工具”进入下载。对SPSS单击鼠标右键,选择“以管理员身份运行”。
通过“扩展”进入“安装定制对话框”
选择“.spd”安装包进行安装。
安装成功后,即会显示该对话框的位置。
该对话框在“数据”菜单下。
2.使用
手册中已经包含非常详细的使用过程,此处仅介绍新增的不放回抽样。
无放回抽样(sampling without replacement),与有放回抽样不同,在每个抽取的样本中,个案都不会重复。由于两者的不同,有放回的抽样中,每个样本包含个案数量可以大于原始数据的个案数;但是在无放回的抽样中,每个样本的个案数量一定小于等于原始数据个案数。
使用以下数据进行案例操作(压缩包内有提供)。
在主界面内进入“重抽样”子对话框,开启重抽样,并选择“无放回抽样”。之后,我们需要进行3个设定,包括原始数据的总个案数(此处为“15”)、每个模拟样本包含的个案数量和总共模拟的样本。原始数据总个案数需要根据当前数据集的个案数量进行填写,后两者可自行设定。此处,设定构造9个样本,每个样本包含7个个案。
完成操作后,真正的原始数据将被关闭,并打开名为“raw_data.sav”的数据,这是在原始数据基础上增加了一个ID变量(即“id_resampling”)的数据。
此外,还会打开重抽样构造的新数据集“wor_sample.sav”。该数据集会在原数据集上增加3个新变量。第一个变量为“worsample_id”,表示抽取的样本数量;第二个变量为“worcase_id”,表示每个样本中包含的个案数量;第三个为“id_resampling”,这是与“raw_data.sav”中相对应的变量,表示每个个案的独特编号。由于设定抽取9个样本,每个样本包含9个个案,所以抽取的新数据集个案总数=9*7=63。
3.引用
英文可使用以下引用:
Zongman Qiu. (2020). Manadata: a SPSS macro for data management. https://www.researchgate.net/publication/344362619_Manadata_a_SPSS_macro_for_data_management
中文可使用以下引用:
邱宗满. (2020). Manadata: 用于数据管理的SPSS宏. https://www.researchgate.net/publication/344362619_Manadata_a_SPSS_macro_for_data_management
网友评论