SPSS数据文件的合并方式有两种:纵向拼接和横向合并。
纵向拼接:指的是几个数据集中的数据纵向相连,组成一个新的数据集,新的数据集中的记录数是原来几个数据集中记录数的总和。其实质就是将两个数据文件的变量列按照各个变量的含义一一对应进行首尾连接。
横向合并:值得是按照记录的次序,或者某个关键变量的数值,将不同数据集中的不同变量拼接为一个数据集,新数据及中的变量书是虽有数据集中不重复变量名的总和。横向合并的实质就是将两个数据文件的记录按照对应关系一一进行左右对接。
文件a 文件b 文件c纵向拼接实例:将文件b拼接到文件a
【数据】--【合并文件】--【添加个案】
1)非成对变量
是指两个文件中不一样的变量,无法自动匹配
如本例中“用户编码、sex、age”变量名相同,是可以自动匹配的,但是“Height、H、W ”无法自动匹配,虽然H和Height是同一个意思,但是因为变量名不同,不能自动识别,我们可以强制让H和Height相同。
方法如下:
选中H和Height,点击【配对】按钮,强制定义H和Height含义相同。
但是对于W变量,由于文件a中没有可与之匹配的变量,可以不选,也可以选择生成到新的数据表中。
“只是个案源变量”
勾选后会标识每个个案的来源,也就是说是来自文件a还是文件b,1标识来源于源文件a,0标识来源于拼接文件b
拼接之后的结果如下:
横向连接遵循是三个条件:
1、两个文件必须至少有一个变量名相同的关键变量,该关键变量是数据文件横向连接的依据,比如学号,id等,关键变量可以使多个,并且关键变量的取值在不同的个案间最好有唯一性。
2、如果是使用关键变量进行合并,那么必须事先把两个文件的关键变量按照升序进行排列,否则系统将会报错。
3、数据含义不同时,尽量不要用相同的变量名。
实例:将文件c横向连接到文件a
【数据】--【文件合并】--【添加变量】
网友评论