美文网首页
SPSS-数据处理

SPSS-数据处理

作者: Choi十七 | 来源:发表于2020-07-14 11:35 被阅读0次

一、数据清洗

【数据】-【标识重复个案】(主个案指示符(0代表重复个案,1代表唯一或基本主个案))

1.所有变量->定义匹配个案的依据,其他默认;

⭐️【🔘每组中的最后一个个案为主个案 名称:最后一个基本个案】;

2.选中“最后一个基本个案”,单击鼠标右键,选择【升序排序】;

3.选中“最后一个基本个案”变量值为0(重复)的个案,单击鼠标右键,选择【清除】。

二、数据抽取

(1)字段拆分

1.【转换】-【计算变量】;

2.【函数组】-“字符串”类-【函数和特殊变量】双击"Char.Substr(3)"函数;

3.【数字表达框】-CHAR.SUBSTR(字符串,提取的起始位置,提取的字符个数);

⭐️比如:CHAR.SUBSTR(身份证号,7,4)

4.【目标变量】变量名称“年份”;

5.【确定】。

(2)随机抽样:简单随机抽样、分层抽样、系统抽样等

简单随机抽样

1.【数据】-【选择个案】-【随机个案样本】;

2.【选择个案:随机样本】:基于近似的百分比或精确的个案数来随机抽取样本;

3.确定后,在数据最后一列新增了一个"filter_$"变量。0表示记录未被选中抽取,1表示记录被选中抽取,同时对没有选中抽取的记录的行号使用斜线"/"进行标记,在不关闭SPSS的情况下,后续的其他数据操作都仅对选中抽取的记录进行分析。

三、数据合并

(1)字段合并

1.【转换】-【计算变量】;

2.【函数组】-“字符串”类-【函数和特殊变量】双击"Concat"函数;

3.【数字表达框】-⭐️CONCAT(年份,"-",月份,"-",日);

4.【目标变量】变量名称“出生日期”,【类型与标签】-"字符串",宽度:"10"

5.【确定】;

6.【变量视图】-"出生日期"变量数据类型更改为日期型-"yyyy/mm/dd"日期格式。

(2)记录合并

1.【数据】-【添加个案】

四、数据分组

(1)可视分箱

等距:

1.【转换】-【可视分箱】;

2.“年龄”移至【要分箱的变量】;

3.【分箱化变量】-“年龄段”-单击【生成分割点】-...-单击【生成标签】-【确定】;

不等距:

1.【转换】-【可视分箱】;

2.【网格】中直接填入自定义的分割点,单击【生成分割点】。

(2)重新编码

1.【转换】-【重新编码为不同变量】-...

相关文章

  • SPSS-数据处理

    一、数据清洗 【数据】-【标识重复个案】(主个案指示符(0代表重复个案,1代表唯一或基本主个案)) 1.所有变量-...

  • SPSS-时间序列

    1、数据--定义日期 2、分析--预测--创建模型,【条件】根据索引列是否有日期特征选择季节性或者非季节性 3、将...

  • SPSS-回归分析

    R方一般要在0.6以上为好.至少也在0.4以上. 系数估计量的sig值小于0.05才说明该变量对因变量有显著的影响

  • SPSS-回归分析

    题目要求 p181 8.2题 过程 (1) Y= 4.72+0.602X1+2.083X2其中b1代表X1每变化一...

  • SPSS-频数统计

    题目要求 解决方法 选择Analyze - Descriptive Statistics - Frequenci...

  • SPSS-聚类分析

    根据聚类对象的不同可分为以下两种: 样本聚类,又称Q型聚类 变量聚类,又称R型聚类 SPSS的Classify子菜...

  • SPSS-相关分析

    题目要求 p142 7.4题 步骤 第(1)问 根据输出结果,lifeexpf与lifeexpm间的Pearson...

  • js实现数组对象去重并统计重复个数

    数据处理前 数据处理后

  • SPSS-方差分析

    题目要求 p241 10.6题 解决方法 1) 由输出可得,F=119.798,sig=0.000<0.05,拒绝...

  • 大数据学习导图

    数据获取 数据获取与查看 数据处理 数据处理I:缺失值填补 数据处理II:数据转换 数据处理III:无量纲化 特征...

网友评论

      本文标题:SPSS-数据处理

      本文链接:https://www.haomeiwen.com/subject/qcuxhktx.html