美文网首页
数据处理如何做?请收好这份实用指南

数据处理如何做?请收好这份实用指南

作者: spssau | 来源:发表于2021-04-06 17:45 被阅读0次

总会有小伙伴问起“数据是都收集好了,可是应该怎么处理呢?”

“对数据中的重复值、异常值有什么好的处理方法?”

“我的问卷里既有多选题、填空题,也有量表数据。这些题目都应该怎么处理数据,怎么分析?”

不用慌!关于数据处理的各种疑问都可以在这篇文章里找到答案。


01 数据处理思路

数据格式

首先,正确的数据格式是让我们可以开始处理和分析数据的第一步。不论是什么类型的数据均需要按照数据分析的规范格式进行整理。

 

常见的数据格式通常就是一行代表一个样本,如果有100个样本即为100行;一列代表一个属性。

除此之外,针对不同的分析方法,所需的数据格式也有所不同,这里就不再展开说明。

多份问卷如何放在一起分析?


当有多份数据想要一起进行分析,比如给两个班级做了同一份考题,2个班的测试结果分别记录在不同的表格里,如果想要进行比较分析,那么就需要将数据合并整理在一个EXCEL工作表里面。

解决方法:数据合并有两种合并方式,第一种是按行叠加;第二种是按列叠加。

  • 按行叠加

如果有两份数据‘按行叠加’,此时需要‘新增加列’,用于标识到底是哪一份数据。

比如,分别对两组研究对象进行相同的测试,然后想使用t检验对比两次结果的差异。

“按行叠加”通常在做‘方差分析’、‘t检验’或‘交叉卡方分析’时会使用到。

  • 按列叠加

如果有两份数据‘按列叠加’,也就是直接将两份数据的列数合并。此时,需要注意一定要有个唯一标识的号码,比如姓名、编号、身份证号等。


数据标签、数据编码和生成变量

在整理好数据后,即可上传数据。接下来就可以对数据进行一些基本处理,包括设置数据标签、调整数据编码和生成变量等。


  • 设置数据标签

数据标签是用来标识数值的具体含义。如上图中,明显不知道1.0、2.0这具体是什么意思。只有设置了标签后,才会展示出选项的具体含义。


  • 数据编码

除了数据标签外,有时候还可能需要进行数据编码处理,比如希望对年龄分成3个组别,分别是20以下,20~30,30以上。此时就需要使用数据编码处理,如下图:

操作路径:[数据处理]—[数据编码]功能

  • 生成变量

很多时候还需要对数据生成变量处理,比如说对体重或身高求对数处理,或者对数据开根号,取绝对值,求和,求平均值处理等,那么可使用SPSSAU生成变量功能。

操作路径:[数据处理]—[生成变量]功能

异常值、缺失值问题

在完成了基本的数据处理后,针对数据中的异常值、缺失值等问题也应及时进行处理。

  • 异常值处理

在分析数据时,如果发现一个值与其他值相差甚远,这类值称为 “异常值”。

比如,正常男性成年人的身高是介于1.5~2米之间,但是如果出现一个数据为1.2米。这种数据在分析之前需要进行处理,如把该值设置为null值。

操作路径:[数据处理]—[异常值]功能

  • 缺失值处理

有时候因填写人疏忽少填了几道题,或者题目设置产生了缺失值,此时需要对缺失值进行处理。

  • 对于某一个问题或题目,如果缺失值不多不影响结果可以不处理

  • 如果某个问题出现较多缺失值,可使用填补功能,代替缺失值

操作路径:[数据处理]—[异常值]功能

  • 无效样本处理

同时一份问卷中,如果填写者填写的都是完全相同的答案,说明该样本没有认真填写,此时可将该样本设置为无效样本。

操作路径:[数据处理]—[无效样本]功能

完成以上的数据处理工作,基本上就可以开始分析了。如果在分析的过程中,又发现什么其他问题,可以随时使用[数据处理]模块的处理功能进行调整。


02 量表题处理

针对量表题数据的处理,还有以下几个常见问题:

 


反向题如何处理?

在量表题设计时,有时会插入一些反向题,针对这些反向设计的题目,需要先进行反向编码处理才可以分析。

如五级量表,则可编码处理为:1->5,2->4,3->3,4->2,5->1。

操作路径:[数据处理]—[数据编码]功能


不同尺度的量表数据如何统一?

一般情况下不同尺度的量表,不需要特别处理。比如设计了四个维度的量表,而各维度使用的量表尺度不一致其实也不受影响,如做信度效度按每个维度分别进行分析即可。

如果涉及数值上的比较,像是对同一组对象前后两年进行测量,去年使用了1-5分的量表,而今年改用1-7分量表收集数据。想要比较两年数据的结果,这直接比较数值显然不太对,此时可以考虑对数据做区间化处理,把1-5分数据转换成1-7分。

操作步骤:选择[生成变量]—[区间化],将区间最小值设置1,区间最大值设为7,点击[确认处理],即可将所有数据转化成1-7分。


03 非量表题处理

非量表题有很多种,针对每种类型的题目所需的数据格式、数据处理方式也不太一样。之前SPSSAU已推送过详细的文字教程,这里就不再展开说明,大家可以点击下方链接,查看视频教程及往期文章。

①  多选题

②  排序题

③  非规则化数据如何整理?

以上就是本次分享的内容啦。如果你还有什么数据处理上的疑难问题没有解决,可以在评论区告诉我们。

相关文章

  • 数据处理如何做?请收好这份实用指南

    总会有小伙伴问起“数据是都收集好了,可是应该怎么处理呢?” “对数据中的重复值、异常值有什么好的处理方法?” “我...

  • 2022-08-31

    新教师如何上好开学第一课?这份实用指南请收好 | 关注 人民教育 2022-08-28 12:16 发表于北京 九...

  • 想了解维生素?这份实用指南请收好!

    给您家人更天然更好的营养食品。 声明:本文所有图文来源网络,如有侵权后台联系删除。 维生素(Vitamin)是维持...

  • 胃,你还好吗?

    这份养胃指南,请收好! 我们知道,脾胃是后天之本,气血生化之源。人体所需营养,100%均来自肠胃。如何保养肠胃呢,...

  • 疫情期间上班后的自我防护!

    疫情仍在持续 返程上班如何保护好自己? 这份"防护指南"请收好! 滴,您的体温是36.3 注意:疫情期间,出入办公...

  • 玩手机,睡懒觉,不爱学习,暑假怎么办?

    暑假家长如何教孩子做家务?请收好这份指南! · 漫漫长假,在没有出游的日子里,孩子都在家中做些什么呢? · 写作业...

  • 挑战90天赚到100万,收好这份年轻人的生存指南(下)

    请结合 降薪、裁员都没他惨,他却用90天赚到100万(上) 挑战90天赚到100万,收好这份年轻人的生存指南(中)...

  • 想“白嫖”?不存在的……

    珍爱生命,拒绝“白嫖”。这份防“白嫖”指南请收好…… 话说自从互联网公司该不该996被搬到台面上讨论,哎呀老铁!扎...

  • 这里有份上班防控指南,请收好!

    全国新增确诊2590人,疫情持续,不管你是正在上班还是即将上班,这份上班防控指南,请收好。 1、轻易别开会 有人会...

  • 笔笔通

    1. 笔试题 信心满满的去面算法工程师,竟然凉了. 腾讯/京东/网易校招笔试刷人超70%!这份笔试自救指南请收好 ...

网友评论

      本文标题:数据处理如何做?请收好这份实用指南

      本文链接:https://www.haomeiwen.com/subject/kucekltx.html