哑变量/虚拟变量

作者: spssau | 来源:发表于2019-07-17 10:29 被阅读4次

什么是虚拟变量(哑变量)?

虚拟变量又称哑变量,是人为设定的用于将分类变量引入回归模型中的方法。

为什么要使用虚拟变量

在回归分析中,自变量X既可以是定量数据也可以定类数据。回归分析计算时是将所有自变量X视为数字,但当数据为定类数据时,此时数字代表类别,数字大小本身没有比较意义。因此,这类数据在做回归分析时,需要设置成哑变量才能纳入回归分析正确分析数据。

哪些分析方法会使用到虚拟变量

通常情况下,回归分析,逐步回归,分层回归,Logistic回归,PLS回归等这类影响关系研究的方法时,才可能涉及到虚拟变量设置。其它分析方法并不会涉及。

如何使用虚拟变量

用一个例子说明:研究性别和工龄对基本工资的影响情况。

工龄是定量数据;性别为二分类数据,因而分析时性别不能直接放入回归模型,正确做法是将变量转化成取值为1和0的哑变量。

性别分为两类,因而需要设置2个虚拟变量(2列),分别表示男性和女性两个类别。

如果是男性,‘性别_男’虚拟变量取值为1,‘性别_女’虚拟变量取值为0。如果是女性则相反。

当变量分类超过两类时,也是类似的处理方式,在回归分析前将下面的“专业”类别转化为虚拟变量,结果如下图所示:

理科类取值=1代表专业为理科,0代表非理科

文科类取值=1代表专业为文科,0代表非文科

工科类取值=1代表专业为工科,0代表非工科

SPSSAU可直接一步生成虚拟变量,具体操作如下:

分析时,要注意少放入一个虚拟变量。如果分为两类就放入一个虚拟变量,三类就放入两个,以此类推。

原因在于虚拟变量包括数字0和1;0是对比参考项。如果2个类别都放入了,就没有参考类别了。

如何解释分析结果

线性回归分析结果

由上表可知,回归模型通过F检验,性别_男一项P<0.01,说明性别对基础工资确实存在显著的影响关系。

模型公式为:月基本工资=2403.834 + 42.659*工龄 + 1377.873*性别_男

当“性别_男”取值为1表示男性的月工资回归方程,0表示女性的月工资回归方程。回归系数值为1377.873,因此说明相同工龄下,男性的月基本工资比女性多1377.88元。

相反,放入的分析项若为性别_女,回归系数值应为-1377.873,代表同工龄的条件下,女性的月基本工资比男性少1377.88元

其他说明

(1)将虚拟变量放入回归中,一定要少放一个虚拟变量,否则系统会提示存在多重共线性问题

(2)SPSSAU会默认生成标题,设置完成后可进行‘标题修改’。

登录SPSSAU官网体验在线数据分析​​​​

相关文章

  • 哑变量/虚拟变量

    什么是虚拟变量(哑变量)? 虚拟变量又称哑变量,是人为设定的用于将分类变量引入回归模型中的方法。 为什么要使用虚拟...

  • 哑变量编码-python

    一、Dummy Variable定义 虚拟变量又称虚设变量、名义变量或哑变量,引入哑变量可使线形回归模型变得更复杂...

  • 数据分析中的哑变量问题,该怎么处理?

    什么是虚拟变量? 虚拟变量又称哑变量,是人为设定的用于将分类变量引入模型中的方法。 为什么要使用虚拟变量 在回归分...

  • 回归分析中的哑变量和虚拟变量

    虚拟变量(dummy variable)也叫哑变量,翻译不同而已。因为dummy的含义有假的、虚拟的、哑的等各种含...

  • Python学习笔记-3群18组-杜杜狼-2017.7.24

    Lesson 26 虚拟变量 虚拟变量又叫哑变量和离散特征编码,用来表示分类变量,非数量因素可能产生的影响 离散特...

  • 虚拟变量

    虚拟变量 ( Dummy Variables) 又称虚设变量、名义变量或哑变量,用以反映质的属性的一个人工变量,是...

  • 一个疑惑:解释变量中类别变量的处理

    我们知道,当分类自变量的类别大于两个的时候,需要建立一组虚拟变量(哑变量)来代表变量的归属性质。一般虚拟变量的数目...

  • 2019-10-30

    Day3 多元线性回归 day3同学的笔记 导入库 读数据 拆因果 数字化 躲避虚拟变量陷阱虚拟变量(哑变量) ...

  • 机器学习之特征工程

    一、哑变量 关于哑变量,这篇博文写的很好,相关概念可以参阅:《机器学习总结之——Dummy Coding(哑变量)...

  • 哑变量

    在SPSS logistic回归X为多分类产量时,或者在R中用回归(lm)做方差分析时,系统会设置哑变量,哑变量的...

网友评论

    本文标题:哑变量/虚拟变量

    本文链接:https://www.haomeiwen.com/subject/nvnflctx.html