美文网首页
如何转化哑变量

如何转化哑变量

作者: 这是沸羊羊的干爹 | 来源:发表于2018-08-13 14:13 被阅读0次

Python分析建模,日常问题整理(四)


确认过时间,离发工资还有四周。
2018.08.13~2018.08.19


  1. numpy的argmax、arange方法对哑变量的转化
a = numpy.array([[1, 5, 5, 2],
              [9, 6, 2, 8],
              [3, 7, 9, 1]])
numpy.argmax(a, axis=0) # 输出每个向量最大值索引
numpy.argmax(a, axis=1) # 输出最大值索引
numpy.equal(result_max, test_max) #一一对应的元素,如果相等返回true,不相等返回false

numpy的方法真的很好用,运算十分快,虽然pd也可以写方法进去,但是就是不如numpy快。

tem  =  (numpy.arange(3) == np.array([[2],[1],[0],[3]])).astype(int) 

将数值变量转化为哑变量,分类为numpy.arange(2) ,即[0,1]
如果数据为0,则返回true,如果数据为1,返回false。
np.astype(int) 能将所有的true转化为1,所有的False转化为0
这样就可以将数据转化为0,1哑变量了。

np.argmax(tem,axis = 1)

将哑变量转化为数值。

type(df.ix[:,1:2]) 或者type(df.iloc[:,1:2])的数据类型是dataframe
type(df['b']) 的数据类型是Series
df.ix[:,1:2].values 的数据形式是多个数组[[2],[4],[1]]
df['b'].values 的数据形式是一个数组[2,4,1]
将dataframe的某列转化为哑变量
如果一共有三个类,那么只需转化为两列哑变量,如果n各类,只需转化为n-1列哑变量。

#  方法一:
(np.arange(2)==pd.DataFrame([0,1,1,0,1]).values).astype(int)
#  方法二:
from keras.utils.np_utils import to_categorical
to_categorical(pd.DataFrame([0,1,1,0,1]).values, num_classes = 2)

相关文章

  • 如何转化哑变量

    Python分析建模,日常问题整理(四) 确认过时间,离发工资还有四周。2018.08.13~2018.08.19...

  • 算法笔记(17)数据表达及Python代码实现

    本节讲述数据表达方法:(1)使用哑变量转化类型特征(2)对数据进行装箱处理 使用哑变量转化类型特征 哑变量:用来把...

  • 机器学习之特征工程

    一、哑变量 关于哑变量,这篇博文写的很好,相关概念可以参阅:《机器学习总结之——Dummy Coding(哑变量)...

  • 哑变量

    在SPSS logistic回归X为多分类产量时,或者在R中用回归(lm)做方差分析时,系统会设置哑变量,哑变量的...

  • 哑变量编码-python

    一、Dummy Variable定义 虚拟变量又称虚设变量、名义变量或哑变量,引入哑变量可使线形回归模型变得更复杂...

  • 回归拟合(三)——哑变量在预测篮球赛得分中的简单应用

    理解哑变量( dummy variable ) 哑变量只有0或者1两个取值 哑变量就像是一个开关 比如有一个函数:...

  • 哑变量/虚拟变量

    什么是虚拟变量(哑变量)? 虚拟变量又称哑变量,是人为设定的用于将分类变量引入回归模型中的方法。 为什么要使用虚拟...

  • 分类变量生成哑变量

    Python分析建模,日常问题整理(五) 2018.08.20~2018.08.26 修改字典keys名称将AA改...

  • 回归分析中的哑变量和虚拟变量

    虚拟变量(dummy variable)也叫哑变量,翻译不同而已。因为dummy的含义有假的、虚拟的、哑的等各种含...

  • 9.pandas 变量定义

    模拟数据 定义新字段 随机重排 哑变量

网友评论

      本文标题:如何转化哑变量

      本文链接:https://www.haomeiwen.com/subject/zauybftx.html