美文网首页
怎么one-hot/dummy编码?

怎么one-hot/dummy编码?

作者: 小幸运Q | 来源:发表于2020-06-29 13:14 被阅读0次

import pandas as pd  
df = pd.DataFrame([  
            ['green', 'M', 10.1, 'class1'],   
            ['red', 'L', 13.5, 'class2'],   
            ['blue', 'XL', 15.3, 'class1']])  
  
df.columns = ['color', 'size', 'prize', 'class label']

>>> print(df)
   color size  prize class label
0  green    M   10.1      class1
1    red    L   13.5      class2
2   blue   XL   15.3      class1

size_mapping = {  
           'XL': 3,  
           'L': 2,  
           'M': 1}  
df['size'] = df['size'].map(size_mapping)  
  
class_mapping = {label:idx for idx,label in enumerate(set(df['class label']))}  
df['class label'] = df['class label'].map(class_mapping)  

>>> print(df)
   color  size  prize  class label
0  green     1   10.1            1
1    red     2   13.5            0
2   blue     3   15.3            1

其实可以通过get_dummies生成同样的结果:

>>> pd.get_dummies(df)
   size  prize  class label  color_blue  color_green  color_red
0     1   10.1            1           0            1          0
1     2   13.5            0           0            0          1
2     3   15.3            1           1            0          0

dummy会用全零代表一类,onehot不会

相关文章

  • 怎么one-hot/dummy编码?

    其实可以通过get_dummies生成同样的结果: dummy会用全零代表一类,onehot不会

  • one-hot encoding 与dummy encoding

    One-Hot编码和哑变量应该怎么用 考虑一个具有三个类别的离散型特征,采用One-Hot 编码后: 其中 因此有...

  • One-hot与Word2Vec

    one-hot是文本向量化最常用的方法之一。 1.1 one-hot编码 什么是one-hot编码?one-hot...

  • One-Hot编码

    对离散型特征进行one-hot编码是为了让距离的计算显得更加合理。 离散特征进行one-hot编码后,编码后的特征...

  • one hot编码

    一、什么是one-hot编码? One-Hot编码,又称为一位有效编码,主要是采用N位状态寄存器来对N个状态进行编...

  • 多类分割One-hot 编码实现方式(转)

    原链接:数据预处理 One-hot 编码的两种实现方式 1. 什么是 One-hot 编码 最直观的理解就是,比如...

  • one-hot encoding

    我是搬运工 One-Hot Encoding One-Hot编码,又称为一位有效编码,主要是采用N位状态寄存器来对...

  • 特征提取之pd.get_dummies()

    跳转链接 pandas提供对one-hot编码的函数是:pd.get_dummies() one-hot的基本思想...

  • one-hot编码

    原文链接:one-hot编码 微信公众号:机器学习养成记 搜索添加微信公众号:chenchenwings 与上一...

  • one-hot编码

    对于一些没有排序关系的分类变量(例如{香蕉,苹果,草莓,西瓜}),很多参考资料说转化成one-hot编码来训练。我...

网友评论

      本文标题:怎么one-hot/dummy编码?

      本文链接:https://www.haomeiwen.com/subject/jwslnctx.html