对于一些没有排序关系的分类变量(例如{香蕉,苹果,草莓,西瓜}),很多参考资料说转化成one-hot编码来训练。我想实验下用one-hot编码还是直接赋值{'香蕉':0,'苹果':1,'草莓':2,'西瓜':3}训练,区别到底有多大。若one-hot编码确实能够提升效果,对于不同的模型,one-hot编码能够提高的效果分别有多少?以上问题是我想研究的。
对于一些没有排序关系的分类变量(例如{香蕉,苹果,草莓,西瓜}),很多参考资料说转化成one-hot编码来训练。我想实验下用one-hot编码还是直接赋值{'香蕉':0,'苹果':1,'草莓':2,'西瓜':3}训练,区别到底有多大。若one-hot编码确实能够提升效果,对于不同的模型,one-hot编码能够提高的效果分别有多少?以上问题是我想研究的。
本文标题:one-hot编码
本文链接:https://www.haomeiwen.com/subject/aocjcqtx.html
网友评论