由于大概率不想跨行以及走回头路,老老实实开始研究码农的技术。开始固本培元,补充一下机器学习的基础知识。
主要知识点:
- 理解归一化原因
- 归一化的方式需要考虑的原始分布可能的属性
- 类别型特征可以使用二进制编码达到比one hot节约空间的目的
遗留问题:
- 其他编码方式可以学习一下
- 高维组合特征中矩阵分解的思想还不理解
- 决策树是如何直接处理字符串
由于大概率不想跨行以及走回头路,老老实实开始研究码农的技术。开始固本培元,补充一下机器学习的基础知识。
本文标题:DAY4 特征工程(上)
本文链接:https://www.haomeiwen.com/subject/xaukghtx.html
网友评论