机器学习首先需要做好数据处理。
1.数据收集
2.重点特征的确认
3.数据规范化:
分类特征不要使用位操作来表现一个种类;最好一个分类一个数据
缺失的数据,可新定义一个新类、可根据附近数据来设置新指、可用整体数据的平均值、中位值等代替。
要注意从原有特征中细化新的有用的特征
要将数据规划到合适区间(如-1到1,0到1等)
4.通过数据可视化来缺点特征是否有意义
分类型数据可用马赛克图或盒图
数值数据可用密度图或散点图
机器学习首先需要做好数据处理。
1.数据收集
2.重点特征的确认
3.数据规范化:
分类特征不要使用位操作来表现一个种类;最好一个分类一个数据
缺失的数据,可新定义一个新类、可根据附近数据来设置新指、可用整体数据的平均值、中位值等代替。
要注意从原有特征中细化新的有用的特征
要将数据规划到合适区间(如-1到1,0到1等)
4.通过数据可视化来缺点特征是否有意义
分类型数据可用马赛克图或盒图
数值数据可用密度图或散点图
本文标题:实用机器学习---笔记(数据处理)
本文链接:https://www.haomeiwen.com/subject/esawnxtx.html
网友评论