机器学习要从原始的数据集中取出抽象的数据特征,模型的应用效果与数据特征密切相关。一半进行特征分析的时候,会从特征的粒度,层次,表示等方面进行
(1)特征的粒度
针对特征在原始数据中的大小价值。怎么理解呢,比如一幅清明上河图,如果用像素来表示特征其实毫无意义。特征选取的最小粒度应该是一个人或者局部代表性的特征
(2)特征的层次
针对机器学习中的具体形态。怎么理解呢就是抓住重点,比如识别一只猫咪,应该识别出它最重要的特征。对特征进行层次化的表达,可深度表现数据特征
(3)数据的表示
指的是学习到特征的表现方式
网友评论