python 机器学习 预测分析核心算法
特征提取和特征工程
确定哪些特征可用于预测也需要尝试。这个过程就是特征提取和特征工程。
特征提取就是把一个自由形式的各种数据(如一个文档中的字词、一个网页中的字词)转换成行、列形式的数字的过程。
特征工程就是对特征进行整理组合,以达到更富有信息量的过程。
建立一个证券交易系统包括特征提取和特征工程。
特征提取将决定哪些特征可以用来预测价格。
证券的价格有一系列的工程化特征:MACD RSI
选好一系列合理的特征后,需要训练一个预测模型,评价它的性能,然后决定是否部署此模型。
调整采用的特征,尝试所有的组合。
(数据准备和特征工程估计会占开发一个机器学习模型80%-90%的时间)
网友评论