1. 前言
特征 = 数据中抽取出来对结果预测有用的信息
2. 数据与特征处理
2.1 数据采集

2.2 数据格式化

2.3 数据清洗

2.4 数据清洗实例

2.5 数据采样

2.6 正负样本不均衡

2.7 特征处理

2.7.1 数值型




2.7.2 类别型

one-hot 解决了均等性



bucket代表不同的主题

性别和爱好的交叉关系
2.7.3 时间型



2.7.4 文本型


n-gram 把几个词组合在一起

word2vec
2.7.5 统计特征



2.7.6 组合特征


3.特征的处理
3.1 特征的选择

3.2 特征选择的方式






3.模型选择

网友评论