数据挖掘的基本任务:
分类与预测、聚类分析、关联规则、时序模式、偏差检测、智能推荐
数据挖掘建模过程:
1)定义挖掘目标
2)数据取样:定义数据挖掘目标之后,从业务系统中抽取出一个与挖掘目标相关的样本数据子集。取样方式:随机抽样,等距抽样(每隔一段距离抽取一个样本),分层抽样,从起始顺序抽样,分类抽样。
3)数据探索:异常值分析、缺失值分析、相关分析和周期分析等。
4)数据预处理:降维、缺失值处理。主要包括:数据筛选、数据变量转换、缺失值处理、坏数据处理、数据标准化、主成分分析、属性选择、数据规约。
5)挖掘建模:选用合适的算法进行建模
6)模型评价
网友评论