在分析一个数据集合时,有三个需要解决的任务:
- 按照一个或一些选出的模型对数据进行拟合;
- 从一些已经拟合的类型中选取最合适的模型;
- 根据收集的数据做出预测。
7.6.1 模型拟合
基于前面章节介绍的Sklearn库提供的各种模型,对预处理后的数据集进行拟合,其主要用到各种模型类的fit方法。示例代码如下:
1. 有监督学习
线性回归,示例代码:
lr.fit(X, y)
支持向量机,示例代码:
svc.fit(X_train, y_train)
K邻近,示例代码:
```python
knn.fit(X_train, y_train)
2. 无监督学习
主成分分析PCA,示例代码:
pca_model = pca.fit_transform(X_train)
聚类分析(K-means),示例代码:
k_means.fit(X_train)
7.6.2 模型预测
sklearn库对各种模型类提供了predict方法,基于以上模拟后的模型对测试集数据进行预测,示例代码:
1. 有监督预测
y_pred = lr.predict(X_test) # 线性回归
y_pred = svc.predict(np.random.random((2,5))) # 支持向量机
y_pred = knn.predict_proba(X_test) # k近邻
2. 无监督预测
y_pred = k_means.predict(X_test) # 聚类分析
网友评论