1、Sklearn流程图:
https://scikit-learn.org/stable/tutorial/machine_learning_map/index.html
当我们面临机器学习问题时,可根据下图来选择相应的方法。
image.png
2、 通用学习模式
import numpy as np
from sklearn import datasets
from sklearn.cross_validation import train_test_split
from sklearn.neighbors import KNeighborsClassifier
#读入数据集
iris = datasets.load_iris()
iris_X = iris.data
iris_y = iris.target
print(iris_X[:2,:])
print(iris_y)
image.png
#将数据集进行分类--》训练集和测试集
X_train,X_test,y_train,y_test = train_test_split(iris_X,iris_y,test_size=0.3)
#print(y_train)
image.png
#定义使用的模型,拟合训练集,进行预测
knn = KNeighborsClassifier()
knn.fit(X_train,y_train)
print(knn.predict(X_test))
print(y_test)
image.png
1、引入相关数据集、导入相关的模块等
2、读入数据,定义特征变量X,目标值y
3、将数据集分成训练集和测试集train_test_split(数据1,数据2,测试比例)
4、定义要使用的模型
5、拟合训练集
6、预测数据
7、对比测试集
网友评论