美文网首页
scikit-learn的用法(一)རྗེས་ནས་བོད་ཡི

scikit-learn的用法(一)རྗེས་ནས་བོད་ཡི

作者: 至尊宝_40d4 | 来源:发表于2017-09-30 10:00 被阅读0次

本文主要使用scikit-learn中的KNN算法进行Iris数据集的分类。Iris也称鸢尾花卉数据集,是一类多重变量分析的数据集。通过花萼长度,花萼宽度,花瓣长度,花瓣宽度4个属性预测鸢尾花卉属于(Setosa,Versicolour,Virginica)三个种类中的哪一类。


Demo


import numpy as np

from sklearn import datasets

from sklearn.cross_validation import train_test_split

from sklearn.neighbors import KNeighborsClassifier

# 加载iris数据集

iris = datasets.load_iris()

# 读取特征

iris_X = iris.data

# 读取分类标签

iris_y = iris.target

# 将数据分为训练、测试两部分

X_train, X_test, y_train, y_test = train_test_split(iris_X, iris_y, test_size = 0.2)

# 定义分类器

knn = KNeighborsClassifier()

# 进行分类

knn.fit(X_train, y_train)

# 计算预测值

y_predict = knn.predict(X_test)

# 计算准确率, 由于每次数据集划分不同, 可能不一样

print np.sum(np.fabs(y_predict - y_test)) / float(len(y_test))


结果

0.0666666666667


作者:SnailTyan

链接:http://www.jianshu.com/p/5b02bdc2794a

來源:简书

著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

相关文章

网友评论

      本文标题:scikit-learn的用法(一)རྗེས་ནས་བོད་ཡི

      本文链接:https://www.haomeiwen.com/subject/tglgextx.html