Sklearn learning_curve

作者: Dorts | 来源:发表于2017-05-12 14:49 被阅读593次

http://scikit-learn.org/stable/modules/generated/sklearn.model_selection.learning_curve.html

说明

Determines cross-validated training and test scores for different training set sizes.
作用是针对不同大小的训练集，通过绘制“交叉验证”的score曲线来明确使用的训练数据是过量还是不足。

特别注意

sklearn.model_selection.
learning_curve (estimator, X, y, groups=None, train_sizes=array([ 0.1, 0.33, 0.55, 0.78, 1. ]), cv=None, scoring=None, exploit_incremental_learning=False, n_jobs=1, pre_dispatch='all', verbose=0)

注意参数中的 train_sizes，用来指定训练集占交叉验证cv训练集中的百分比，也就是说，它是训练集中（这个是产生的交叉验证集合中的）的训练集（用于实际训练的）。因此该函数必须配合cross_validation()包使用。

疑问

Q: scoring参数默认是？
A: 可能自动默认为accuracy
Q: 左图和右图红色线的幅度为什么差异这么大？NB的红线幅度大，而SVM红线很平稳说明了什么？

A:差异大的原因个人理解为：和模型自身特点有关。NB受训练集大小影响很大，因此红线变化幅度大，而SVM针对训练集大小这个因素，比较鲁棒，因此变化幅度小。

网友评论

本文标题：Sklearn learning_curve

本文链接：https://www.haomeiwen.com/subject/dnwztxtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

Sklearn learning_curve

说明

特别注意

疑问

相关文章

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读