官方网址:https://scikit-learn.org
基础介绍:https://zhuanlan.zhihu.com/p/67307930
scikit-learn应该如何学习:https://www.zhihu.com/question/295048467/answer/950651660?utm_source=zhihu
机器学习、深度学习、数据分析相关书籍分享:https://zhuanlan.zhihu.com/p/77964006
Scikit-learn简介
Scikit-learn(以前称为scikits.learn,也称为sklearn)是针对Python 编程语言的免费软件机器学习库 [1] 。它具有各种分类,回归和聚类算法,包括支持向量机,随机森林,梯度提升,k均值和DBSCAN,并且旨在与Python数值科学图书馆NumPy和SciPy。
应用层面
Scikit-learn主要是用Python编写的,并且广泛使用numpy进行高性能的线性代数和数组运算。此外,用Cython编写了一些核心算法来提高性能。支持向量机由围绕LIBSVM的Cython包装器实现 ; 逻辑回归和线性支持向量机的相似包装围绕LIBLINEAR。在这种情况下,可能无法使用Python扩展这些方法。
Scikit-learn与许多其他Python库很好地集成在一起,例如matplotlib和plotly用于绘图,numpy用于数组矢量化,pandas数据帧,scipy等。
Scikit-learn 基础
以下目录是Scikit-learn可以实现的基础功能,具体内容可以查看:Scikit-learn应该如何学习:https://www.zhihu.com/question/295048467/answer/950651660?utm_source=zhihu
- 1 Scikit-learn 介绍
- 1.1 分类
- 1.2 回归
- 1.3 聚类
- 1.4 降维
- 1.5 模型选择
- 1.6 预处理
- 2 Scikit-learn 机器学习步骤
- 2.1 导入常用库
- 2.2 加载数据
- 2.3 划分训练集与测试集
- 2.4 数据预处理
2.4.1 标准化
2.4.2 归一化
2.4.3 二值化
2.4.4 编码分类特征
2.4.5 输入缺失值
2.4.6 生成多项式特征 - 2.5 创建模型估计器
2.5.1 监督学习
2.5.2 无监督学习 - 2.6 拟合数据
2.6.1 监督学习
2.6.2 无监督学习 - 2.7 预测
2.7.1 监督学习
2.7.2 无监督学习 - 2.8 评估模型性能
2.8.1 分类指标
2.8.2 回归指标
2.8.3 群集指标
2.8.4 交叉验证 - 2.9 模型调整
2.9.1 网格搜索
2.9.2 随机参数优化
网友评论