参考: related projects
互操作性和框架增强
这些工具适应了 scikit 的需要, 可以与其他技术一起使用, 或者增强了 scikit 学习的评估功能。
数据格式
sklearn_pandas 通过专用的变换桥接了 scikit-learn pipelines 和 pandas 数据框.
Auto-ML
- auto_ml 自动化机器学习的生产和分析, 建立在 scikit 学习和相关项目。用所有标准的机器学习步骤训练 pipeline。优化了预测速度和易于转移到生产环境。
- auto-sklearn 一种自动化的机器学习工具包和一个 scikit 学习估计器的顺便替换者
- TPOT一种自动化的机器学习工具包, 它优化了一系列 scikit 学习的 operators 来设计机器学习 pipeline, 包括数据和特征预处理器以及估计器。作为 scikit 学习估计器的一个替代项。
实验框架
- REP 以一致、可重复的方式进行数据驱动研究的环境
- ML Frontend 通过基于 web和编程的接口提供数据集管理和 SVM 拟合/预测。
- Scikit-Learn Laboratory 一个包装围绕 scikit-learn 的命令行, 使其易于运行 multiple learners 和 large feature sets 的机器学习实验.
- Xcessiv 是一个类似笔记本 (notebook-like) 的应用程序, 用于快速、可伸缩、自动 hyperparameter 调整和堆叠 ensembling。提供了一个跟踪 model-hyperparameter 组合的框架。
模型检验与可视化
- eli5 用于调试/检查机器学习模型并解释其预测的库。
- mlxtend 包括模型可视化实用程序。
- scikit-plot 可视化库, 用于在数据分析和机器学习中快速、容易地生成常用图。
- yellowbrick 一套自定义 matplotlib 可视, 用于 scikit 学习估计, 以支持可视化特征分析、模型选择、评估和诊断。
网友评论