数据预处理
- NumPy:科学计算基础库。提供高效的 N 维数组和向量运算。
- SciPy:科学计算库。它依赖于 NumPy,提供高效的数值计算,以及用于函数最优化、数值积分等任务的模块。
- pandas:数据结构和数据分析库。包含高级数据结构和类 SQL 语句,让数据处理变得快速、简单。
数据可视化
- Matplotlib:数据可视化库。它提供大量专业数据图形制作工具。
标准模型库
- scikit-lean:标准机器学习库。它主要用于分类、回归和聚合等,依赖于 NumPy,SciPy,Matplotlib。
- Statsmodels:标准统计模型库。它主要用于假设检验和参数置信区间分析。
- Spak ML:分布式机器学习算法库。它可在分布式集群,如 Hadoop,对大量数据建模。
- TensorFlow/MXNet/PyTorch:深度学习算法库。
网友评论