美文网首页
数据科学不可绕开的 Python 库

数据科学不可绕开的 Python 库

作者: 水之心 | 来源:发表于2020-12-05 09:59 被阅读0次

    数据预处理

    1. NumPy:科学计算基础库。提供高效的 N 维数组和向量运算。
    2. SciPy:科学计算库。它依赖于 NumPy,提供高效的数值计算,以及用于函数最优化、数值积分等任务的模块。
    3. pandas:数据结构和数据分析库。包含高级数据结构和类 SQL 语句,让数据处理变得快速、简单。

    数据可视化

    1. Matplotlib:数据可视化库。它提供大量专业数据图形制作工具。

    标准模型库

    1. scikit-lean:标准机器学习库。它主要用于分类、回归和聚合等,依赖于 NumPy,SciPy,Matplotlib。
    2. Statsmodels:标准统计模型库。它主要用于假设检验和参数置信区间分析。
    3. Spak ML:分布式机器学习算法库。它可在分布式集群,如 Hadoop,对大量数据建模。
    4. TensorFlow/MXNet/PyTorch:深度学习算法库。

    相关文章

      网友评论

          本文标题:数据科学不可绕开的 Python 库

          本文链接:https://www.haomeiwen.com/subject/eqawwktx.html