书目: Python数据科学手册
计划时间: 一个月

前言
什么是数据科学
数据科学综合了三个领域的能力:
- 统计学家的能力: 能够建立模型和聚合数据;
- 计算机科学家的能力: 能够设计并使用算法对数据进行高效存储、分析和可视化;
- 领域专家的能力: 在细分领域中经过专业训练, 既可以提出正确的问题, 又可以作出专业的解答.
为什么用 Python
Python 之所以能在数据科学领域中广泛应用, 主要是因为它的第三方程序包拥有庞大而活跃的生态系统: Numpy 可以处理同类型数组型数据, Pandas 可以处理多种类型带标签的数据, SciPy 可以解决常见的科学计算问题, Matplotlib 可以绘制可用于印刷的可视化图形, IPython 可以实现交互式编程和快速分享代码, Scikit-Learn 可以进行机器学习.
网友评论