为什么要利用Python进行数据分析?
对于数据分析师从业者而言,经常需要从事:数据库操作、报告撰写、数据可视化、数据挖掘的工作。这些工作不写代码也可以操作,利用Excel 进行数据可视化、使用 SPSS等一些亲民类平台工具进行数据挖掘,虽然使用平台工具虽然可造作性强,但是不可避免的会存在重复机械的劳动,从而降低自己的工作效率,但如果你会用Python 编写代码,操作的自由度更高,发展的潜力更大。
怎么利用Python进行数据分析?
在这里推荐这本《利用Python进行数据分析》,该书适合刚刚接触Python的数据分析的小白。将IPython这个交互式Shell作为你的首要开发环境,讲述了从pandas库的数据分析工具开始利用高性能工具等内容。
直接来展示一下:
第1章 准备工作
1.1 本书的内容
1.2 为什么要使用Python进行数据分析
1.3 重要的Python库
1.4 安装和设置
…

第2章 Python语法基础,IPython和Jupyter Notebooks
2.1 Python解释器
2.2 IPython基础
2.3 Python语法基础

第3章 Python的数据结构、函数和文件
3.1 数据结构和序列
3.2 函数
3.3 文件和操作系统
3.4 结论

第4章 NumPy基础:数组和矢量计算
4.1 NumPy的ndarray:一种多维数组对象
4.2 通用函数:快速的元素级数组函数
4.3 利用数组进行数据处理
4.4 用于数组的文件输入输出
…

第5章 pandas入门
5.1 pandas的数据结构介绍
5.2 基本功能
5.3 汇总和计算描述统计
5.4 总结

第6章 数据加载、存储与文件格式
6.1 读写文本格式的数据
6.2 二进制数据格式
6.3 Web APIs交互
6.4 数据库交互
6.5 总结

第7章 数据清洗和准备
7.1 处理缺失数据
7.2 数据转换
7.3 字符串操作
7.4 总结

第8章 数据规整:聚合、合并和重塑
8.1 层次化索引
8.2 合并数据集
8.3 重塑和轴向旋转
8.4 总结

第9章 绘图和可视化
9.1 matplotlib API入门
9.2 使用pandas和seaborn绘图
9.3 其它的Python可视化工具
9.4 总结

第10章 数据聚合与分组运算
10.1 GroupBy机制
10.2 数据聚合
10.3 apply:一般性的“拆分-应用-合并”
10.4 透视表和交叉表
10.5 总结

第11章 时间序列
11.1 日期和时间数据类型及工具
11.2 时间序列基础
11.3 日期的范围、频率以及移动
11.4 时区处理
…

第12章 pandas高级应用
12.1 分类数据
12.2 GroupBy高级应用
12.3 链式编程技术
12.4 总结

第13章 Python建模库介绍
13.1 pandas与模型代码的接口
13.2 用Patsy创建模型描述
13.3 statsmodels介绍
13.4 scikit-learn介绍
13.5 继续学习

第14章 数据分析案例
14.1 来自Bitly的USA.gov数据
14.2 MovieLens 1M数据集
14.3 1880-2010年间全美婴儿姓名
14.4 USDA食品数据库
14.5 2012联邦选举委员会数据库
14.6 总结

篇幅有限,这里就不过展示,有需要这份资料的,可以在评论区留言数据分析,我看到就会回复。
网友评论