这三天要学习的内容是数据可视化技术,涉及三个章节,数据可视化技术其实是数据挖掘 技术栈里面的一个分支,当然其与 Python 爬虫也能紧密结合起来。
第十五章学习建议
这一章节围绕 matplotlib
与 Pygal
进行学习,两个库都从安装部分开始学习,重点部分依旧是 windows
体系的安装教程。
matplotlib 部分的学习建议
- 简单折线图的绘制,一定要掌握,并且可以对其进行定制;
- 随机漫步数据的生成,掌握
RandomWalk
类; - 使用
Pygal
生成可缩放的矢量图形文件。
本书中的关于这两个模块相关知识点的讲解,难度不大,以普及知识为主,所以学起来比较轻松。
第十六章学习建议
第十六章的标题叫做【下载数据】,但其实讲解的是基于两种文件格式的数据处理,下载数据它说的是从一个地址去下载,并不是爬虫技术。
本部分学习建议
临摹,临摹,照着书上的代码,一行行的敲,记不住没事,实现效果就是学习目的。
第十七章学习建议
这一章节终于学习爬虫相关技术了,不过涉及的内容比较简单,扩展部分,可以参考《Python 爬虫小课》 或者 爬虫 100 例 进行学习。
本部分学习建议
- 学习使用
requests
模块去采集 API 数据,即获取 JSON 格式数据; - 使用
Pygal
实现数据可视化。
数据可视化项目的价值要高于【打飞机】游戏,学习阶段一定要临摹全部代码。
网友评论