想将自己所学的东西整理出来有一段时间了,但由于自身的原因,今天才着手开始,那就从最近学的Python入手吧,讲述一个发生在词云上的海龟和爬虫的故事。
一、项目思路大纲

二、项目实现操作
1.爬虫部分
(1)网络爬虫,爬取HTML页面

(2)对爬取的内容进行解析和处理

(3)对上述函数的调用

(4)最终获取的数据

2.海龟部分
(1)turtle库绘制图片代码



(2)turtle库绘制的图片

3.将处理后的内容(CSV格式的文件)绘制成图云来展示
(1)将获取的CSV格式数据文件绘制成图云的代码

(2)以图云展示的结果图

三、小结
本次主要实现了爬取某个网页的内容,然后对爬取得内容进行解析和处理,将获取的数据以CSV文件的格式存储,最后将数据以图云的形式绘制在turtle库画的图上。
网友评论