想将自己所学的东西整理出来有一段时间了,但由于自身的原因,今天才着手开始,那就从最近学的Python入手吧,讲述一个发生在词云上的海龟和爬虫的故事。
一、项目思路大纲
思路大纲图二、项目实现操作
1.爬虫部分
(1)网络爬虫,爬取HTML页面
爬取网页内容的函数(2)对爬取的内容进行解析和处理
对爬取的内容进行解析和处理的函数(3)对上述函数的调用
函数调用(4)最终获取的数据
获取的数据部分截图2.海龟部分
(1)turtle库绘制图片代码
turtle库画图代码1 turtle库画图代码2 turtle库画图代码3(2)turtle库绘制的图片
turtle库绘制的图片3.将处理后的内容(CSV格式的文件)绘制成图云来展示
(1)将获取的CSV格式数据文件绘制成图云的代码
绘制成图云的代码(2)以图云展示的结果图
图云展示结果三、小结
本次主要实现了爬取某个网页的内容,然后对爬取得内容进行解析和处理,将获取的数据以CSV文件的格式存储,最后将数据以图云的形式绘制在turtle库画的图上。
网友评论