你有没有想过,当你不知道怎么去爬一个网页的时候,并非是不懂 Python 语法,而是因为不了解网页是怎么构成的、网络协议是怎样的。
所以,我们以一个与众不同的全新视角看待爬虫,先去了解网页是怎么构成的,先去自己动手写一个网页,然后再学怎么写爬虫。

网页由这三部分构成,就像是一个房子,html 相当于是房子的主要格局,决定了应该有哪些元素,大致放在哪里;css 相当于是房子的装修,决定了你看到的网页外观;而 JavaScript 就像是遥控器,控制了一些关键的逻辑。

这些主要的网页标签,是我们爬取网页时需要重点关注的。在视频里面会有每个标签相应的配图,这里就不一个个粘出来了。
这节课我们来写出这样一个网页。

什么,觉得复杂?那我们再看看这个网页透视图。一个网页分成了 header 头部、content 内容,还有 footer 页尾。这样就清晰多了吧?

详细的编程部分的讲解,文字实在说不清楚了,到我们的课程视频里面看吧~
1、如何认识网页的构成【Python零基础爬虫实战】
上面的内容来自网易云课堂畅销课程 Python实战课程:四周实现爬虫系统

加入课程后,可以看到完整四周课程,获赠零基础预习教程魔力手册,并得到班级老师的辅导与答疑。
欢迎加入预备班 QQ 群和大家讨论 Python 课程问题,参加每周的老学员分享,QQ 群号是:454652648,加群回复:实战计划

网友评论