美文网首页
python爬虫几个步骤

python爬虫几个步骤

作者: saman0 | 来源:发表于2018-09-07 14:32 被阅读20次

一 url管理器(管理没解析的url和解析过的url,主要防止循环解析)

二 url下载器(下载网页上的内容,并将内容以字符串的方式给解析器)

三 url解析器 (解析字符串的内容,将url以解析过和没解析传给管理器,没解析继续循环上一步操作)

四 结果显示

以上四个步骤只是简单的爬虫。如果涉及到登录验证码这些,还要正则表达式django这些等等。

相关文章

网友评论

      本文标题:python爬虫几个步骤

      本文链接:https://www.haomeiwen.com/subject/oodcgftx.html