美文网首页
python爬虫几个步骤

python爬虫几个步骤

作者: saman0 | 来源:发表于2018-09-07 14:32 被阅读20次

    一 url管理器(管理没解析的url和解析过的url,主要防止循环解析)

    二 url下载器(下载网页上的内容,并将内容以字符串的方式给解析器)

    三 url解析器 (解析字符串的内容,将url以解析过和没解析传给管理器,没解析继续循环上一步操作)

    四 结果显示

    以上四个步骤只是简单的爬虫。如果涉及到登录验证码这些,还要正则表达式django这些等等。

    相关文章

      网友评论

          本文标题:python爬虫几个步骤

          本文链接:https://www.haomeiwen.com/subject/oodcgftx.html