美文网首页
《零基础上手Python爬虫系列》 - 13 实战:原生爬虫

《零基础上手Python爬虫系列》 - 13 实战:原生爬虫

作者: 聂云⻜ | 来源:发表于2020-02-18 16:48 被阅读0次

    本篇目前为视频学习的笔记备注,待更新,本周内会整理完毕

    分析抓取目的确定抓取页面

    分析每一类主播的排行

    抓取观看人数


    整理爬虫常规思路

    原理都是从html中提取有用的信息

    断点调试

    找最近的可以唯一标识的作为正则的定界符


    HTML结构分析基本原则二条

    选择可闭合的标签

    行数10 - 20行之间,尽量不要超过30行


    快速提炼内容

    相关文章

      网友评论

          本文标题:《零基础上手Python爬虫系列》 - 13 实战:原生爬虫

          本文链接:https://www.haomeiwen.com/subject/gfagfhtx.html