美文网首页
python 爬虫

python 爬虫

作者: 98Future | 来源:发表于2019-08-19 16:46 被阅读0次

    Beautiful Soup

    如果包含Chinese characters, apply decode() method.

    Urllib vs Request

    下载图片:

    An unordered list starts with the <ul> tag. 

    值得注意的1. 我没有用lxml,而是html5lib

    2.  img['src'] 这个似乎是一个html component

    爬百度百科:

    但是爬的速度特别慢,因为它是先download下来html文件再寻找东西。

    相关文章

      网友评论

          本文标题:python 爬虫

          本文链接:https://www.haomeiwen.com/subject/gphdoxtx.html