美文网首页
第2章 数据抓取

第2章 数据抓取

作者: AmaAnchor | 来源:发表于2019-03-05 11:13 被阅读0次

    第2章 数据抓取

    2.1 beautifulsoup

    常见操作:

    image
    url='http://example.python-scraping.com'
    import requests
    from bs4 import BeautifulSoup
    resp=requests.get(url)
    soup=BeautifulSoup(resp.text,'html.parser')
    soup.html
    

    2.2 re表达式

    2.2.1在使用re模块时,通常对模式字符串添加r防止转义

    image.png

    2.2.3 re的常见功能函数

    image.png

    2.2.3.1 re.search()

    image.png

    re模块的其他方法同理

    re以及bs4的使用

    打个比方:
    有人给你一个地址要你去办事,bs4就是告诉你这个地址在哪个省份,哪个城市,街道等;而re则是更具体的告诉你这个地址所在的小区,楼号,门牌号

    相关文章

      网友评论

          本文标题:第2章 数据抓取

          本文链接:https://www.haomeiwen.com/subject/gpziuqtx.html