美文网首页
Python爬虫正则表达式匹配网页元素

Python爬虫正则表达式匹配网页元素

作者: 西凉0 | 来源:发表于2017-10-26 12:06 被阅读42次

    要匹配网页中  li bookrecno="123456789"  的这串数字,用这个试了就是不行:

    gzlib_bookrecnos = re.findall(r'li bookrecno="(\d*?)"', gzlib_page, re.S)

    在空格处加上.*?就ok啦!~~撒花~~

    gzlib_bookrecnos = re.findall(r'li.*?bookrecno="(\d*?)"', gzlib_page, re.S)

    相关文章

      网友评论

          本文标题:Python爬虫正则表达式匹配网页元素

          本文链接:https://www.haomeiwen.com/subject/jhahpxtx.html