要匹配网页中 li bookrecno="123456789" 的这串数字,用这个试了就是不行:
gzlib_bookrecnos = re.findall(r'li bookrecno="(\d*?)"', gzlib_page, re.S)
在空格处加上.*?就ok啦!~~撒花~~
gzlib_bookrecnos = re.findall(r'li.*?bookrecno="(\d*?)"', gzlib_page, re.S)
要匹配网页中 li bookrecno="123456789" 的这串数字,用这个试了就是不行:
gzlib_bookrecnos = re.findall(r'li bookrecno="(\d*?)"', gzlib_page, re.S)
在空格处加上.*?就ok啦!~~撒花~~
gzlib_bookrecnos = re.findall(r'li.*?bookrecno="(\d*?)"', gzlib_page, re.S)
本文标题:Python爬虫正则表达式匹配网页元素
本文链接:https://www.haomeiwen.com/subject/jhahpxtx.html
网友评论