在爬取前程无忧信息时,使用下面的解析方法出现了信息丢失的问题:
html = BeautifulSoup(result,"lxml")
经过查询CSDN博客,发现是’lxml’解析页面时出的问题,故此改用下面方法:
html = BeautifulSoup(result,"html.parser") #因为使用'lxml'会导致内容丢失,故此使用'html.parser'
虽然效率可能会比’lxml’低一些,但是不会有信息丢失的问题了。
下面是博客链接地址:
在爬取前程无忧信息时,使用下面的解析方法出现了信息丢失的问题:
经过查询CSDN博客,发现是’lxml’解析页面时出的问题,故此改用下面方法:
虽然效率可能会比’lxml’低一些,但是不会有信息丢失的问题了。
下面是博客链接地址:
本文标题:BeautifulSoup解析页面造成信息丢失的解决办法
本文链接:https://www.haomeiwen.com/subject/mqgxiftx.html
网友评论