scrapy取不规则结构

作者: 罗盘上的方向 | 来源:发表于2018-01-19 20:27 被阅读3次

<td align="left">工商管理<br>市场营销<br>财务管理<br>人力资源管理<br>电子商务</td>

今天爬页面的时候遇到这种结构的，要求把每一个分开，最开始直接用text()发现取出来的在一起，不能分开。
于是采用了一种折中的方法：用正则

';'.join((''.join(tr.xpath('td[5]').re('<td align="left">(.*?)</td>'))).split('<br>'))

有更好的方法，欢迎大家评论讨论

网友评论

本文标题：scrapy取不规则结构

本文链接：https://www.haomeiwen.com/subject/ajuaoxtx.html

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！