美文网首页
正则表达式和BeautifulSoup学习

正则表达式和BeautifulSoup学习

作者: 咖喱魚旦餐蛋面 | 来源:发表于2018-08-25 18:00 被阅读0次

奶斯

把目标用括号阔起来

.*会匹配得尽可能多

.*加上?就会匹配尽可能少的字符

匹配换行符

加上一个匹配模式就可以了

去掉re.S

结果是一个列表,列表里的是元组

替换

如果不是每个标签都是一样的,那就先把不一样的去掉,再进行匹配、提取

实现代码复用

pretty()可以帮我们自动补全

平时都用 .text

.contents 可以获得所有的子节点

.children 是一个迭代器,需要用for 循环打印子节点

.descendants 也是一个迭代器 获得所有的子孙节点

获得父节点

获得所有父节点,是一个迭代器

作为一些内容匹配

相关文章

网友评论

      本文标题:正则表达式和BeautifulSoup学习

      本文链接:https://www.haomeiwen.com/subject/slpwiftx.html