美文网首页
beautifulsoup4 标签选择器

beautifulsoup4 标签选择器

作者: 程序里的小仙女 | 来源:发表于2020-08-27 01:59 被阅读0次

from bs4 import BeautifulSoup

语法
soup = BeautifulSoup('源码', 'lxml')

html = """
<html><head><title>学习爬虫好开心</title></head>
<body>
<p class="title" name="dromouse"><b>( ̄TT ̄)笔芯</b></p>
<p class="story">喵了个猫
<a href="http://example.com/elsie" class="sister" id="link1">汪汪汪,汪星人</a> and
<a href="http://example.com/lacie" class="sister" id="link2">喵喵喵,喵星人</a>
最后变成一锅高汤</p>
<p class="story">...</p>
"""

标签解释器
soup = BeautifulSoup(html, 'lxml')
通过soup对象,标签获取整个标签的内容

通过soup对象,标签.string获取到标签内容
print(soup.title)

print(soup.title.string)
soup.p 获取的是第一个p标签的内容
print(soup.p)
print(soup.a)
print(soup.a.string)

通过soup对象.标签[属性] 或者soup对象.标签.attars[属性] 获取属性的值
print(soup.p['name'])
print(soup.p['class'])
print(soup.p.attrs['name'])
print(soup.p.attrs['class'])

获取兄弟节点
找soup对象.p标签.next_siblings找的是第一个p标签的下面的兄弟节点

print(soup.p.next_siblings)
print(list(soup.p.next_siblings))

soup对象.p标签.previous_siblings找的是第一个p标签的上面的兄弟节点
print(soup.p.previous_siblings)
print(list(soup.p.previous_siblings))

子节点
print(soup.body)
print(list(soup.body.children))

子孙节点 descendants
print('------------------------')
print(list(soup.body.children))
print('------------------------')
print(list(soup.body.descendants))

获取第二个p标签中的a标签的内容
print(list(list(soup.p.next_siblings)[1].children)) print(list(list(soup.p.next_siblings)[1].a))

父节点, 祖先节点
print(soup.a)
print('------------------------')
print(soup.a.parent)
print('------------------------')
print(list(soup.a.parents))

prettify将页面结构补充完整,且解析\n这一类的标签
print(soup.prettify())

相关文章

  • beautifulsoup4 标签选择器

    from bs4 import BeautifulSoup 语法soup = BeautifulSoup('源码'...

  • BeautifulSoup4解析器(css选择器)

    CSS 选择器:BeautifulSoup4 官方文档:http://beautifulsoup.readthed...

  • 详解BeautifulSoup4

    CSS 选择器:BeautifulSoup4 和 lxml 一样,Beautiful Soup 也是一个HTML/...

  • 2018-11-22

    CSS 选择器:BeautifulSoup4 和 lxml 一样,Beautiful Soup 也是一个HTML/...

  • 学习CSS初识

    标签选择器 HTML标签作为标签选择器的名称 … 、 、 类选择器 <标签名 class= "类名称">标签内容<...

  • CSS

    CSS基本语法结构 eg: style标签 标签选择器HTML标签作为标签选择器的名称 … 、 、 类选择器<标签...

  • Python Beautifulsoup模块使用

    1 CSS 选择器:BeautifulSoup4的介绍和安装 和 lxml 一样,Beautiful Soup 也...

  • css选择器和文本标签

    1、css选择器 标签选择器 id选择器 类选择器 层级选择器 组选择器 伪类选择器 文本标签 em标签用于表示一...

  • No.7 CSS选择器

    一、CSS基础选择器 1.标签选择器 标签选择器(元素选择器)是指用 HTML 标签名称作为选择器,按标签名称分类...

  • 2018-08-14 HTML学习CSS选择器与伪类选择器

    选择器 1. 元素选择器(标签选择器):标签名 选中所有的标签名对应的标签例:所有a标签 2.id选择器:#id属...

网友评论

      本文标题:beautifulsoup4 标签选择器

      本文链接:https://www.haomeiwen.com/subject/ocelfctx.html