美文网首页
爬虫: 页面解析 -- css选择器的使用

爬虫: 页面解析 -- css选择器的使用

作者: 灯光树影 | 来源:发表于2018-10-08 22:45 被阅读0次

摘要

css选择器作为页面样式表的选择器,具有十分简便的语法规则,对前端了解的人一定会喜欢用一种熟悉的方式去选择页面中的元素;那么,python中的lxml模块中的cssselect就是很好的选择

说明

对应css选择器的语法规则这里并不详细说明,因为这是属于css样式表的范畴。
以下代码默认已导入lxml中的etree

    from lxml import etree

解析过程如下:

  1. 通过html页面内容生成selector
  2. 通过selector的cssselect方法获取元素

例如:

    # html内容
    html = "<!DOCTYPE HTML><html><body><p><a>123</a></p></body></html>"
    # 生成解析html的selector
    selector = etree.HTML(html)
    a = selector.cssselect("a")[0]
    print(a.text) # 123

上面代码实现了输出a标签的文本内容

相关文章

  • python-爬虫

    初识爬虫 网页基础 BeautifuleSoup 解析数据 提取数据 Tag 对象 CSS选择器 爬虫进阶

  • 爬虫: 页面解析 -- css选择器的使用

    摘要 css选择器作为页面样式表的选择器,具有十分简便的语法规则,对前端了解的人一定会喜欢用一种熟悉的方式去选择页...

  • 写个爬虫

    爬虫的流程 一个爬虫的执行过程可以大致分为三个部分: 获取页面内容(html) 使用CSS选择器、XPath、DO...

  • 有关CSS

    如何写出更好的CSS?(CSS是从右往左进行解析) ①避免使用*(全局)选择器。(耗费性能) ②CSS选择器的层级...

  • CSS选择器学习

    CSS选择器是学习CSS的一个核心部分,HTML页面中的元素就是通过CSS选择器来进行控制的,熟练使用CSS选择器...

  • CSS选择器

    CSS选择器常见的有几种? 基础选择器 “*” -> 通用元素选择器,匹配页面任何元素。很少使用 “#” -> i...

  • CSS有哪些选择器,优先级如何计算

    为何会有CSS选择器? HTML页面中元素的尺寸大小,颜色,状态等是可以通过CSS选择器进行控制的。 要想使用CS...

  • pyspider 爬虫教程

    注:采转归档,自己学习查询使用 pyspider 爬虫教程(1):HTML 和 CSS 选择器pyspider 爬...

  • 任务七-主线

    CSS选择器(上) 选择器类型: 基础选择器 *:通用元素选择器,匹配页面任何元素(这也就决定了我们很少使用) /...

  • 【CSS】选择器解析规则

    当我们接触css选择起的时候,会认为浏览器解析css选择器是从左向右解析;其实不然浏览器解析css选择器是从右向左...

网友评论

      本文标题:爬虫: 页面解析 -- css选择器的使用

      本文链接:https://www.haomeiwen.com/subject/qujsaftx.html