美文网首页
Scrapy选择器用法

Scrapy选择器用法

作者: 木头猿 | 来源:发表于2018-07-18 21:37 被阅读0次

Xpath选择器

nodeName    选取此节点的所有节点
/           从根节点选取
//          从匹配选择的当前节点选择文档中的节点,不考虑它们的位置
.           选择当前节点
..          选取当前节点的父节点
@           选取属性
*           匹配任何元素节点
@*          匹配任何属性节点
Node()      匹配任何类型的节点

例
response.xpath('//a[@href="link4.html"]/..*/@class')#获取herf为link4.html的a标签的父标签的class值
response.xpath('//a[@href="link4.html"]/..*/text()')#获取herf为link4.html的a标签的父标签中的文本

参考:http://www.scrapyd.cn/doc/186.html

CSS选择器

.class              .color              选择class=”color”的所有元素
#id                 #info               选择id=”info”的所有元素
*                   *                   选择所有元素
element             p                   选择所有的p元素
element,element     div,p               选择所有div元素和所有p元素
element element     div p               选择div标签内部的所有p元素
[attribute]         [target]            选择带有targe属性的所有元素
[arrtibute=value]   [target=_blank]     选择target=”_blank”的所有元素

例
response.css('ul.td-category a::attr(href)')#获取class为td-category的ul标签下的a标签的href属性
response.css('ul.td-category a::text')#获取class为td-category的ul标签下的a标签的的文本

参考:http://www.scrapyd.cn/doc/185.html

爬坑

  • 忽略子标签,提取标签下的所有文本信息
    HTML结构
<p id="test3">ssssssssssss
<strong>dddddd</strong>
ssssssssssssssssssssss
<strong>ccccc</strong>
</p>

提取方法:结果返回一个四个元素的list

content_list= response.css("p").xpath('string(.)').extract()

参考:
https://www.cnblogs.com/zhaof/p/7189860.html
标签嵌套

相关文章

  • Scrapy选择器用法

    Xpath选择器 参考:http://www.scrapyd.cn/doc/186.html CSS选择器 参考:...

  • CSDN热榜、华为云博客都可用来练习Python scrapy

    这篇博客补充一下 scrapy 选择器相关知识。 scrapy 选择器 scrapy 框架自带数据提取机制,相关内...

  • python爬虫13:scrapy

    scrapy的结构 scrapy的工作原理 scrapy的用法

  • 常用选择器

    元素选择器 id选择器 id选择器的用法 类选择器 class用法 选择器分组(并集选择器) 并集选择器用法 通配...

  • 【零基础学爬虫】scrapy中选择器详解

    简介 对网页解析时,不可避免需要使用选择器。本文主要介绍scrapy中的各类选择器,选择器其实就是scrapy内置...

  • 常用选择器

    1.id选择器 2.id用法 3.类选择器 4.class用法 5.选择器分组(并集选择器) 6.并集选择器用法 ...

  • scrapy框架选择器的用法

    Scrapy提取数据有自己的一套机制,被称作选择器(selectors),通过特定的Xpath或者CSS表达式来选...

  • 常用选择器

    1.元素选择器 2.id选择器 3.id用法 4.类选择器 5.class用法 6.选择器分组(并集选择器) 7....

  • scrapy 框架总结

    scrapy的基本用法 通过命令创建项目scrapy startproject 项目名称 用pycharm打开项目...

  • Scrapy

    基本用法 python -m scrapy startproject yourproject 建立project ...

网友评论

      本文标题:Scrapy选择器用法

      本文链接:https://www.haomeiwen.com/subject/fefmpftx.html