[小技巧]Chrome中拷贝XPath的方法

[小技巧]Chrome中拷贝XPath的方法

作者: 向右奔跑 | 来源:发表于2017-01-31 20:27 被阅读1331次

[小技巧]Chrome中拷贝XPath的方法
使用Beautiful Soup抓取结构化数据
简单粗暴获取腾讯动漫图片url
2020-05-11
定位工具
xpath工具与lxml库的使用
xpath小技巧
xpath 小技巧
XPath的基本使用
JS获取当前页所有URL并在新标签页中打开

在用Scrapy爬取数据时需要用XPath确定路径，对于网页结构不熟悉的童鞋，需要认真找标签之间的嵌套关系，来确定所要提取内容的路径。一个简单的方法是，可以直接用Chrome的检查来Copy这个XPath的路径。

方法见这篇文章《再谈Scrapy抓取结构化数据》

在文章中提到的小技巧，就是使用Chrome“检查”-- 找到要抓取的内容，右键 “Copy” -- “Copy XPath”

但是Copy出来的路径，是不能直接使用的，它默认是从最近的一个带id的标签开始。如果没有它会从 html标签开始计算路径。

以“小猪短租” 的房租信息为例：

http://sh.xiaozhu.com/search-duanzufang-p1-0/

copy 房租价格的XPath路径是：

//*[@id="page_list"]/ul/li[1]/div[2]/span[1]/i

显然循环点选取在li (每个租房信息都包含在一个 li 中) 。在循环中路径就应该写：

info.xpath('div[2]/span[1]/i/text()')

我录了一段屏，看一下：

相关文章

[小技巧]Chrome中拷贝XPath的方法
在用Scrapy爬取数据时需要用XPath确定路径，对于网页结构不熟悉的童鞋，需要认真找标签之间的嵌套关系，来确定...
使用Beautiful Soup抓取结构化数据
写了Scrapy XPath抓取结构化数据的方法和技巧：《再谈Scrapy抓取结构化数据》《[小技巧]Chro...
简单粗暴获取腾讯动漫图片url
以下的测试是在chrome上进行的，以火影忍者为例。操作方法：拷贝代码块中的js，输入指定网站，在chrome中...
2020-05-11
今日小技巧巧用cssText方法 cssText 返回值是什么？在某些浏览器中（比如 Chrome），你给他赋...
定位工具
FireFox:xpath checker Chrome:Xpath Finder 关于iframe的定位，Fir...
xpath工具与lxml库的使用
xpath 在XML文档中查找信息的语言,同样适用于HTML文档的检索 xpath辅助工具 Chrome插件插件...
xpath小技巧
xpath获取A下所有的子链接: //A/child::*/@href xpath 使用单引号，使用双引号报语法错...
xpath 小技巧
选择兄弟节点选择前N位的div标签preceding-sibling::div[N]选择后N位的div标签foll...
XPath的基本使用
一、xpath简介二、xpath安装终端安装 chrome浏览器安装三、xpath基本使用导包l 用etr...
JS获取当前页所有URL并在新标签页中打开
在Chrome浏览器中，基于XPath，在新标签页中打开当前页面的所有URL

网友评论

本文标题：[小技巧]Chrome中拷贝XPath的方法

本文链接：https://www.haomeiwen.com/subject/hbskittx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|[小技巧]Chrome中拷贝XPath的方法|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！