如何较快写出合适的xpath的小技巧

如何较快写出合适的xpath的小技巧

作者: 大白菜995 | 来源:发表于2020-02-13 19:56 被阅读0次

如何较快写出合适的xpath的小技巧
xpath小技巧
xpath 小技巧
观点文提炼【作业五】
使用Beautiful Soup抓取结构化数据
Xpath高级用法
30分钟写出一个51job职位爬虫,0基础小白也能写
[小技巧]Chrome中拷贝XPath的方法
xpath css选择器常见的状态码
2022-07-19

一，场景

用python写爬虫代码时，如下代码中需要写xpath路径

图中title_path,src_path 写起来xlml比较繁琐，每一层元素都需要写出元素的属性，

那有什么技巧可以方便的写出xpath路径呢

二，准备工作

1,浏览器安装Xpath helper 安装教程链接

2,比如我们要提取豆瓣网上周星驰的所有电影名字网址

三，操作步骤

1，打开网址，在浏览器中按F12 进入Chrome开发者工具，可以查看原代码，点击如下图，

2，点击（或用者用快捷键Ctrl+Shift+C）进入选择元素模式，然后从页面中选择需要查看的元素，然后可以在开发者工具元素（Elements）一栏中定位到该元素源代码的具体位置。

3，我们的目标是获取所有的电影名字，用图形选择模式，选中其中一个电影如《喜剧之王》如，右侧源代码中自动的的定位到该元素在lxml 位置上

4，会得到：

/html/body/div[3]/div[1]/div/div[2]/div[1]/div[1]/div[5]/div/div/div[1]/a

可以观察到这个xpath 是根据节点出现的顺序依次写出下个节点的

5，我们在来重复上个步骤工作，选择另一个目标《美人鱼》的xpath定位

/html/body/div[3]/div[1]/div/div[2]/div[1]/div[1]/div[7]/div/div/div[1]/a

可以观察到两个xpath路径非常对应，仅仅在中间的div[]的出现顺序不同，那么我们可以在这个分叉的节点处理下

6，可以观察到从这个节点下，每个节点对应这个网页中每部电影的模块，只要在这个节点修改元素表示方法即可，发现改节点的class属性较长，不属于常规的特征值，但我们可以观察其子节点的关系

每个子元素的属性相同，且是比较好的特征。

/html/body/div[3]/div[1]/div/div[2]/div[1]/div[1]/div[5]/div/div/div[1]/a

/html/body/div[3]/div[1]/div/div[2]/div[1]/div[1]/div[7]/div/div/div[1]/a

修改如下：

/html/body/div[3]/div[1]/div/div[2]/div[1]/div[1]//div[@class="item-root"]/div/div[1]/a

注意使用 ”//“

7，启动xpath helper 验证，将修改的节点复制到框中，观察结果是否和预想的一样

，

相关文章

如何较快写出合适的xpath的小技巧
一，场景用python写爬虫代码时，如下代码中需要写xpath路径图中title_path,src_path ...
xpath小技巧
xpath获取A下所有的子链接: //A/child::*/@href xpath 使用单引号，使用双引号报语法错...
xpath 小技巧
选择兄弟节点选择前N位的div标签preceding-sibling::div[N]选择后N位的div标签foll...
观点文提炼【作业五】
标题: 写作如何做好铺垫和渣染?6个小技巧让你写出更精彩的文章故事副标题1 如何写出好文章,6个小技巧你必须知道...
使用Beautiful Soup抓取结构化数据
写了Scrapy XPath抓取结构化数据的方法和技巧：《再谈Scrapy抓取结构化数据》《[小技巧]Chro...
Xpath高级用法
本篇主要介绍Xpath的一些高级用法，Xpath定位速度较快，是爬虫在网页定位中的较优选择。测试工具及环境：Pyt...
30分钟写出一个51job职位爬虫,0基础小白也能写
30分钟写出一个51job职位小爬虫,小白也能写的出来,不用懂正则, 不用懂xpath,分分钟写出来,大神走开前...
[小技巧]Chrome中拷贝XPath的方法
在用Scrapy爬取数据时需要用XPath确定路径，对于网页结构不熟悉的童鞋，需要认真找标签之间的嵌套关系，来确定...
xpath css选择器常见的状态码
xpath xpath 语法-谓语 xpath语法 css选择器 #上面的网址如何让它显示原文件？？待解决常见的状态码
2022-07-19
读书笔记：如何快速写出勾起读者阅读欲望的开头？《人人都能学会的刷屏，文案写作技巧》读书笔记：如何快速写出勾起读者...

网友评论

本文标题：如何较快写出合适的xpath的小技巧

本文链接：https://www.haomeiwen.com/subject/dbwlfhtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|如何较快写出合适的xpath的小技巧|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！