Python xpath获取文本的问题

Python xpath获取文本的问题

作者: bpzj | 来源:发表于2017-09-02 23:25 被阅读0次

Python xpath获取文本的问题
XPath笔记
xpath 获取标签下所有文本
xpath , beautifulsoup4 , pyquery
Python xpath 获取多个标签内的内容
python3解析库lxml
爬虫12：解析器lxml
常用的xpath
2017.06.28
2018-11-23 关于scrapy解析js代码

看英文pdf的时候，遇到不认识的单词，都是复制到网页翻译，很头疼。因为系统是win10，高分屏，有道的取词效果垃圾，一直想做一个python词典，在github看到这个，https://github.com/llf2017/pyDict/blob/master/pyDict.py，跟我想做的差不多。
因为不喜欢用BS，想把提取有道文本的那两行重新写下。
首先
import lxml
然后：
url ='http://dict.youdao.com/w/{}/'.format(word)
res = get_url(url)
tree = html.fromstring(res.content)
分析有道返回的数据（查询share这个单词）：

写出下面的xpath表达式：

data = tree.xpath('//div[@id="results"]//div[@class="trans-container"]//ul/li[not(contains(text(),"\n"))]/text()')
# contains函数，contains(string1,string2)，如果string1包含string2，则返回true
# //li[not(contains(text(),"\n"))] 返回文本不包括 \n 的 li

直接可以得到单词中文结果的列表

相关文章

Python xpath获取文本的问题
看英文pdf的时候，遇到不认识的单词，都是复制到网页翻译，很头疼。因为系统是win10，高分屏，有道的取词效果垃圾...
XPath笔记
XPath笔记用::text选取文本获取href属性
xpath 获取标签下所有文本
在进行抓取网络信息的过程中，xpath 有两种获取文本的方式。 text() ..xpath('string(.)...
xpath , beautifulsoup4 , pyquery
xpath xpath 语法 xpath的使用：常用的语法：使用bs4 文档解析器常用的两种获取文本内容 p...
Python xpath 获取多个标签内的内容
python xpath 获取多个标签内的内容获取article标签下的所有内容，使用string（）。输出结...
python3解析库lxml
python3解析库lxml 阅读目录 1、python库lxml的安装2、XPath常用规则读取文本解析节点 ...
爬虫12：解析器lxml
在python中，主要使用 lxml 库来进行xpath获取（在框架中不使用lxml，框架内直接使用xpath即可...
常用的xpath
xpath的模糊查询选取同级节点获取父级节点 xpath定位列表时间筛选 xpath获取标签 xpath的s...
2017.06.28
python xpath
2018-11-23 关于scrapy解析js代码
爬取金山翻译时希望可以获取例句，但是用xpath获取一直是空，开始以为是我写的xpath代码有问题，写了个关于xp...

网友评论

本文标题：Python xpath获取文本的问题

本文链接：https://www.haomeiwen.com/subject/lfhdjxtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|Python xpath获取文本的问题|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！