美文网首页
Python xpath获取文本的问题

Python xpath获取文本的问题

作者: bpzj | 来源:发表于2017-09-02 23:25 被阅读0次

看英文pdf的时候,遇到不认识的单词,都是复制到网页翻译,很头疼。因为系统是win10,高分屏,有道的取词效果垃圾,一直想做一个python词典,在github看到这个,https://github.com/llf2017/pyDict/blob/master/pyDict.py,跟我想做的差不多。
因为不喜欢用BS,想把提取有道文本的那两行重新写下。
首先
import lxml
然后:
url ='http://dict.youdao.com/w/{}/'.format(word)
res = get_url(url)
tree = html.fromstring(res.content)
分析有道返回的数据(查询share这个单词):

写出下面的xpath表达式:

data = tree.xpath('//div[@id="results"]//div[@class="trans-container"]//ul/li[not(contains(text(),"\n"))]/text()')
# contains函数,contains(string1,string2),如果string1包含string2,则返回true
# //li[not(contains(text(),"\n"))] 返回文本不包括 \n 的 li

直接可以得到单词中文结果的列表

相关文章

  • Python xpath获取文本的问题

    看英文pdf的时候,遇到不认识的单词,都是复制到网页翻译,很头疼。因为系统是win10,高分屏,有道的取词效果垃圾...

  • XPath笔记

    XPath笔记 用::text选取文本 获取href属性

  • xpath 获取标签下所有文本

    在进行抓取网络信息的过程中,xpath 有两种获取文本的方式。 text() ..xpath('string(.)...

  • xpath , beautifulsoup4 , pyquery

    xpath xpath 语法 xpath的使用: 常用的语法: 使用bs4 文档解析器常用的两种 获取文本内容 p...

  • Python xpath 获取多个标签内的内容

    python xpath 获取多个标签内的内容 获取article标签下的所有内容,使用string()。 输出结...

  • python3解析库lxml

    python3解析库lxml 阅读目录 1、python库lxml的安装2、XPath常用规则 读取文本解析节点 ...

  • 爬虫12:解析器lxml

    在python中,主要使用 lxml 库来进行xpath获取(在框架中不使用lxml,框架内直接使用xpath即可...

  • 常用的xpath

    xpath的模糊查询 选取同级节点 获取父级节点 xpath定位 列表时间筛选 xpath获取标签 xpath的s...

  • 2017.06.28

    python xpath

  • 2018-11-23 关于scrapy解析js代码

    爬取金山翻译时希望可以获取例句,但是用xpath获取一直是空,开始以为是我写的xpath代码有问题,写了个关于xp...

网友评论

      本文标题:Python xpath获取文本的问题

      本文链接:https://www.haomeiwen.com/subject/lfhdjxtx.html