4 使用xpath解析豆瓣短评

4 使用xpath解析豆瓣短评

作者: 怂恿的大脑 | 来源:发表于2018-02-01 17:06 被阅读23次

4 使用xpath解析豆瓣短评
1-4 使用Xpath解析豆瓣短评
xpath , beautifulsoup4 , pyquery
day67-爬虫之xml及beautifulsoup
XML解析
【Python爬虫】BeautifulSoup爬取豆瓣电影短评
爬虫解析库XPath使用
Python爬虫爬坑记录
java xml处理总结
爬虫： example two -- 爬取小说

image

image

image

image

image

image

建议用xpath不用beatifulsoup

image

image

image

image

第二种手写xpath

image

image

image

完整代码

import requests

from lxml import etree

url ='https://movie.douban.com/subject/6874741/comments?status=P'

r = requests.get(url).text

s=etree.HTML(r)

print(s.xpath('//*[@id="comments"]/div/div[2]/p/text()')) #浏览器复制

print(s.xpath('//div[@class="comment"]/p/text()')) #手写

答题中心

image

image

解析：在所有元素中找，只有class='name'这个类的元素都给找出来

//*[@id="paper"]/a/div[2]/text() b答案错在[@id="paper"]

简书当页所有书面代码

import requests

from lxml import etree

url ='http://www.jianshu.com/publications'

r = requests.get(url).text

s=etree.HTML(r)

print(s.xpath('//*[@id="comments"]/div/div[2]/p/text()')) #浏览器复制

print(s.xpath(' //*[@class="name"]/text()')) #手写

image

糗百所有博主昵称完整代码

import requests

from lxml import etree

url ='https://www.qiushibaike.com/text/'

r = requests.get(url).text

s=etree.HTML(r)

print(s.xpath('//*[@id="comments"]/div/div[2]/p/text()')) #浏览器复制

print(s.xpath('//*[@id="content-left"]/div/div[1]/a[2]/h2/text()')) #手写

运行结果示例：

image

image

image

图片链接代码

import requests

from lxml import etree

url ='https://www.jianshu.com/publications#paper'

r = requests.get(url).text

s=etree.HTML(r)

print(s.xpath('//*[@id="comments"]/div/div[2]/p/text()')) #浏览器复制

print(s.xpath('//*[@id="paper"]/a[1]/div[1]/img/@src')) #手写

image

image

相关文章

4 使用xpath解析豆瓣短评
建议用xpath不用beatifulsoup 第二种手写xpath 完整代码 import requests fr...
1-4 使用Xpath解析豆瓣短评
上一节，我们用的是BeautifulSoup去解析网页数据。这一节，我们用新方法：用Xpath来解析网页数据。xp...
xpath , beautifulsoup4 , pyquery
xpath xpath 语法 xpath的使用：常用的语法：使用bs4 文档解析器常用的两种获取文本内容 p...
day67-爬虫之xml及beautifulsoup
1爬虫解析库的使用 Xpath解析库使用Xpath解析库需要先安装lxml库pip3 install lxmlBe...
XML解析
dom4j 元素解析xml文件获取根节点遍历查保存添加删除改 XPath 使用XPath对xml文...
【Python爬虫】BeautifulSoup爬取豆瓣电影短评
目的：爬取豆瓣【红海行动】电影的首页短评步骤： 1、使用BeautifulSoup解析网页 2、描述要爬取的东西...
爬虫解析库XPath使用
爬虫解析库XPath使用 1.XPath简介 XPath 是一门在 XML 文档中查找信息的语言。XPath 用于...
Python爬虫爬坑记录
1. xpath //解析出问题解析出问题注意使用‘.’来相对于当前元素进行解析 2. xpath抓取的值有空格...
java xml处理总结
xpath解析心得 xml解析笔记做了这么多xml解析用的最多的就是DOM4j,感觉使用最方便，最简单，首先说要导...
爬虫： example two -- 爬取小说
摘要爬取的目标网页是笔趣阁的飞剑问道使用requests + xpath 的方法，xpath使用xml模块解析 ...

网友评论

人生苦短，我用Python

本文标题：4 使用xpath解析豆瓣短评

本文链接：https://www.haomeiwen.com/subject/ltzdzxtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

人生苦短，我用Python

热点阅读

人生苦短，我用Python

关于我们|服务条款|联系我们|4 使用xpath解析豆瓣短评|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！