网络爬虫（六）

网络爬虫（六）

作者: zhangxiaohao | 来源:发表于2019-05-12 00:19 被阅读3次

网络爬虫（六）
1-基本概念
2018-01-11 Python网络爬虫与信息提取网络爬虫
[Python网络爬虫]第1章网络爬虫入门
Python网络爬虫实战之十四：Scrapy结合scrapy-s
Python网络爬虫实战之七：动态网页爬取案例实战 Seleni
Python网络爬虫实战之八：动态网页爬取案例实战 Seleni
Python网络爬虫实战之九：Selenium进阶操作与爬取京东
Python网络爬虫实战之十一：Scrapy爬虫框架入门介绍
Python网络爬虫实战之十三：Scrapy爬取名侦探柯南漫画集

xpath解析原理

实例化etree对象，将页面源码传给该对象。
用生成的etree对象，调用xpath方法和xpath表达式进行定位、获取数据。

环境安装

pip install lxml

基本用法

from lxml import etree

将本地文本传给etree对象：etree.parse(filepath)
将页面源码传给etree对象：etree.parse(page-text)
表达式用法：etree-obje.xpaht('xpath表达式‘），xpath表达式是解析的重点,先上代码。

from lxml import etree
......……
tree=etree.parse('test.html')
r=tree.xpath('/html/head/title') #取得title元素对象。

xpath表达式

/：为分隔符，意义是第一个“/”为根节点，其他的“/”表示一个层级。
//:表示多个层级，如tree.xpath('//titlt'),tree.xpath('/html//title').
属性定位：如tree.xpath('//div[@class="classname"] ')
索引定位：如tree.xpath('//div[@class="classname"] /p[3]'),注意索引是从１开始的。
取文本：/text()取直系文本。如tree.xpath('//div[@class="classname"]/text() ')
//text()取标签下全部文本，如tree.xpath('//div[@class="classname"]//text() ')
取属性：/@tattrName,如tree.xpath('//div[@class="classname"]//a/@href ') 晴朗

相关文章

网络爬虫（六）
xpath解析原理实例化etree对象，将页面源码传给该对象。用生成的etree对象，调用xpath方法和xp...
1-基本概念
简介为什么选择Python做爬虫需要技能爬虫与反爬虫网络爬虫类型通用网络爬虫聚焦网络爬虫增量式网络爬...
2018-01-11 Python网络爬虫与信息提取网络爬虫
1、网络爬虫 1.1 网络爬虫的尺寸网络爬虫的尺寸 1.2 网络爬虫的“骚扰”网络爬虫速度快（但是服务器是按照人数...
[Python网络爬虫]第1章网络爬虫入门
要点介绍网络爬虫的基础部分学习网络爬虫的原因网络爬虫带来的价值网络爬虫是否合法网络爬虫的基本议题和框架 1.1 ...
Python网络爬虫实战之十四：Scrapy结合scrapy-s
目录：Python网络爬虫实战系列 Python网络爬虫实战之一：网络爬虫理论基础 Python网络爬虫实战之二：...
Python网络爬虫实战之七：动态网页爬取案例实战 Seleni
目录：Python网络爬虫实战系列 Python网络爬虫实战之一：网络爬虫理论基础 Python网络爬虫实战之二：...
Python网络爬虫实战之八：动态网页爬取案例实战 Seleni
目录：Python网络爬虫实战系列 Python网络爬虫实战之一：网络爬虫理论基础 Python网络爬虫实战之二：...
Python网络爬虫实战之九：Selenium进阶操作与爬取京东
目录：Python网络爬虫实战系列 Python网络爬虫实战之一：网络爬虫理论基础 Python网络爬虫实战之二：...
Python网络爬虫实战之十一：Scrapy爬虫框架入门介绍
目录：Python网络爬虫实战系列 Python网络爬虫实战之一：网络爬虫理论基础 Python网络爬虫实战之二：...
Python网络爬虫实战之十三：Scrapy爬取名侦探柯南漫画集
目录：Python网络爬虫实战系列 Python网络爬虫实战之一：网络爬虫理论基础 Python网络爬虫实战之二：...

网友评论

本文标题：网络爬虫（六）

本文链接：https://www.haomeiwen.com/subject/pwhxaqtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

公众号【麦小丁】征集优质文章

热点阅读

公众号【麦小丁】征集优质文章

成长励志

城市故事

想法

读书

关于我们|服务条款|联系我们|网络爬虫（六）|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！