二、爬取伯乐在线

二、爬取伯乐在线

作者: Im渣渣 | 来源:发表于2017-10-26 16:21 被阅读0次

创建main函数，调试scrapy

-- coding: utf-8 --

author = 'wujiee'

from scrapy.cmdline import execute

import sys
import os

sys.path.append(os.path.dirname(os.path.abspath(file)))
execute(["scrapy","crawl","jobbole"])

cmd命令中，运行scrapy crawl jobbole
如果出错，则安装如下包pip install pypiwin32

2.xpath用法
articleTitle = response.xpath('//[@id="post-112760"]/div[1]/h1/text()') --text()可以提取标签里的内容
tagList = response.xpath('//[@id="post-112760"]/div[2]/p/a/text()').extract() --extract()提取两个a标签的内容，组成一个数据列表
tags = ",".join(tagList) --join()函数拼接字符串，参数为list列表类型

相关文章

网友评论

本文标题：二、爬取伯乐在线

本文链接：https://www.haomeiwen.com/subject/ycykpxtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|二、爬取伯乐在线|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！