1.爬取糗百段子

1.爬取糗百段子

作者: 2d813a6c6bbb | 来源:发表于2018-01-07 17:56 被阅读0次

1.爬取糗百段子
爬糗事百科段子
爬取糗百
Python爬虫教程一爬取糗事百科段子
使用python爬取糗百段子
Python 爬虫入门(一)——爬取糗百
【Python爬虫】糗百-文字版块
实战1——爬取百度糗事百科段子
爬取糗百12-02
爬取糗百|测试作业

python学习笔记

声明：学习笔记主要是根据廖雪峰官方网站python学习学习及博客

#糗百提取一页内容

# -*- coding=utf-8 -*-

import urllib

import urllib2

import re

import sys

reload(sys)

sys.setdefaultencoding('utf8')

page =1

url ='https://www.qiushibaike.com/hot/page/1/'

user_agent ='Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.84 Safari/537.36'

headers = {'User-Agent' : user_agent }

try:

request = urllib2.Request(url,headers = headers)

response = urllib2.urlopen(request)

content= response.read().decode("utf-8")

items = re.findall(r'\n+\s+(.*?)\s+\n+',content,re.S)

#'\n\n+(.*?)\n\n+'

for itemin items:

if '
' in item:

new_each = re.sub(r'
','\n',item)

print(new_each)

# 没有就照常输出

else:

print(item)

except urllib2.URLError, e:

if hasattr(e,"code"):

print e.code

if hasattr(e,"reason"):

print e.reason

相关文章

1.爬取糗百段子
python学习笔记声明：学习笔记主要是根据廖雪峰官方网站python学习学习及博客 #糗百提取一页内容 # -...
爬糗事百科段子
本人比较喜欢段子，平时也经常上糗百。所以这次作业也想尝试一下爬取糗百的内容。网站链接：https://www.q...
爬取糗百
加载全文的时候，需要注意怎么获取；
Python爬虫教程一爬取糗事百科段子
这次为大家带来，Python爬取糗事百科的小段子的例子。首先，糗事百科大家都听说过吧？糗友们发的搞笑的段子一抓一...
使用python爬取糗百段子
博主CSDN昵称：守护者ly，欢迎大家前去指点最近在自学Python爬虫，写了一个小demo，前来现学现卖!感谢大...
Python 爬虫入门(一)——爬取糗百
爬取糗百内容 GitHub 代码地址https://github.com/injetlee/Python/blob...
【Python爬虫】糗百-文字版块
**糗百-文字版块https://www.qiushibaike.com/text/爬取作者信息(头像/昵称/性别...
实战1——爬取百度糗事百科段子
目标：爬取百度糗事百科段子，url 为http://www.qiushibaike.com/，爬取前20个网页中每...
爬取糗百12-02
糗事百科
爬取糗百|测试作业
主要爬取的糗百文字版，格式比较统一，不需要对图片、视频进行判断。这次爬取只用了标准库，数据提取用了正则表达式。设...

网友评论

本文标题：1.爬取糗百段子

本文链接：https://www.haomeiwen.com/subject/pxlmnxtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|1.爬取糗百段子|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！