request+bs4爬取糗事百科数据

request+bs4爬取糗事百科数据

作者: CaesarsTesla | 来源:发表于2017-07-07 15:03 被阅读21次

request+bs4爬取糗事百科数据
Python爬虫(十七)_糗事百科案例
python爬虫
实战1——爬取百度糗事百科段子
爬虫常用代码
python爬虫+JavaWeb接口+Android完整的小项目
初识scrapy爬取糗事百科全部段子
nice，64个python爬虫入门项目，学会轻轻松松爬取资源
爬取糗事百科的内容和图片并展示
Scrapy爬虫项目

import requests
from bs4 import BeautifulSoup
import json
import time

i = 0
data = {}
def save_file(content):
    file = open('qsbk.txt','a')
    file.writelines(content)
    file.close()

while True:
    url = 'https://www.qiushibaike.com/8hr/page/'+str(i)+'/?s=4986156'

    data['dicAccept-Encoding'] = 'gzip, deflate'
    data['Referer'] = 'https://www.qiushibaike.com/'
    data['Accept'] = 'text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8'
    data['User-Agent'] = 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_11_6) AppleWebKit/602.3.12 (KHTML, like Gecko) Version/10.0.2 Safari/602.3.12'
    data['Accept-Language'] = 'zh-cn'

    respose = requests.get(url,data)
    soup = BeautifulSoup(respose.text,'html5lib')

    results = soup.find_all('div',class_='content')

    for result in results:
        span = result.select('span')
        print(span[0].text +'\n'+'\n')
        save_file(span[0].text +'\n')
    i += 1;
    time.sleep(4)

在这里我让其4秒自动执行下一页数据的抓取，并进行保存，最终的结果就像这样。(当然，不应该这么做的)

WechatIMG85.jpeg

相关文章

request+bs4爬取糗事百科数据
在这里我让其4秒自动执行下一页数据的抓取，并进行保存，最终的结果就像这样。(当然，不应该这么做的)
Python爬虫(十七)_糗事百科案例
糗事百科实例爬取糗事百科段子，假设页面的URL是: http://www.qiushibaike.com/8hr...
python爬虫
1、爬取糗事百科代码： 2、爬取淘宝手机信息代码： 3、爬取中国大学排名代码： 4、爬取豆瓣top250 代码：
实战1——爬取百度糗事百科段子
目标：爬取百度糗事百科段子，url 为http://www.qiushibaike.com/，爬取前20个网页中每...
爬虫常用代码
xpath抓取指定贴吧所有的图片 xpath爬取糗事百科的文字 requests模块案例 : 豆瓣电影排行榜数据抓...
python爬虫+JavaWeb接口+Android完整的小项目
上一篇讲了python 爬取糗事百科的数据到数据库中，本篇讲解java web接口开发，以json的形式展示接口 ...
初识scrapy爬取糗事百科全部段子
爬取糗事百科所有段子加上作者（图片部分不做爬取）效果感谢简书作者xiyouMc的建议和他的作品爬取成人网xiyo...
nice，64个python爬虫入门项目，学会轻轻松松爬取资源
爬虫在手，资源我有，看完这些，你还敢说你不会爬吗？（滑稽） 1.爬取糗事百科 2.爬取妹子图 3.Python ...
爬取糗事百科的内容和图片并展示
date: 2018-01-05 22:00:00status: publictitle: '爬取糗事百科的内容和...
Scrapy爬虫项目
爬取糗事百科笑话https://www.qiushibaike.com/text/ 创建项目创建爬虫主程序确定...

网友评论

本文标题：request+bs4爬取糗事百科数据

本文链接：https://www.haomeiwen.com/subject/vqalhxtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|request+bs4爬取糗事百科数据|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！