Python爬虫之爬取不得姐段子

Python爬虫之爬取不得姐段子

作者: weizujie | 来源:发表于2017-08-17 18:33 被阅读14次

Python爬虫之爬取不得姐段子
Python网络爬虫之爬取百思不得姐视频并保存至文件
Python爬虫实战之爬取链家广州房价_03存储
Python爬虫之爬取不得姐图片
Python爬虫实战
python爬虫之爬取教务网成绩
各类链接
Python学习
Python爬虫-豆瓣电影Top250-各项信息爬取及xls保存
Python实战爬虫：爬取段子

刚刚看完《Python网络数据采集》的前三章，就用不得姐来练练手，下面直接贴代码吧。

import requests
from bs4 import BeautifulSoup
import re
import os


def get_text(url):
    headers = {'User-Agent':'Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/60.0.3112.90 Mobile Safari/537.36'}
    html = requests.get(url, headers=headers)
    html.encoding = 'utf-8'
    soup = BeautifulSoup(html.text, 'lxml')
    all_a = soup.find('div', {'class':'j-content'}).find_all('div', {'class':'j-r-list-c-desc'})
    all_text = []
    for text in all_a:
        all_text.append(text.text)

    with open('text.txt', 'a+') as f:
        for text_ in all_text:
            f.write(text_)
    return text_

def main():
    url = 'http://www.budejie.com/text/'
    endpage = int(input('你要下载多少页:'))
    for i in range(1, endpage + 1):
        try:
            get_text(url + str(i))
        except:
            pass
    print('下载完成！请到程序根目录查看text.txt')  
if __name__ == '__main__':
    main()

效果图

相关文章

Python爬虫之爬取不得姐段子
刚刚看完《Python网络数据采集》的前三章，就用不得姐来练练手，下面直接贴代码吧。
Python网络爬虫之爬取百思不得姐视频并保存至文件
项目说明使用Python写网络爬虫之爬取百思不得姐视频并保存至文件示例使用工具 Python2.7.X、pyc...
Python爬虫实战之爬取链家广州房价_03存储
问题引入系列目录： Python爬虫实战之爬取链家广州房价_01简单的单页爬虫 Python爬虫实战之爬取链家广...
Python爬虫之爬取不得姐图片
上一个爬段子的，我们将它改改就可以爬图片了。贴代码：
Python爬虫实战
注：采转归档，自己学习查询使用 Python爬虫实战（1）：爬取糗事百科段子Python爬虫实战（2）：百度贴吧帖...
python爬虫之爬取教务网成绩
python爬虫之爬取教务网成绩这次的内容主要就是讲述自己的第一只python爬虫，而所要爬取的对象就是学校的教...
各类链接
爬虫使用python-aiohttp爬取今日头条【Python】爬虫爬取各大网站新闻 Scrapy 模拟登录新...
Python学习
python爬虫(五) python爬虫爬取豆瓣电影Top250数据利用python爬取豆瓣电影TOP250页面...
Python爬虫-豆瓣电影Top250-各项信息爬取及xls保存
Python爬虫-豆瓣电影Top250-各项信息爬取及xls保存目的采用python爬虫爬取豆瓣电影Top25...
Python实战爬虫：爬取段子
python爬取段子爬取某个网页的段子第一步不管三七二十一我们先导入模块第二步获取网站的内容第三步找...

网友评论

本文标题：Python爬虫之爬取不得姐段子

本文链接：https://www.haomeiwen.com/subject/ruunrxtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|Python爬虫之爬取不得姐段子|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！