学习抓取糗百文字内容

学习抓取糗百文字内容

作者: Stevent | 来源:发表于2016-09-03 15:09 被阅读29次

学习抓取糗百文字内容
1.爬取糗百段子
爬糗事百科段子
Python 爬虫入门(一)——爬取糗百
【Python爬虫】糗百-文字版块
Python爬虫之抓取百度贴吧中某篇帖子的内容
python request里正则表达式用法
python爬取百度贴吧
爬虫（文字+图片）
爬取糗事百科

学习爬虫，抓取糗百文字内容

#!/usr/bin/env python3.5
# -*- coding:utf-8 -*-
"""
Function:
抓取糗事百科文字内容
Version:    2016-06-13
Author:     Steven
Contact:    lucibriel (at) 163.com
"""

import requests
from bs4 import BeautifulSoup

def get_qiushi(page=1):
    """抓取糗事百科文字内容
    Parameter：
    page -- 页码
    """
    
    headers = {
        'User-Agent':'Mozilla/5.0 (Windows NT 10.0) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/45.0.2454.101 Safari/537.36',
        'Connection':'keep-alive'
    }

    url = 'http://www.qiushibaike.com/hot/page/{}'.format(str(page))
    web_data = requests.get(url,headers=headers)
    soup = BeautifulSoup(web_data.text,'lxml')

    usrs = soup.select('.article h2')
    contents = soup.select('.article .content')
    votes = soup.select('.article .stats-vote .number')
    comments = soup.select('.article .stats-comments .number')

    for usr, content, vote, comment in zip(usrs,contents,votes,comments):
        print('用户:',usr.text.strip())
        print('内容:',content.text.strip())
        print('好笑：{}\t评论：{}'.format(vote.text.strip(),comment.text.strip()))
        print('='*50)

if __name__ == '__main__':
    get_qiushi()

相关文章

学习抓取糗百文字内容
学习爬虫，抓取糗百文字内容
1.爬取糗百段子
python学习笔记声明：学习笔记主要是根据廖雪峰官方网站python学习学习及博客 #糗百提取一页内容 # -...
爬糗事百科段子
本人比较喜欢段子，平时也经常上糗百。所以这次作业也想尝试一下爬取糗百的内容。网站链接：https://www.q...
Python 爬虫入门(一)——爬取糗百
爬取糗百内容 GitHub 代码地址https://github.com/injetlee/Python/blob...
【Python爬虫】糗百-文字版块
**糗百-文字版块https://www.qiushibaike.com/text/爬取作者信息(头像/昵称/性别...
Python爬虫之抓取百度贴吧中某篇帖子的内容
目的：抓取百度贴吧中某篇帖子的内容思路： 1，分析百度贴吧的url 2，抓取里面的分页元素 3，循环抓取url...
python request里正则表达式用法
目标url： https://www.qiushibaike.com/text/ （纯文字）尝试抓取糗事百...
python爬取百度贴吧
1.对百度贴吧的任意帖子进行抓取 2.指定是否只抓取楼主发帖内容 3.将抓取到的内容分析并保存到文件
爬虫（文字+图片）
图片抓取案例文字抓取案例
爬取糗事百科
糗事百科纯文抓取，包括用户id，用户头像，糗事内容

网友评论

本文标题：学习抓取糗百文字内容

本文链接：https://www.haomeiwen.com/subject/jugkettx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|学习抓取糗百文字内容|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！