request + BeautifulSoup 爬取豆瓣250

request + BeautifulSoup 爬取豆瓣250

作者: MA木易YA | 来源:发表于2018-11-05 14:57 被阅读0次

request + BeautifulSoup 爬取豆瓣250
Python学习
node.js一个爬虫实例
用23行代码爬取豆瓣音乐top250
第一个小爬虫代码
Python学习第四天
python爬取豆瓣电影top250
爬取豆瓣TOP250图书榜的出版社分布(一)-urllib2
利用BeautifulSoup爬取豆瓣首页图书的详情
【Python爬虫】BeautifulSoup爬取豆瓣电影短评

import requests
from bs4 import BeautifulSoup


def getHTMLText(url):
    try:
        r = requests.get(url, timeout=30)
        r.raise_for_status()#状态码为200则返回文本否则抛出异常
        r.encoding = r.apparent_encoding
        return r.text
    except:
        return "产生异常"


def get_data(list, html):
    tables = BeautifulSoup(html, 'html.parser').find('div', {'class': 'indent'}).find_all('table')
    for table in tables:
        title = table.find('div', {'class': 'pl2'}).find('a').get_text()
        info = table.find('p', {'class': 'pl'}).get_text()
        list.append([title.strip(), info.strip()])


def print_data(list):
    print("{:^6}\t{:^10}\t{:^16}".format('序号', '书名', '信息'))
    count = 0
    for b in list:
        count += 1
        print("{:^6}\t{:^16}\t{:^16}".format(count, b[0], b[1]))


def main():
    start_url = 'https://book.douban.com/top250?'
    depth = 10
    info_list = []
    for i in range(depth):
        url = start_url + str(25 * i)
        html = getHTMLText(url)
        get_data(info_list, html)
    print_data(info_list)


if __name__ == '__main__':
    main()

其他爬虫代码可参考github

相关文章

request + BeautifulSoup 爬取豆瓣250
其他爬虫代码可参考github
Python学习
python爬虫(五) python爬虫爬取豆瓣电影Top250数据利用python爬取豆瓣电影TOP250页面...
node.js一个爬虫实例
爬取豆瓣top250 测试
用23行代码爬取豆瓣音乐top250
网上有各种爬取豆瓣电影top250的教程，虽然豆瓣音乐top250和豆瓣电影top250的爬取十分类似，但是我大致...
第一个小爬虫代码
分别用urllib+beautifulsoup和request+xpath方法爬取和解析网页内容
Python学习第四天
爬取豆瓣top250电影输出结果：爬取猫眼top100 输出结果：
python爬取豆瓣电影top250
爬取豆瓣电影top250比猫眼top100复杂了一点点，这里主要使用到的工具是BeautifulSoup网页解析库...
爬取豆瓣TOP250图书榜的出版社分布(一)-urllib2
爬取豆瓣TOP250图书榜的出版社分布(一)-urllib2 0. 需求现在准备爬取豆瓣上的图书TOP250然后...
利用BeautifulSoup爬取豆瓣首页图书的详情
最近刚开始接触爬虫，在学习了BeautifulSoup包之后便想尝试着使用BeautifulSoup爬取豆瓣首页(...
【Python爬虫】BeautifulSoup爬取豆瓣电影短评
目的：爬取豆瓣【红海行动】电影的首页短评步骤： 1、使用BeautifulSoup解析网页 2、描述要爬取的东西...

网友评论

编程地带

本文标题：request + BeautifulSoup 爬取豆瓣250

本文链接：https://www.haomeiwen.com/subject/lmssxqtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

编程地带

关于我们|服务条款|联系我们|request + BeautifulSoup 爬取豆瓣250|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！