爬虫--豆瓣读书TOP250书籍

爬虫--豆瓣读书TOP250书籍

作者: 白洞_set | 来源:发表于2018-03-31 14:36 被阅读0次

爬虫--豆瓣读书TOP250书籍
Python学习
练习：豆瓣电影TOP250爬虫
Python第三天（spider_豆瓣）
Python爬虫实战，requests模块，抓取豆瓣读书Top2
豆瓣爬虫实践-python版
爬虫课程（十一）｜知乎：使用Scrapy模拟登录知乎
爬虫爬取豆瓣top250
Python学习
Python爬虫之多线程下载豆瓣Top250电影图片

练手系列，直接上代码

import requests
import time
from lxml import etree

with open('C:\\Users\\HY\\Desktop\\book_douban.csv','w',encoding = 'utf-8') as f:
    for a in range(10):
        url = 'https://book.douban.com/top250?start={}'.format(a*25)
        data = requests.get(url).text
        s = etree.HTML(data)
        
        book = s.xpath('//*[@id="content"]/div/div[1]/div/table')
        time.sleep(3)
        for div in book:
            title = div.xpath('./tr/td[2]/div[1]/a/@title')[0]
            href = div.xpath('./tr/td[2]/div[1]/a/@href')[0]
            score = div.xpath('./tr/td[2]/div[2]/span[2]/text()')[0]
            num = div.xpath('./tr/td[2]/div[2]/span[3]/text()')[0].strip("(").strip().strip(")")
            scribe = div.xpath('./tr/td[2]/p[2]/span/text()')
                    
            if len(scribe) > 0:
                f.write('{},{},{},{},{}\n'.format(title,href,score,num,scribe[0]))
                
            else:
                f.write('{},{},{},{}\n'.format(title,href,score,num))

输出情况如图（数据过多，截取部分）

TOP250图书信息.png

相关文章

爬虫--豆瓣读书TOP250书籍
练手系列，直接上代码输出情况如图（数据过多，截取部分）TOP250图书信息.png
Python学习
python爬虫(五) python爬虫爬取豆瓣电影Top250数据利用python爬取豆瓣电影TOP250页面...
练习：豆瓣电影TOP250爬虫
练习：豆瓣电影TOP250爬虫（优化）
Python第三天（spider_豆瓣）
豆瓣top250电影爬虫未完待续/...
Python爬虫实战，requests模块，抓取豆瓣读书Top2
前言今天为大家带来利用Python爬虫抓取豆瓣读书Top250，废话不多说。 Let's start happi...
豆瓣爬虫实践-python版
豆瓣登录，无验证码版：豆瓣TOP250电影爬虫 python，生活因你而精彩！
爬虫课程（十一）｜知乎：使用Scrapy模拟登录知乎
前面爬虫课程七、八、九、十，我把爬虫豆瓣读书的爬虫讲解完毕啦，我们很顺利地爬取了豆瓣读书书籍内容，爬取过程中也不需...
爬虫爬取豆瓣top250
爬虫爬取豆瓣top250并保存到mongoDB数据库中
Python学习
python爬虫(四) python爬虫爬取豆瓣电影数据今天我们爬取一下豆瓣电影TOP250页面电影的数据，依然...
Python爬虫之多线程下载豆瓣Top250电影图片
爬虫项目介绍本次爬虫项目将爬取豆瓣Top250电影的图片，其网址为：https://movie.douban...

网友评论

本文标题：爬虫--豆瓣读书TOP250书籍

本文链接：https://www.haomeiwen.com/subject/pzvgcftx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|爬虫--豆瓣读书TOP250书籍|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！