美文网首页
爬取豆瓣新书速递

爬取豆瓣新书速递

作者: 再见理想冷雨夜 | 来源:发表于2018-03-29 14:20 被阅读35次

这个爬虫比较简单,一个固定URL,数据获取也比较有规律。最后是把获取到到书名、简介、评分、作者出版社信息写入本地的一个文件中

# coding:utf-8
import requests
from bs4 import BeautifulSoup
import sys  
  
reload(sys)  
sys.setdefaultencoding('utf8')   

def get_latest_book():
    url='https://book.douban.com/latest?icn=index-latestbook-all'
    response=requests.get(url)
    bookList=[]
    soup=BeautifulSoup(response.content,'html.parser')
    bookNameList=soup.select('.article .detail-frame a')
    bookRateList=soup.select('.article .color-lightgray')
    bookInfoList=soup.select('.article .color-gray')
    bookDetailList=soup.select('.article .detail')
    for v in range(len(bookNameList)):
        bookDict={}
        bookDict={
            'bookName':bookNameList[v].text,
            'bookRate':bookRateList[v].text,
            'bookInfo':bookInfoList[v].text,
            'bookDetail':bookDetailList[v].text
        }
        bookList.append(bookDict)
    return bookList

def write_file():
    with open('豆瓣新书速递.txt','w+') as f:
        bookList=get_latest_book()
        for book in bookList:
            bookName=book['bookName']
            bookRate=book['bookRate']
            bookInfo=book['bookInfo']
            bookDetail=book['bookDetail']
            f.write(bookName)
            f.write(bookRate)
            f.write(bookInfo)
            f.write(bookDetail)
        print '数据写入完毕'  
        
write_file()

相关文章

  • 爬取豆瓣新书速递

    这个爬虫比较简单,一个固定URL,数据获取也比较有规律。最后是把获取到到书名、简介、评分、作者出版社信息写入本地的...

  • Python爬虫项目 -- 爬取豆瓣读书新书速递并按出版日期排名

    目的:爬取豆瓣读书/新书速递这一页下所有的书名、作者、出版社和出版日期,并依据出版的先后时间对书名进行排序思路分析...

  • Python-爬取数据实践

    本文以爬取豆瓣网新书列表为例。备注:为了豆瓣网服务器的正常运行,请读者仅将此文作为学习之用。 最后爬取的数据以cs...

  • 2019-06-28 爬豆瓣新书速递

  • 爬虫代码集

    一、简单爬取猫眼(使用字符串) 二、简单爬取豆瓣(使用XPATH) Beautiful Soup爬取

  • Node puppeteer 爬虫

    puppeteer 中文文档 开始 爬取豆瓣书籍列表 豆瓣读书 在这个页面输入javascript,然后爬取列表案...

  • 爬虫案例

    实战巩固 爬取搜狗指定页面的数据-待完成 爬取破解百度翻译 爬取豆瓣电影分类排行榜 爬取肯德基餐厅查询地址 爬取国...

  • Python爬取豆瓣电影TOP250

    爬取目标 爬取豆瓣电影TOP250信息并简单分析 爬取网址为https://movie.douban.com/to...

  • scrapy爬取豆瓣电影

    scrapy爬取豆瓣电影,存储在MongoDB 本节分享用的Scrapy爬取豆瓣电影Top250的实战。 本节要实...

  • Python学习

    python爬虫(五) python爬虫爬取豆瓣电影Top250数据 利用python爬取豆瓣电影TOP250页面...

网友评论

      本文标题:爬取豆瓣新书速递

      本文链接:https://www.haomeiwen.com/subject/jopmcftx.html