美文网首页
继续爬bilibili那些高评分动漫

继续爬bilibili那些高评分动漫

作者: 糕糕python | 来源:发表于2018-11-19 17:15 被阅读0次

前言

千里之行始于足下,随着爬取深入发现了一些问题,而且数据还爬少了一个,因此花了几个小时完善了上次bilibili的爬取任务

修改内容

1.增加一条记录新番的开播日期
2.增加一个读写功能到本地
3.修复编码问题的bug
4.规整翻页等方法

import requests
import re
import time
def bilibili_score(page_number,numbers):   #获取动漫信息
    url =f"https://bangumi.bilibili.com/media/web_api/search/result?season_version=-1&\
    area=-1&is_finish=-1&copyright=-1&season_status=-1&season_month=-1&pub_date=-1&\
    style_id=-1&order=4&st=1&sort=0&page={page_number}&season_type=1&pagesize=20"
    header ={'user-agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.99 Safari/537.36'}
    urlget = requests.get(url,headers = header) #伪装浏览器
    bilibili_text = urlget.text
    compile = re.compile("play\":\"(.*?)\",\"pub_date\":(.*?),\".*?,\"score\":\"(.*?)\".*?,\"title\":\"(.*?)\"}") #爬取的正则,追加开播日期
    bilibili_hot = re.findall(compile,bilibili_text)
    return bilibili_Animation(bilibili_hot,numbers)
def page(numbers):   #这个函数是为了实现翻页功能
    for page_number in range(1,numbers):
        bilibili_score(page_number,numbers)
def bilibili_Animation(bilibili_hot,numbers): #这个是用来写入本地txt存取数据的
    for item in bilibili_hot:
        try:
            if item:
                with open(f"bilibilihot{numbers}", "a",encoding="gbk2312") as bilibili_text:
                    bilibili_text.write(str(item))
                    bilibili_text.write("\n")
        except:
            if item:
                with open(f"bilibilihot{numbers}", "a",encoding="utf-8") as bilibili_text:
                    bilibili_text.write(str(item))
                    bilibili_text.write("\n")
def datetime(bilibili_hot): #需要把时间戳转换为年月份,暂时没写进循环中
    timeStamp = int(str(bilibili_hot[2]))
    timeArray = time.localtime(timeStamp)
    otherStyleTime = time.strftime("%Y年%m月%d日 %H:%M:%S", timeArray)
    print(otherStyleTime)
    return otherStyleTime

if __name__ == '__main__':
    page(5)

在记事本中是这个样子的


本地数据

相关文章

  • 继续爬bilibili那些高评分动漫

    前言 千里之行始于足下,随着爬取深入发现了一些问题,而且数据还爬少了一个,因此花了几个小时完善了上次bilibil...

  • 爬一爬bilibili里面最高评分的动漫

    前言 心血来潮想扒一扒B站那些最热的动漫,也算是准备为接下来准备学习的数据统计铺垫,目标站点bilibili,走你...

  • 《异度侵入》剧情与评论

    作者:明珠 日本动漫《异度侵入 》豆瓣评分9.4,bilibili评分9.9 以下都是我自己打字的 基本设定: 人...

  • 搞笑动漫推荐—《汉化日记》

    《汉化日记》这部搞笑动漫由 Bilibili独播,目前已完结,在B站评分高达9.8。其主要角色及声优大大有:苏莫婷...

  • 爬bilibili弹幕

  • 评分爬虫

    环境介绍 为了让两位自认为阅漫无数的同学对自己的动漫观看质量有数据量化的评判,近日基于爬虫实现了对动漫评分的爬取。...

  • Selenium小例子

    爬取腾讯动漫 爬取某网站漫画 爬取拉勾网

  • 电影日记13 《你的名字》

    bilibili的诚意 在bilibili混了这么多年,看过不少美剧、动漫、电影,总算有一次正经的会员福利,虽然抢...

  • Bilibili高仿项目

    之前写了v2ex的客户端,发现写的人实在太多,就只写到1.0版本。现在想写个有点挑战性项目,所以就写Bilibil...

  • 我的动漫评分

    RT,大概是按照时间顺序,同一部番的不同季会不按时间放在一起,也包含了日本动画电影,宫崎骏没有包括,只是对于评分和...

网友评论

      本文标题:继续爬bilibili那些高评分动漫

      本文链接:https://www.haomeiwen.com/subject/heeafqtx.html