美文网首页工具
[小工具][Python爬虫]一键完整备份你的Csdn博客文章(

[小工具][Python爬虫]一键完整备份你的Csdn博客文章(

作者: 蛮三刀酱 | 来源:发表于2019-08-04 20:13 被阅读2次
    TIM截图20190804201139.png

    前言

    一直想将自己的Csdn博客完整地备份到本地,以免一些老文章以后落得个404(打不开)的下场。

    每家的博客或多或少都有一些博客备份的功能(例如简书在设置中能够打包自己的所有md文章,但是不支持图片导出)。

    然而Csdn在这方面一直做的不够好,好几次想做备份,都想不到好的解决方案,无奈只能寻求Github的帮助。最近,在众多杂七杂八的库中,终于让我找到了一个接近完美的解决方案:CAB-Tool。

    本工具出自他人之手,我只修复了一个小Bug,由于工具确实能够完整备份我的260+博客,没有出现账号异常或者是中途中断的情况,故诚心推荐给有需要之人,也希望大家可以完善工具,多提issue和pull request。

    CAB-Tool

    Github地址:

    https://github.com/SnailMann/CAB-Tool

    简介

    摘自 README.md

    CAB Tool 就是csdn-article-backp-tool,只是我有点懒,不想打这么长,还能顺便装的一手好逼 (狗头)

    功能:

    • 支持批量备份markdown语法写的csdn博客
    • 支持备份博客图片(兼容markdown语法,html语法)
    • 支持两种使用方式,便于没有python基础的同学使用

    注意:

    • 目前不支持备份私密文章,只能备份自己的公开文章
    • 需要登录账户密码(markdown编辑器的爬取需要cookies)
    • CAB Tool 直接爬取的是csdn markdown编辑器的文本,备份的文本与编辑器上无异

    使用

    方式一

    如果你是没有任何python基础的同学,或是懒得安装py环境。没有关系,这里也是支持小白式运行的

    • 点击cab-tool releases,下载cabtool.exe的最新版本
    • 双击运行cabtool.exe就好啦

    方式二

    第一步

    • 把项目克隆本地git clone git@github.com:SnailMann/CAB-Tool.git
    • 确保本地有python3的环境, 并且可以使用pip安装依赖
    • 进入项目目录,命令行输入pip install -r requirements.txt,使用pip安装py项目的必要依赖

    第二步

    • 打开setting.yaml配置文件
    • 按照yaml规范填写CSDN的账号密码
    • 按照yaml规范在download-path填写本地导出地址,不填默认为D:\csdn-blog-backup
    • 按照yaml规范在download-img填写是否开启图片备份 TrueFalse
    • 按照yaml规范在sleep-time填写备份文章的时间间隔,单位是s,默认是1s。若非有需要,不建议改动

    第三步

    • 确认配置无误后
    • 项目路径打开命令行,输入py main.py

    效果

    cab-tool.gif 123.gif

    完整备份了230+markdown:

    image.png

    后记

    如果大家还发现什么好用的,好玩的工具,都可以推荐给我试试,哈哈哈哈。

    关注我

    我目前是一名后端开发工程师。主要关注后端开发,数据安全,网络爬虫,物联网,边缘计算等方向。

    微信:yangzd1102

    Github:@qqxx6661

    个人博客:

    原创博客主要内容

    • Java知识点复习全手册
    • Leetcode算法题解析
    • 剑指offer算法题解析
    • SpringCloud菜鸟入门实战系列
    • SpringBoot菜鸟入门实战系列
    • 爬虫相关技术文章
    • 后端开发相关技术文章

    个人公众号:Rude3Knife

    个人公众号:Rude3Knife

    如果文章对你有帮助,不妨收藏起来并转发给您的朋友们~

    相关文章

      网友评论

        本文标题:[小工具][Python爬虫]一键完整备份你的Csdn博客文章(

        本文链接:https://www.haomeiwen.com/subject/bnaydctx.html