我有个基于github pages的博客,又在很多其他网站上发博客. 比如csdn . 为了避免重复操作,想用程序实现自动发博客.
今天上午就试了一下csdn这个网站
方法一-- 用api来发送博客
进入开发者文档可以看到
data:image/s3,"s3://crabby-images/c00a9/c00a92bbd8e605171e3d436ae5aa360b9cb0ee5f" alt=""
注册开发者, 使用文档中的方式获得access_token来获取授权
data:image/s3,"s3://crabby-images/dda28/dda2862f91f4bb9b33360348360a35e07e8e528e" alt=""
然后就可以post了,比如这篇文章,
data:image/s3,"s3://crabby-images/dc7ea/dc7ea99230e86c1b48135da99d33dd75f70579dc" alt=""
方法二 -- 模拟登陆
用python来模拟登陆, 为了简单,可以使用cookies来利用浏览器的会话cookie登陆
保存cookie
用chrome, 点击进入发文章的页面,可以看到
data:image/s3,"s3://crabby-images/ed94d/ed94db9e4ae8b25234305cf25d85af5a42f409df" alt=""
保存下来,等会在python脚本中使用
抓包
寻找post, 提交内容的网址, 我最开始一直以为是https://mp.csdn.net/mdeditor/
, 返回的页面是成功的
但是刷新博客页面, 并没有发表文章,
data:image/s3,"s3://crabby-images/4a559/4a5596eec7d5855ae954b6e7fcaea877fff95e4c" alt=""
后来用fiddler抓包才找到正确的网址
data:image/s3,"s3://crabby-images/ff86f/ff86f2507af9db43eb137039b7baaef47f581443" alt=""
元数据
然后构造发表的文章的元数据, 在fiddler中可以发现
data:image/s3,"s3://crabby-images/baee7/baee74a9172542b68e9afa8fd954f06990baa51d" alt=""
就是这样的一个字典,
data = {"title":"do you know my name?",
"markdowncontent":'# emm',
"content": '''<h1>hello, world~</h1>''',
"categories":"默认分类",
"channel":33,
"tags":"python",
'type':'original',
"artideedittype":1,
"private":0,
"status":0
#"id": 修改已有文章
}
那个channel就是要发表到的栏目, 可以在网页右键审查元素发现各个值的含义
data:image/s3,"s3://crabby-images/4e017/4e01795ab73bb3ef49f45e9ca3540aa319b2febb" alt=""
发表
最后就可以发送了, 第一次失败
data:image/s3,"s3://crabby-images/f2052/f2052645882c748a1f3b7f9d0805578b2ac24fb8" alt=""
显示的是unicode,, 应该打印json就行, 然后知道是标题不能为空,添加标题就可以了
尝试了多次,都成功了, 这是返回的json
data:image/s3,"s3://crabby-images/72861/72861bd3619fcd9911f0824780166fe16665c219" alt=""
由于不支持markdown, 我又下载安装了python markdown模块,可以转成html,
这样使用
def md2html(s):
exts = ['markdown.extensions.extra', 'markdown.extensions.codehilite','markdown.extensions.tables','markdown.extensions.toc']
html = '''
<html lang="zh-cn">
<head>
<meta content="text/html; charset=utf-8" http-equiv="content-type" />
<link href="http://ounix1xcw.bkt.clouddn.com/github.markdown.css" rel="stylesheet">
</head>
<body>
{mdstr}
</body>
</html>
'''
mdstr = markdown.markdown(s,extensions=exts)
return html.format(mdstr = mdstr)
这是html结果
data:image/s3,"s3://crabby-images/188c5/188c53ed36208814ccb533109579688948bb13fd" alt=""
当我沉浸在成功的喜悦中时,准备发一系列文章时, 才知道csdn有限制
data:image/s3,"s3://crabby-images/07aa6/07aa6233ea473814e0520f34a40934843dde9fdb" alt=""
QAQ
本来还想发表这些文章的
data:image/s3,"s3://crabby-images/117a2/117a2c406acdf549ffd1f3b03e4fcd6937b943f4" alt=""
那以后发吧
以下配置文件,最新完整的代码见github, 欢迎star, 如果想添加其他功能, 欢迎fork & PR
#coding: utf-8
'''************************************************************************
> File Name: config.py
> Author: mbinary
> Mail: zhuheqin1@gmail.com
> Created Time: Fri 06 Apr 2018 11:06:16 AM DST
************************************************************************'''
# python变量 配置参数
# 两者二选一
# CSDN_AUTH_DATA 在 使用api 需要在http://open.csdn.net/wiki/api/注册开发者,得到cliet_id 和 client_secret
# CSDN_COOKIE 在发博客页面获取cookie,
CSDN_AUTH_DATA = {'client_id' :'1100668',
'client_secret': '********************************',
'grant_type': 'password',
'username': 'marvellousbinary',
'password': 'R**********'
}
CSDN_COOKIE = '''
'''
# markdown 语法, 需pip install markdown
MDON = True
# xdefault configuration
DEFAULT_DATA = {
"title":"do you know my name?",
"content": '''<h1>hello, world~</h1>''',
"categories":"默认分类",
"channel":33,
"tags":"python,tag2",
}
'''
channel 各个值的含义
1:移动开发
2:云计算大数据
3:研发管理
6:数据库
12:运维
14:前端
15:架构
16:编程语言
28:人工智能
29:物联网
30:游戏开发
31:后端
32:安全
33:程序人生
34:区块链
35:音视频开发
36:资讯
37:计算机理论与基础
'''
网友评论