想法来源
我和室友@mikipku都喜欢个人风格强烈又充满智慧的人,比较典型的,国外有YC创始人Paul Graham、「从零到一」作者Peter Thiel,国内的有王兴、纯银、来总。
王兴给人的印象是非常谨慎地公开发表言论,但有一天我发现王兴在饭否上竟然是个话唠。于是我专门下了一个「御饭」来视奸王兴的饭否,后来我俩合计可以做一个机器人,把王兴的饭否搬运到微博上,这样就能在微博上直接看了,然后说不定还能做点营销、搞个几十万粉丝啥的。产品经理就是这么容易自嗨。。。
搬运过程
上周末大概花了半天时间,写了个python脚本,配置到阿里云上线。
在微博上搜索王兴或者直接点击@王兴在饭否就可以关注啦~
完成这个机器人一共用了四个模块的东西,自己做下记录和总结
- 读饭否消息
- 发微博
- 写Python脚本
- 部署到服务器
读饭否消息
别急着搞爬虫,先看看人家是不是开放了接口 —某著名程序员
先了解下饭否支持的接口和认证方式
- 饭否接口文档目录:https://github.com/FanfouAPI/FanFouAPIDoc/wiki/Apicategory
- oauth授权:https://github.com/FanfouAPI/FanFouAPIDoc/wiki/Oauth
注意:不需要去v2ex发帖申请,直接到 http://fanfou.com/apps 申请新应用,即可获得需要的key和secret。
文档中对认证和访问流程的说明很详细,按照文档调试就行了。
有几个需要注意的地方:
- 调试oauth1.0的时候,需要的时间戳、签名、随机数等自己操作起来可能比较麻烦,可以直接用postman的Authorization调试,非常方便,令人感动
- 接口文档中的入参说明缺少了secret,在获取access token和访问接口的时候,都需要传入对于的secret
绕过几个坑以后,调试接口很快就能完成了。
这个程序只用到了一个接口:浏览用户已发消息
微博接口
微博支持的接口和认证方式
- 微博API:http://open.weibo.com/wiki/%E5%BE%AE%E5%8D%9AAPI
- 接口文档最下方说明了支持的oauth2.0认证
注意:微博的接口有一个坑,在发微博的时候,需要在headers里边加一个Content-Type,否则不成功。
headers={'Authorization':'OAuth2 2.00xxxxxxxxxxx',
'Content-Type':'application/x-www-form-urlencoded'}
Python脚本
Python脚本逻辑非常简单,从网上搜一下requests的相关文档就够用了。
- 循环读取王兴的最新一条饭否,拿到内容和id
- 如果id有更新,则把内容发一条微博;如果没有更新,等几分钟再请求一次
注意:饭否的接口年久失修,经常会超时,所以一定要处理异常。
try:
statuses=requests.get('http://api.fanfou.com/statuses/user_timeline.json',params=params)
except requests.ConnectionError:
print time.strftime("%Y-%m-%d %A %X %Z", time.localtime())+':饭否接口请求失败'
部署到服务器
我买的是阿里云的Ubuntu服务器,按流量计费,每小时0.14元。
注意两点
- 买完服务器以后,要先在网页版上开ssh服务,否则在本机登录不上去,会一直报错connection refused,蛋疼!
$:service ssh start
- 需要让脚本在后台一直执行,可以用nohup
$:nohup python wx.py &
执行后会在当前目录自动生成nohup.out文件,查看输出日志。
确认后台进程
$:ps -ef | grep python
网友评论