如果你有想要特别关注的微博账号,但是又没有装手机微博(或者说关闭了微博的垃圾消息提醒)又不是很喜欢刷微博的人,想要第一时间获取关心的微博消息怎么办呢。
或许你可以试试这样,利用爬虫每隔一小段时间间隔就重新获取一次关注账号的微博,比对是否有新消息,如果有则发送到你的微信账号上,当然也可以发送到你的邮箱,不过微信更及时更友好点。
这个想法最早在一个python课程(很抱歉记不得是哪个课程了,记忆力太差。。)里看到,这里简单实现下。
爬虫部分利用requests库和BeautifulSoup库很容易完成爬取和解析。实现时间间隔就用最简单的睡眠(time.sleep
)。发送到微信使用itchat库发送到自己的文件助手就好了,很简单。
当然电脑端同一微信账号登录只能有一个,也就是不能同时使用该账号的电脑版微信了,解决方案是采用登录微信小号发送给大号的形式,这样消息提醒也更明确,不容易忽略。
这里打包好的可执行程序只是发送文件助手的方案。
链接:http://pan.baidu.com/s/1kVvCpvh 密码:cxza
代码github
效果图,以segmentfault微博账号为例
使用方法
输入你的cookie和要获取的微博账号uid 在对弹出的二维码微信扫码登录后就可以接收到消息了获取你的微博账户cookie
获取用户uid
找到用户的uid 如 segmentfault 为 2036070420代码
# 使用pyinstaller 一键生成可执行文件 位于dist目录下
# pyinstaller weibohelper.py --onefile
from bs4 import BeautifulSoup
import time
import requests
from requests.packages.urllib3.exceptions import InsecureRequestWarning
requests.packages.urllib3.disable_warnings(InsecureRequestWarning)
print('请输入cookie:')
cookie = input()
print('请输入uid:')
uid = input()
uids = (uid, )
headers = {
"Cookies": cookie,
"User-Agent":'Mozilla/5.0 (iPhone; CPU iPhone OS 9_1 like Mac OS X) AppleWebKit/601.1.46 (KHTML, like Gecko) Version/9.0 Mobile/13B143 Safari/601.1'
}
r = requests.session()
r.headers.update(headers)
# 获取某条微博的评论
def get_comments_from_one_weibo(id):
try:
json = r.get(
('https://m.weibo.cn/api/comments/show?'
'id={0}&page=1').format(id),
verify=False,
).json()
if json['ok'] == 1:
comments = []
for c in json['data']:
comments.append(BeautifulSoup(c['text'], 'lxml').text)
comments.append(c['user']['screen_name'])
comments.reverse()
return comments
else:
return ()
except:
return ()
# 根据用户uid获取该用户第一页的微博消息
def get_single_user_fisrt_weibo(uid):
page_num = 1
nickname = None
weibo = None
try:
json = r.get(
('https://m.weibo.cn/api/container/getIndex?'
'is_search[]=0&'
'visible[]=0&'
'is_all[]=1&'
'is_tag[]=0&'
'profile_ftype[]=1&'
'page={0}&'
'jumpfrom=weibocom&'
'sudaref=weibo.com&'
'type=uid&'
'value={1}&'
'containerid=107603{1}').format(page_num, uid),
verify=False,
).json()
except:
return None, None
if json['ok'] == 0:
print('sth wrong')
return None, None
else:
for card in json['cards']:
if card['card_type'] == 9:
weibo = [
card['mblog']['created_at'],
BeautifulSoup(
card['mblog']['text'], 'lxml'
).text.replace(' \u200b\u200b\u200b', ''),
*get_comments_from_one_weibo(
card['mblog']['id']),
]
nickname = card['mblog']['user']['screen_name'] + ' '
break # 取第一个即可
print('success for', nickname, ' - time', time.ctime())
return nickname, weibo
# 使用itchat登录网页版微信
import itchat
itchat.auto_login()
# 以小号登录形式,要先找到大号的账户
# username = itchat.search_friends(name='xx')[0]['UserName']
username = 'filehelper'
import json
from collections import defaultdict
records = defaultdict(lambda : (None, None))
while 1:
for uid in uids:
nickname, weibo = get_single_user_fisrt_weibo(uid)
try_times = 5
while nickname == None:
nickname, weibo = get_single_user_fisrt_weibo(uid)
try_times -= 1
if try_times == 0:
break
if try_times == 0:
continue
if records[nickname][1:] != weibo[1:]:
# print('发现新微博:', weibo)
itchat.send(
'\n---\n'.join((nickname, *weibo)),
toUserName=username)
records[nickname] = weibo # 记录当前微博信息
with open('data.json', 'w', encoding='utf-8') as f:
json.dump(records, f, ensure_ascii=False)
else:
print('没有新消息', time.ctime())
pass
time.sleep(120)
网友评论