当 Python 遇到了你的微信好友

作者: 919b0c54458f | 来源:发表于2019-04-21 22:08 被阅读8次

    次我们直奔主题,本文要做的是以下几件事:

    1. 分析微信好友的总人数、男生数、女生数、男女比
    2. 分析好友的地域分布
    3. 利用 自然语言处理 的方法分析出你好友的情感倾向
    4. 获取微信好友的头像并拼接成指定图片

    准备

    还是老样子,做实验前,先做好准备工作,实验环境如下:

    • Python 3.6 (虚拟环境的管理为Pipenv)
    • Pycharm
    • 主要使用到的包有:
    • itchat
    • pyecharts
    • baidu-aip
    • photomosaic
    • pillow

    对Pipenv这个虚拟环境管理工具不熟悉的可以去看我之前的文章: 《Python 管理哪家强?》,里面对于 Pipenv 这个虚拟环境管理工具有一些介绍。

    itchat是一个开源的微信个人号接口,可以让我们使用python来调用微信

    pyecharts是python+echarts的结合,用于进行数据的可视化

    baidu-aip是百度推出的一个nlp的包

    photomosaic是用来生成蒙太奇马赛克图片的

    大家获取到源码之后只需要将 Pipfile 复制到你们的项目根路径下,然后再终端执行 pipenv install 即可创建一个安装好所有包的虚拟环境了(前提是你的电脑上已经安装了pipenv了)

    做好准备工作后我们就开始吧。

    Python学习群:556370268,有大牛答疑,有资源共享!有想学习python编程的,或是转行,或是大学生,还有工作中想提升自己能力的,正在学习的小伙伴欢迎加入学习。

    开始

    1. 初始化 itchat

    只需一行代码即可初始化 itchat:

    itchat.auto_login(hotReload=True)
    
    

    hotReload(热加载),True表示其短时间内不需要再次扫码登陆

    2. 获取好友列表

    同样的也只需要一行代码即可获取:

    friends = itchat.get_friends(update=True)[0:]
    
    

    返回的数据是类 JSON 格式的,我们用 Python可以很方便的解析,因为篇幅原因,返回的示例我就不展示了,你们自己输出查看就可以了。

    3. 分析男女分布情况

    首先我们需要获取好友的性别信息,通过分析返回的 JSON 字符串我们发现,在好友的信息中有 Sex 标签,其规律是当其值为1是表示男生,2表示女生,0表示没有填写的,因而我们可以这样

    # 对好友数进行分析
    def analyze_friends_num(friends):
     # 初始化性别的变量(男、女、其他,其他表示的是注册时没有填写性别信息的)
     male = female = others = 0
     # 循环得到的全部好友
     # 在好友的信息中有Sex标签,发现规律是当其值为1是表示男生,2表示女生,0表示没有填写的
     for i in friends[1:]:
     sex = i['Sex']
     if sex == 1:
     male += 1
     elif sex == 2:
     female += 1
     else:
     others += 1
     # 总人数
     total = len(friends[2:])
     print("总人数为", total, "其中男性", male, "人,女性", female, "人,男女比为", round((male / female), 2), ":1")
    
    

    执行的结果为:

    总人数为 387 其中男性 228 人,女性 116 人,男女比为 1.97 :1
    

    更加直观的显示如下(可视化的代码在 utiils 包下,这里就不放出了,有需要的自己看源码):

    image

    我的好友里男女比竟然是 2:1(那些没填性别信息的人里面不知道还有多少男生),活该没有女朋友啊,看来下次要多加一些女生的微信了。
    4. 好友地域分布

    这里我们只要获取到好友的地域信息,然后用两个 dict (分别是省和市)保存即可,key 为地域, value 为该地域的好友数,循环遍历 friends 最后用饼图表示分布最多的5个省,用柱状图表示分布最多的15个市,代码如下:

    # 分析好友的地域分布
    def analyze_friends_location(friends):
     province = {}
     city = {}
     for i in friends[1:]:
     if i['Province'] == '':
     i['Province'] = '其他'
     if i['City'] == '':
     i['City'] = '其他'
     province[i['Province']] = province.get(i['Province'], 0) + 1
     city[i['City']] = city.get(i['City'], 0) + 1
     sorted_province = sorted(province.items(), key=lambda item: item[1], reverse=True)
     sorted_city = sorted(city.items(), key=lambda item: item[1], reverse=True)
     # 画出分布图
     draw_friends_location(sorted_province[0:5], sorted_city[0:15])
    
    

    结果如下:

    image image

    看到这大家应该也能猜到我主要的活动区域是哪了吧,有兴趣的大家可以猜一猜然后在文末留言哦。

    5. 好友情感分析

    当你想要了解一个人心态(注意是心态而不是动态)的时候,你往往都会去看他的签名而不是朋友圈,因为签名更改的频率很低,很大程度上会反映这个人的情绪和心态。相比之下,朋友圈更新的频率较高,因为是要分享自己近期的动态的(我就见过有的女生一条朋友圈分成好几条发,每次只发几个字)。因此对好友的签名进行分析是可以分析出她的情绪的,那么我们该如何分析情感呢?

    这里实名夸奖一下百度,作为国内技术的老大哥,很久之前百度就已经 免费开放 了他的一些人工智能接口,其中就有情感倾向分析,官网是 ai.baidu.com/tech/nlp_ap… ,这些 免费的 人工智能接口的开放对于我们这些个人开发者无疑是个福音。下面是他的功能演示截图:

    image

    他的用法也很简单,安装好 baidu-aip 包之后,申请下appkey、appid和secretkey后即可使用:

    client = AipNlp(APP_ID, API_KEY, SECRET_KEY)
    def analyze_text(text):
     res = client.sentimentClassify(text.strip())
     return res['items'][0]['sentiment']
    
    

    因此我们要做的无非就是获取好友的签名,然后传入 analyze_text 函数即可:

    # 分析好友的签名
    def analyze_friends_signature(friends):
     positive = 0
     negative = 0
     others = 0
     print('签名情感分析中,请稍后......')
     for index, item in enumerate(friends[1:]):
     text = item['Signature']
     if text != '':
     try:
     print('正在分析第', index, '条签名:', text, '他的作者是:', item['NickName'], '你给他的备注是:', item['RemarkName'])
     res = analyze_text(text)
     if res == 0:
     negative = negative + 1
     if res == 1:
     others = others + 1
     if res == 2:
     positive = positive + 1
     except:
     continue
    
    

    看到这有人会有疑问了,我的好友人数有上千,免费的接口能用这么多次吗?事实上,他真的可以用这么多次:joy:

    image

    看到这我突然想给百度打call,这也太良心了吧。请问贵公司还缺实习生吗,我想去应聘:joy:。然后我们来看看我的好友的情绪分析图吧。

    image

    没想到我的好友里面竟然还有17.83%的人有消极情绪,看来必要的时候得"we need to talk"了。

    Python学习群:556370268,有大牛答疑,有资源共享!有想学习python编程的,或是转行,或是大学生,还有工作中想提升自己能力的,正在学习的小伙伴欢迎加入学习。

    6. 利用好友的微信头像生成指定的照片

    看标题你们可能不懂是什么意思,直接放图你们就明白了:

    image

    这张图远看是一张一个人跳舞的图片,其实仔细看就知道了,构成这张图的是我的 300 多张微信好友的图像,这里我使用到了一个名为 photomosaic 的库,它是专门用来制作这种蒙太奇马赛克风格的图片的,是我无意中在知乎上看到的,所以大家有事没事还是逛逛知乎,多少能发现些好玩意。

    接下来我们来看看如何生成上述图片。

    第一步,我们先获取好友的头像:

    # 获取好友头像
    def get_friends_avatar(friends):
     for index, item in enumerate(friends):
     print("正在下载第 %d 张头像" % index)
     img = itchat.get_head_img(userName=item["UserName"])
     file_image = open(os.getcwd() + "/app/temp/" + item["UserName"] + ".jpg", 'wb')
     file_image.write(img)
     file_image.close()
    

    也很简单,直接调用itchat的 get_head_img 方法然后保存到本地指定文件夹下即可。

    第二步,利用photomosaic生成目标图片

    # 利用好友头像生成蒙太奇马赛克图片
    def draw_friends_mosaic_image():
     # 读取基准图,即要生成的蒙太奇马赛克图片的原始图
     image = pm.imread(os.getcwd() + '/assets/cxk.jpg')
     # 定义图片库
     pool = pm.make_pool(os.getcwd() + '/temp/*.jpg')
     # 制作50*50的拼图马赛克,(50, 50)是指每一行和每一列使用图片库中的图像的个数
     mosaic = pm.basic_mosaic(image, pool, (50, 50))
     # 保存制作好的图片
     pm.imsave(os.getcwd() + '/output/friends_mosaic_image.jpg', mosaic)
    

    四行代码即可,原理的话知乎上有写,有兴趣的可以自己去搜一搜。

    当然了,不是每个人的微信好友都有上千人,所以拼接出来的效果就不是很好,比如我自己的那个就不是很好,既然这样的话我就推荐另一个拼接头像的方法,不过效果要稍微差点,拼成的图长这样:

    image

    这张图虽然观赏效果不如上一张,但好在每个头像都很清楚,大伙儿看看能不能快速找到自己的头像呢?

    相关文章

      网友评论

        本文标题:当 Python 遇到了你的微信好友

        本文链接:https://www.haomeiwen.com/subject/ltesgqtx.html