最近,“夸夸群” 彻底火了...... 在夸夸群里,无论你说什么,心情再差、遇到的事情再丧,都能求夸,就连打个“哈哈哈哈哈”都能得到一票人众星捧月般的夸奖。
各种不着边际的求夸,加上各种搞笑的吹捧,让人们深陷大型彩虹屁夸夸现场无法自拔。各种职场、各大高校的夸夸群也异常火爆。
这种夸夸服务,在电商平台,也是遍地开花。平均5分钟20块钱的付费服务,每天都有近千位客户咨询,商家日赚千元并不是难事。
可是......你有没有发现,夸夸群里的“夸夸词”,基本上都大同小异?夸来夸去,其实也就是差不多的那些话?
就连夸夸群淘宝卖家也开始呼唤 AI 夸夸机器人赶紧出现,表示夸夸服务已经售罄,求夸的客人甚至多到夸不过来!
万能的网友们开始大显身手。要花钱进夸夸群?等等,还不如自己用 Python 代码写个夸夸机器人,个性化夸人、终生陪伴左右,想想都心动。
朋友们欢呼吧,夸夸机器人,已经出现!
先来看看机器人的夸夸效果:
夸夸机器人背后的核心技术是自动问答,这也是自然语言处理的四大难题之一。虽然通用领域的智能问答或者聊天机器人还有很长的路要走,但是如果把这个问题限定在垂直领域或者很小的需求范围,那么问题就很容易解了,例如夸夸聊天机器人,需求就很简单:说啥都夸。
简单的实现方式就是随便夸,只需要准备一些通用夸奖的语料,然后随机夸;复杂一点或者个性化的就是夸某个点、某件事、某个人,这种情况除了夸夸语料库外,还需要准备一些夸夸规则。
开发夸夸机器人,数据太关键了,确切的说,是面向特定任务的特定数据。现在不缺机器学习框架,不缺算法,不缺机器,甚至不缺“人”,缺什么,就缺数据。研发夸夸机器人,夸夸语料库必不可少。
豆瓣上有很多夸夸小组,貌似最大的莫过于“相互表扬小组”,最近因为这股夸夸风,据说这个小组已经开始限制加入新人了,网友 AINLP 针对这个小组写了一个小爬虫,爬了一份夸夸语料,总计2万6千多个帖子,采集了标题、内容和回复的相关信息,保存为json格式,1个帖子1条,大概是这样的:
随机夸的“中文夸夸语料库”大概是这样的:
<pre class="" style="margin: 1.71429rem 0px; padding: 1.71429rem; max-width: 100%; box-sizing: border-box !important; overflow-wrap: break-word !important; border-width: 1px; border-style: solid; border-color: rgb(237, 237, 237); font-size: 0.857143rem; vertical-align: baseline; overflow: auto; line-height: 1.71429; color: rgb(102, 102, 102); background: transparent !important; width: auto !important; float: none !important; clear: none !important; box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px !important; border-radius: 0px !important;">In [1]: import random
In [2]: from util import zan_list
In [3]: print(random.choice(zan_list))
您目光深邃,一看您就是一位有思想的人。
In [4]: print(random.choice(zan_list))
从您的言谈中可以看出,
我今天遇到的是很有修养的人。
In [5]: print(random.choice(zan_list))
别开玩笑了,看您的容貌,肯定不到二十岁。
In [6]: print(random.choice(zan_list))
这么魁梧的身材,潇洒的外表,
不是大老板才怪了呢!
In [7]: print(random.choice(zan_list))
您一看就是大富大贵的人
In [8]: print(random.choice(zan_list))
我真佩服您的头脑,多少别人办不成的事,
您一到便迎刃而解。
In [9]: print(random.choice(zan_list))
您的语调独特,言谈话语中充满了感染力。
In [10]: print(random.choice(zan_list))
听君一席话,胜读十年书,
今天与您交谈,我受益匪浅。
In [11]: print(random.choice(zan_list))
您一看就是大富大贵的人
In [12]: print(random.choice(zan_list))
您真幽默,话从您口中说出来就是不一样。
In [13]: print(random.choice(zan_list))
这么魁梧的身材,潇洒的外表,
不是大老板才怪了呢!
</pre>
据说,经常被夸的朋友,运气会越来越好哦。后台回复“夸夸”,即可扫码体验 AINLP 的夸夸机器人。
——/参考来源/——
AINLP(微信:nlpjob):
网友评论