【改进版】【聊天机器人】一个LSTM单元让聊天机器人学会甄嬛体

作者: 勇闯天涯水冰月 | 来源:发表于2017-12-09 11:26 被阅读0次

【聊天机器人】一个LSTM单元让聊天机器人学会甄嬛体
几个python做的聊天机器人项目链接
【改进版】【聊天机器人】一个LSTM单元让聊天机器人学会甄嬛体
自己动手写个聊天机器人吧
聊天机器人分类
使用TensorFlow实现Sequence to Sequen
聊天机器人
为什么微软和Facebook等巨头纷纷押宝聊天机器人？
可汗精读《自然语言处理实践》01聊天机器人概述
windows下使用word2vec训练维基百科中文语料全攻略！

小伙伴们，上一篇文章给大家介绍了如何训练甄嬛体聊天机器人。更准确地说，它不能称之为聊天机器人，应该是一个文本生成器。在上文www.jianshu.com/p/752b06546277的基础上，我做了小小的改进（其实是一个朋友帮忙^_^），让模型预测出的结果不是一个词，而是一句话。实验结果如下：

训练数据为1000时的结果截图

图中，“风波我的那一天，是个非常晴朗的日子。乾元十二年八月二十，。站”这句话为输入语句；“在在的说来每以后它惊住想的泪，流露出庄和德庄和德看不得，就是想一想聪明人”这句话为预测出的语句。

可以看到输出不是一个词，是一句话。大家一定会发现这个结果不能称之为“话”，因为它并不通顺，而且有些词重复出现。但是，在实验室的服务器上，将训练数据增加到10000条时，输出结果要比1000条训练数据好得多，语句中的词语不再重复，而且更加通顺，但那个结果我没有截图，我也不想为了截个图再花大量的时间去训练、生成了。想要告诉大家的是，这个结果通过增加训练数据是可以改善的。聪明的你也许不仅仅选择增加训练数据，甚至可以调整模型中的各种参数，达到一个更好的效果，期待大家的新思路。