在之前我们讲到的神经网络模型当中,输入和输出的长度是相同的。但是在实际的应用当中,有些序列模型所需要的输出跟输入的长度不一样,那么我们就要学习一些不太一样的神经网络模型。
比如说我们之前提到的,创作音乐的模型,和翻译的模型等等,都是输入跟输出不等长的例子。
在这里我们使用到的模型源自于一个博客:http://karpathy.github.io/2015/05/21/rnn-effectiveness/
在这里我们对使用的模型进行了几个分类:
many-to-many:也就是我们之前提到的那个模型,多个输入量对应多个输出量(输出与输入的长度不一定相等)。
many-to-one:多个输入量对应一个输出量,这个输出量的位置就在输入量的末尾,获取了所有信息之后做出判断。
one-to-many:单个或者无输入,但是有多个输出变量,这个适用于音乐生成或者是其他的序列应用当中。
当many-to-many的长度不相等时,在前面输入的RNN当中没有y的输出,当完成了输入之后,再后面继续接上y的输出。(虽然我觉得这样有点奇怪,不知道怎么获取它前面所得到的信息)
除了这三种之外,还有一种叫做注意力模型,会在第四周的课程当中讲到。
对于序列模型的各种分类我们基本上都已经了解了,但是对one-to-many这种模型,我们还有一些细节需要讨论,在下一节课当中我们会讲到。
网友评论