本节基本上是对前两个单元的一个回顾,我们记得之前介绍RNN基础模型的时候,假设输入与输出的对象个数不等时,会使用一个先输入,后输出的模型。

模型的前半部分用于解码,后半部分用于编码。这个模型在大部分的机器翻译当中运作的效果都不错,但是可能没有办法达到最精准的效果。

RNN还经常会被用于图像的描述,此时输入的变量就变成了一个图像。我们在图像输入端后面建立一个Alexnet,然后在最后保留一个4096的全展开层,把这个4096维的向量输入到一个RNN模型里,然后逐个得出图像的语言描述。
这两个模型在生成Y的时候,有一个注意点是,要把前面生成的Y值输入到下一个生成单元当中,这样才能让他受到前面一个词的影响。
这些基础模型的效果都还不错,但是没有办法达到非常地精准,如果需要进一步的改善模型,要做一些其他的工作。
网友评论