- 原来是直接将每个位置的
hidden state
直接过个全连接得到分类结果。 - 这个是先将每个位置和最后一个
hidden state
算一个self-attention
然后再过一个全连接。
hidden state
直接过个全连接得到分类结果。hidden state
算一个 self-attention
然后再过一个全连接。本文标题:基于self-attention的每个位置分类
本文链接:https://www.haomeiwen.com/subject/vuqqzqtx.html
网友评论