论文 Stacked Attention Networks for Image Question Answering 将Visual attention 机制应用到了 VQA 中,从整体来说,论文没有什么新颖的地方,也说明了以前的直接完全的 encoder-decoder 效果是不好的,很难capture到 fine details.
论文 Stacked Attention Networks for Image Question Answering 将Visual attention 机制应用到了 VQA 中,从整体来说,论文没有什么新颖的地方,也说明了以前的直接完全的 encoder-decoder 效果是不好的,很难capture到 fine details.
本文标题:stacked attention for VQA
本文链接:https://www.haomeiwen.com/subject/crrpcxtx.html
网友评论