- 对于输入Q,从QA库中检索出最接近的k个(q,a)对,其中检索模型(IR)基于BM25,并经过了去停用词等预处理
-
对每个候选的(Q,a)对进行评分,其中评分模型(Answer Rerank)采用预训练的seq2seq(与2中相同)计算字符串出现的平均概率:
- 如果2中得到的最高评分大于阈值T,最直接输出得到最高评分的候选答案a;否则,从4的模型中生成答案
- 生成模型基于采用带attention的seq2seq,论文中采用的cell是GRU,并强调了自己采用了bucketing、padding、sampled softmax、beam search(top10) decoder(赤裸裸的灌水。。。)
seq2seq模型如图,h、s分别是encoder和decoder的状态,encoder之后叠加了attention机制,很基本的模型,严重怀疑训练样本的质量太高堆砌出了这样一篇大水文。。。
网友评论