d_ff由2048减小到 1024
encoder-decoder 的blocks个数都改为4
num_works = 2

epoch.40 测试结果:

epoch.60 测试结果:

epoch.80 测试结果:

transformer scheduler 学习率预热:

model_size = 256
warmup_steps = 12000
factor = 1.0


d_ff由2048减小到 1024
encoder-decoder 的blocks个数都改为4
num_works = 2
epoch.40 测试结果:
epoch.60 测试结果:
epoch.80 测试结果:
model_size = 256
warmup_steps = 12000
factor = 1.0
本文标题:减小了全连接神经元个数,调整enc-dec 的blocks数
本文链接:https://www.haomeiwen.com/subject/cqilhltx.html
网友评论