各种Transformer改进
Relative Positional Encoding for Transformers with Linear...[作者空间]
传送一下知乎 “原来你还关注了这个专栏”“这个博主还能敲键盘呀” 没错,时隔半年,终于终于要更新了 ?(主要是我太...[作者空间]
Transformer-XL是为了解决Transformer 对于Long-term 依赖问题而提出来了,那么Tr...[作者空间]