缩放律与模型架构:归纳偏置如何影响缩放?2023-08-27 14:39
浏览全文阅读(0)好评(0)
UL2:统一语言学习范式2023-08-20 17:11
浏览全文阅读(0)好评(0)
大语言模型的涌现能力2023-08-17 14:42
浏览全文阅读(0)好评(0)
用0.1%的额外计算超越缩放定律2023-08-20 14:05
浏览全文阅读(0)好评(0)
预训练指南:测量数据年龄、领域覆盖率、质量和毒性的影响2023-08-15 10:22
浏览全文阅读(0)好评(0)
自回归生成建模的缩放律2023-08-13 14:26
浏览全文阅读(0)好评(0)
神经语言模型的缩放律2023-08-13 14:25
浏览全文阅读(0)好评(0)
DoReMi:优化数据混合加速语言模型预训练2023-08-08 14:24
浏览全文阅读(0)好评(0)
LoRA微调2023-07-30 10:14
浏览全文阅读(0)好评(0)
LIMA: Less Is More for Alignment2023-05-24 09:44
浏览全文阅读(0)好评(0)