Raise a Child in Large Language

作者: 吹洞箫饮酒杏花下 | 来源:发表于2021-11-10 20:23 被阅读0次

Raise a Child in Large Language
牛津通识读本|Psychology 09
#馨安百日英语计划##Day46/100#
阅读：Large-Scale and Language-Obli
《python编程自动上手》笔记5 调试
今日之记英英释义词汇20个：raise-recycle
我们怎样“举起”孩子？
《走钢丝的人》：站在万众之巅，我只想走回钢丝
冀教版八年级下册五单元重点
raise

背景：基于大规模的语言模型。在pretrain-fineTuning两阶段的范式下，pretrain 阶段，数据量较大，学习到的知识泛化能力较强。fine tuning阶段的数据往往是少量的。以前的工作，通常倾向aggressive。理解为，完全信任新数据，由小数据量的任务完全决定模型参数的更新。在这个过程中，很可能导致了过拟合，而使得效果下降或泛化能力的降低。

方法：为了延续模型的泛化能力，可通过只更新模型的一部分参数（子网络）来达到保留pretrain阶段学习到的知识，提高泛化能力的效果。而对于子网络的选择，分为随机及主动选择两种方式，即“任务无关”和“任务驱动”两种方式。其中，主动选择的方式重点在于以什么标准定义参数对于任务的重要程度。

任务无关：以一定比例，随机选择参数进行更新。