以下是我自己的看法
原因
- 加速训练,使得模型收敛更快
- 通常会使得模型达到更好的效果
原因的原因
为什么会让模型更快收敛,并且达到更好的效果呢?
- 预训练模型中的参数都是从大量数据中训练得来,比起在自己的数据集上从头开始训练参数,在预训练模型参数基础上继续训练的方式肯定要快一些。
- 预训练模型是通过海量数据训练得来,更好地学到了数据中的普遍特征,比起在自己的数据集上从头开始训练参数,使用预训练模型参数通常会有更好的泛化效果。
以下是我自己的看法
为什么会让模型更快收敛,并且达到更好的效果呢?
本文标题:为什么要使用预训练模型?
本文链接:https://www.haomeiwen.com/subject/ngduphtx.html
网友评论