在真实的业务场景中,模型的训练往往需要大量标注数据才能实现理想的效果,但是,往往标注数据是不足的,而且标注的代价比较高。因此,迁移学习可以帮助处理这些场景,使机器学习在没有大量标注数据的任务域中规模化应用。
迁移学习是指利用数据、任务或模型之间的相似性,将旧领域学习过的模型,应用于新领域的一种学习过程。迁移学习方法可分为四类:
- 基于样本的迁移学习方法
- 基于特征的迁移学习方法
- 基于模型的迁移学习方法
- 基于关系的迁移学习方法
之所以需要迁移学习,主要是因为要解决以下几个问题:
-
深度学习和标注数据少之间的矛盾:目前深度学习需要在有大量标注数据的场景下,才能更好发挥它的效果。但在实际的很多场景中,我们没有足够多的标注数据;
-
通用模型与个性化需求之间的矛盾:通用模型可以解决绝大多数的公共问题,但是具体到个性化的需求,通用模型很难满足。因此,需要将通用模型加以改造和适配,使其满足个性化需求;
-
特定应用的需求:某些特定应用需求,例如:个性化推荐,通过迁移学习将相似领域的知识迁移过来。
-
强算力与弱资源之间的矛盾:一些海量数据的模型训练,需要大量的算力,一般中小型企业或个人都烧不起这个钱,因此需要让他们也能利用这些数据和模型。
网友评论