https://www.boyuai.com/elites/
Task08:文本分类;数据增强;模型微调
一、文本分类
文本分类: 把一段不定长的文本序列变换为文本的类别.
子问题:使用文本情感分类来分析文本作者的情绪,也叫情感分析。
同搜索近义词和类比词一样,文本分类也属于词嵌入的下游应用。
1、文本情感分类数据集
2、使用循环神经网络进行情感分类
3、使用卷积神经网络进行情感分类.
二、数据增强
图像增广(image augmentation)技术通过对训练图像做一系列随机改变,来产生相似但又不同的训练样本,从而扩大训练数据集的规模。图像增广的另一种解释是,随机改变训练样本可以降低模型对某些属性的依赖,从而提高模型的泛化能力。
例如,我们可以对图像进行不同方式的裁剪,使感兴趣的物体出现在不同位置,从而减轻模型对物体出现位置的依赖性。我们也可以调整亮度、色彩等因素来降低模型对色彩的敏感度。
三、模型微调
微调(fine tuning)是迁移学习中的一种常用技术。
迁移学习(transfer learning),将从源数据集学到的知识迁移到目标数据集上。例如,虽然ImageNet数据集的图像大多跟椅子无关,但在该数据集上训练的模型可以抽取较通用的图像特征,从而能够帮助识别边缘、纹理、形状和物体组成等。这些类似的特征对于识别椅子也可能同样有效。
1热狗识别例子
网友评论