美文网首页
CNN文本分类

CNN文本分类

作者: Max_7 | 来源:发表于2019-02-25 11:36 被阅读0次

概述

CNN文本分类,是将CNN处理图像的思路移植到文本问题上。具体的理论可以阅读‘Convolutional Neural Network for Sentence Classification ’。

结构

text-CNN 文本分类器一共有4层。 分别是 input layer, convolutional layer, pooling layer 和 soft-max layer。

输入层

input layer实际上是一个embedding layer,有4种嵌入方法。
1.CNN-rand, 完全的随机初始化词向量矩阵,通过BP不断更新。
2.CNN-static,迁移学习,直接那别人训练好的模型来用。
3.non-static,拿别的模型来初始化最初的向量矩阵,在随后的训练中fine-tuning。
4.multiple channel,这个类似图像处理中的RGB通道,设置不同的通道,每个通道使用一种嵌入方法。

卷积层

整体的流程如上图所示(图片来源于开头所提的论文)。当前的句子为‘wait for the video and don't rent it’. 把一句话当成一张图片,那么每一个字占据一行。整个句子的大小为nd。假设n为句子长度,d为 词嵌入的维度。
对于每一个卷积核而言,其大小为t
d。 t可以根据具体的需求设定不同的值,但是对于d的值必须要和词嵌入的维度保持相同。与图片的卷积核的行为相比,文本CNN的卷积核只有上下的移动,没有左右的移动。
与图片相比,文本信息的一个不同是大小不一样。连续10句话可能长度各不相同。这里对于句子有一个长度的处理,将所有的句子做定长处理。太长的截断,太短的补0。这里补0并不影响后续,因为在max-pooling层的时候,这些0都会被忽略掉。

以上图为例,对于一个单一的卷积核,在经过卷积后,得到一个列向量,经过max-pooling后会得到一个标量。针对这个情况,有两个解决方案。
1.使用多个filter_size。设置不同大小的卷积核,可以看成和n-gram类似的情况,n取多个不同值。
2.对于同一个filter_size,设置多个filter。
这两步的个人感性理解是对于一个句子看不同的长度,相同长度的句子又从不同的角度考量。
以上全部的卷积核,每一个经过max-pooling层之后都是一个标量,这些标量全部组合成一个列向量,作为输入进入最后的softmax层。

相关文章

  • 卷积神经网络CNN的文本分类原理和实战

    基于卷积神经网络CNN的文本分类原理和实战 前言 本文介绍了CNN在NLP中的应用:文本分类。 文本分类:是自然语...

  • Python篇—文本分类

    1.自然语言整体概览 文本分类方法集锦基于text-cnn文本分类基于SVM基于dnn的文本情感分析多类别文本分类...

  • CNN文本分类

    概述 CNN文本分类,是将CNN处理图像的思路移植到文本问题上。具体的理论可以阅读‘Convolutional N...

  • 文本分类--CNN

    作为一个NLP届的菜鸟,想把自己学到的一点知识写下来,一是帮助自己梳理知识;二是希望能够帮到一些打算入门以及正在入...

  • BAT机器学习面试1000题系列(二)

    101.深度学习(CNN RNN Attention)解决大规模文本分类问题。 用深度学习(CNN RNN Att...

  • CNN用于文本分类

    本文介绍了卷积神经网络用于句子分类的算法,适合于短文本,可见的应用场景如微博的情感分析,商品标题的标签分类等。 p...

  • CNN与文本分类

    提到文本分类不能不说卷积神经网络(Convolutional Neural Network,CNN)。本章将谈谈c...

  • 深度学习--Lstm+CNN 文本分类

    本文从实践的角度,来讲一下如何构建LSTM+CNN的模型对文本进行分类。 本文Github RNN网络与CNN网络...

  • 短文本分类和长文本分类的模型如何进行选择?

    短文本分类: 对于短文本,CNN配合Max-pooling池化(如TextCNN模型)速度快,而且效果也很好。因为...

  • 文献阅读笔记:ABCNN: Attention-Based Co

    关键词:Attention机制;CNN;卷积神经网络;文本分类;智能问答 文献:ABCNN: Attention-...

网友评论

      本文标题:CNN文本分类

      本文链接:https://www.haomeiwen.com/subject/exbycqtx.html