TEXT-CNN 模型
论文 Convolutional Neural Networks for Sentence Classification

自然语言处理步骤
- 获取数据
- 数据预处理 字->数值 (文字数字化)
- 构建网络(数值-> 网络 -> 结果)
- 训练网络
- 分析结果
- 应用
字->数值? 用词向量!

(得到词向量,可用skip-gram,cbow等方法)
(现在比较流行的字->数值 方法ELMO,bert)
构建网络 用卷积



特点
-
查找特定模式(适合于新闻分类等各分类有专业术语的问题)
-
训练速度极快
-
对字来说提升效果比词好
更多
- 二分类 样本不一样多,分错后的代价不一样
- cnn网络架构优化
网友评论