美文网首页深度学习
新闻分类:多分类问题

新闻分类:多分类问题

作者: 庵下桃花仙 | 来源:发表于2019-03-11 22:52 被阅读0次

多分类(multiclass classification):有多个类别;
单标签、多分类(single-label, multiclass classification):每个数据点只能划分到一个类别;
多标签、多分类(multilabel, multiclass classification):每个数据点可以划分到多个类别。

加载路透社数据集

from keras.datasets import reuters

(train_data, train_labels), (test_data, test_labels) = reuters.load_data(num_words=10000)

print(len(train_data))
print(len(test_data))
print(train_data[10])
print(train_labels[10])

num_words=10000:仅保留训练数据中前10000个最常出现的单词。低频单词将被舍弃。

8982
2246
[1, 245, 273, 207, 156, 53, 74, 160, 26, 14, 46, 296, 26, 39, 74, 2979, 3554, 14, 46, 4689, 4329, 86, 61, 3499, 4795, 14, 61, 451, 4329, 17, 12]
3

8982:表示8982个训练样本;
2246:表示2246个测试样本。
与IMDB一样,每个样本都是一个整数列表;
3:表示对应的标签是0到45范围内的整数。

将索引解码为新闻文本

word_index = reuters.get_word_index()
reverse_word_index = dict([(value, key) for (key, value) in word_index.items()])
decoded_newswire = ' '.join([reverse_word_index.get(i-3, '?') for i in train_data[0]])
print(decoded_newswire)

相关文章

  • 新闻分类:多分类问题

    多分类(multiclass classification):有多个类别;单标签、多分类(single-label...

  • 新闻分类:人工智能多分类问题

    上一节我们提到了三个非常经典的问题,他们分别是: 二分类问题(电影评论好坏倾向性判断)多分类问题(将新闻按照主题分...

  • 预测房价:人工智能回归问题

    ​我们之前提出了三个经典的问题,他们分别是: 二分类问题(电影评论好坏倾向性判断)多分类问题(将新闻按照主题分类)...

  • 逻辑回归(三)

    多类别分类(Multiclass Classification) 在多类别分类问题中,我们的训练集中有个多个类别,...

  • 中文文本分类应用实践

    文本分类是NLP领域非常常见的应用场景,在现实生活中有着非常多的应用,例如舆情监测、新闻分类等等。在文本分类中,常...

  • 通俗理解label smoothing 标签平滑实例

    问题背景 对于分类问题,尤其是多类别分类问题中,常常把类别向量做成one-hot vector(独热向量)。 简单...

  • 多标签 V/S 多分类

    多标签 V/S 多分类多类分类(Multiclass classification):表示分类任务中有多个类别, ...

  • 3.3多类别分类问题

    一对多分类问题 一对多分类问题的例子: 按如下标签分类邮件:工作、朋友、家庭、兴趣 天气预报根据天气类型分类:晴天...

  • np.argmax()

    分类问题 很多问题都可以转换为分类问题,情感分析大多是二分类:pos & neg ;NER 命名实体识别多分类问题...

  • 分类问题

    数据挖掘之分类模型 判别分析是在已知研究对象分成若干类型并已经取得各种类型的一批已知样本的观测数据,在此基础上根据...

网友评论

    本文标题:新闻分类:多分类问题

    本文链接:https://www.haomeiwen.com/subject/yhbipqtx.html