机器学习oneclass进行文本分类

机器学习oneclass进行文本分类

作者: 刘小白DOER | 来源:发表于2022-01-30 23:22 被阅读0次

机器学习oneclass进行文本分类
最近的状况，It sucks
Task3 基于机器学习的文本分类
意图识别
8.machine_learning_Bayes_Classif
语音无监督机器学习Oneclass分类总结
【实战】使用神经网络和TensorFlow来对文本分类
利用神经网络进行文本分类算法综述（持续更新中）
使用TF-IDF进行文本分类
NLP算法工程师

今天实践一个bbc-text-oneclass-classificaiton，使用单样本训练然后预测文本进行分类，判断是否属于此类样本。oneclass在实际生产中是有应用场景的，负样本获取成本高，样本严重的不平衡、负类样本太过多样化等等，那么oneclass分类就排上用场了。

整个算法分为五个部分。

1、Data Preparation

数据集包含两个类型：category类型和text文本，一共2225行数据。

数据集中 2225 没有空值，各个类别分布算是均匀，接下来就是使用511个sport样本进行单样本训练，然后预测全部的样本是否属于整个sport样本。

目标sport样本类别数字化修改为1，其他类别数字化为-1。全部目标sport样本作为训练集，所有类别数据作为测试集。

2、Cleaning and Tokenization

定义CleanTextTransformer类来清洗数据，将文本转为小写，同时将换行符替换为空格。

定义STOPLIST和SYMBOLS，在分析文本时需要剔除这些无意义的文本。

定义函数tokenizeText完成text文本筛选、转换和输出。

3、Feature Extraction

使用HashingVectorizer哈希技巧向量化大文本向量，提取文本特征。

4、Train One-class classificaiton model

使用OneClassSVM进行模型训练，使用训练好的模型在train训练集上再次预测验证，成功率为82%。

5、Predict one-class on test data

使用模型在测试集上执行预测，成功率为62%。

相关文章

机器学习oneclass进行文本分类
今天实践一个bbc-text-oneclass-classificaiton[https://www.kagg...
最近的状况，It sucks
最近精神压力比较大。一是使用传统机器学习oneclassSVM完成oneclass语音分类后，在使用深度学习...
Task3 基于机器学习的文本分类
基于机器学习的文本分类在本章我们将开始使用机器学习模型来解决文本分类。机器学习发展比较广，且包括多个分支，本章侧...
意图识别
1.使用fastText对文本进行分类--小插曲 2.对话系统原理和实践 3.新闻上的文本分类：机器学习大乱斗
8.machine_learning_Bayes_Classif
1 机器学习贝叶斯分类器参考阅读材料： NLP系列(2)_用朴素贝叶斯进行文本分类(上)[https://blo...
语音无监督机器学习Oneclass分类总结
前段时间差不多花了半个多月时间来完成了一个无监督机器学习，实现语音Oneclass分类，即只有正类语音的训练样...
【实战】使用神经网络和TensorFlow来对文本分类
1.机器学习算法 + 数据 = 预测模型由于我们定义的模型是用来对文本进行分类，所以定义如下：输入：文本，输出...
利用神经网络进行文本分类算法综述（持续更新中）
传统的文本分类一般都是使用词袋模型/Tf-idf作为特征+机器学习分类器来进行分类的。随着深度学习的发展，越来越多...
使用TF-IDF进行文本分类
通过提取文本的TF-IDF特征，使用经典的机器学习方法进行文本分类。数据集：20news-bydate下载地址
NLP算法工程师
顺丰工作职责：负责利用自然语言处理和机器学习算法对海量文本数据进行挖掘，包括但不限于，文本分词、分类、情感分析、...

网友评论

收藏

本文标题：机器学习oneclass进行文本分类

本文链接：https://www.haomeiwen.com/subject/jdeckrtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

收藏

关于我们|服务条款|联系我们|机器学习oneclass进行文本分类|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！