房东

房东

作者: deepnlp | 来源:发表于2018-06-05 15:22 被阅读0次

房东与房东
无标题文章
男房东女房东
二手房不比新房，这五点一定要注意
房东
房东
房东
房东
《房东》
《房东》

线性文本分类

我们先来看下文本分类问题，现有一篇文章，给它分配一个标签XXXX, XX代表所有可能的标签集。文本分类有很多的应用，如垃圾邮件的过滤，电子病历的分析等等，同时也是构成更复杂自然语言处理的基本要素

要完成这样一个任务，首先是如何表示每一篇文章。一个简单通用的方法就是把文章中每个词的个数构成一个向量，例如x=[0,1….],这里X表示词j的个数，x的长度就是词典的大小，X是所有可能词语的集合

通常我们把这样一个向量称之为词袋(bag of words)，因为它所包含的信息只有每个词的个数，不包含每个词的在文章中的词序，并且它丢失了语法，句子边界，段落等所有信息。尽管这样，词袋模型应用在文本分类上效果还是很好。如果你在一个邮件中看到freee,很容易判断为垃圾邮件，如果看到Bayesian?很多标签分类问题中，一些单个词可以有很大的预测能力。

通过词袋去预测一个标签，我们可以给字表里的每个词语打分，来评估它们和标签的匹配度。在垃圾邮件分类应用里，当标签为SPAM时，freee这个词的打分是一个正值分数，而Bayesian就是一个负值分数。这些分数称之为权值(weights),通常把它们排成一个列向量XX

假如你需要一个多分类器，也就是XXX。例如，我们想把新闻分为体育，名人，音乐和商业等类别。我们已知词袋向量x，通过权值向量theta来预测标签y。对每个标签y，我们计算XXX，这个公式衡量了x和y之间的匹配程度，在线性词袋分类器中，这个式子就是权值和特征函数(feature function)的内积

XXXX

式子可以看出，函数含有两个参数，词的个数和标签y。函数返回一个特征向量。例如，已知x y。特征向量的第j个元素就是

XXXX

当label为SPAM时，函数返回词freee的个数，否则返回0.对应的权值thetaj 就是衡量freee和SPAM之间的匹配程度。一个正值分数表示出现这个词的文章很有可能分成这个标签。

更好地形式化这样一个特征函数，我们定义XXXX

XXXX

…

其中XXXX时一个长度为XX的零向量，分号表示垂直串接

如果已知了权值向量theta，我们就可以计算XX

这个内积式子清楚地把data(x和y)与参数theta分割开，并且它可以很自然地推广到结构化预测（structured prediction），Y的空间比较大，我们想把标签之间的共享子结构模型化。

通常我们在词袋向量x后面加一个偏移特征(offset feature):1。为了统一向量的长度，向量的其他维度填充为0。这个特征向量XX的长度就是XXX。偏移特征的权值就可以看是作被分为对应标签的偏向程度。举个例子，如果我们希望大部分文章为垃圾邮件，那对应y=SPAM的权值就应该比y=HAM的权值大。

问题来了，权值theta从哪里来？一个可能的办法就是人为手动设置。

相关文章

房东与房东
空谷幽兰心／文陪读，就意味着要租房，租房就要与房东打交道。几十年没有租过房子的我，第一次租房确实没经验，...
无标题文章
房东房东
男房东女房东
那一沓沓的红红绿绿的钞票交到房东手里，那一刻，你心情如何？ ——题记如果有一天，这世界不流行打工而是流行种地了。...
二手房不比新房，这五点一定要注意
一、核实房东的各项资料 “房东真的是房东吗？” 买房是大事，各项差错出不得，首要的就是核实房东信息。 1.要求房东...
房东
前不久，因为工作调动的原因，我搬到了市郊居住。房子是在网上找的，因为位置比较偏远，所以租金很便宜。三室一厅，我住...
房东
故事来自住多多房东：周航爱的开始是一个眼色，爱的结尾是无尽苍穹。——林清玄三年前，周航向柒柒求婚的举动曾轰动一...
房东
十年前，我因生活所迫经姐夫与兄弟相约去鄂尔多斯市达拉特旗打工。我租了一件单身房，房东胖胖的身材，宽宽的脸庞，...
房东
线性文本分类我们先来看下文本分类问题，现有一篇文章，给它分配一个标签XXXX, XX代表所有可能的标签集。文本分...
《房东》
十八岁的那年插队去了农村，初见房东是在她屋前的水井边，只见一位大娘满头白发，满脸褶子，土布的斜襟衫略显出丰满...
《房东》
我去看房子，房东是一个慈祥的老太太，她说要跟丈夫移民出国，想长期出租。房子地处不算偏僻，精装修楼中楼，我已经决定...

网友评论

本文标题：房东

本文链接：https://www.haomeiwen.com/subject/pgapsftx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|房东|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！