美文网首页
词激活力理论

词激活力理论

作者: 殁月 | 来源:发表于2021-03-02 15:51 被阅读0次

引用:北京邮电大学硕士论文《基于知识图谱的领域知识库管理系统的设计与实现》 化立志

传统处理文本类数据构造特征向量的方法有TF-IDF词频统计方法,基于LDA主题特征的方法等等,但这些方法基本都是在词频的基础上构造特征向量,并没有考虑词语之间的语义信息。因此本文引入WAF词激活力的概念。其基本思想是:如果两个词总是同时出现的,那么认为两个词之间存在着某种关联。
WAF理论是基于词对的共现词频和共现距离的,根据WAF的计算公式,对任意的两个词i和j,可以计算出i对j的激活程度,它表示词语i对词语j的激活力大小,这个激活程度是有方向的,将i称为词对中的激活源,j称为词对中的激活目标,词语i到词语j的激活力强度可由数学公式(2-1)表示。



其中,fi和fj分别表示词语i和词语j出现的频率,fij表示词语i对词语j的共现频率,表示两词共同出现时的平均距离,可以看出词语i对词语j的激活力大小与两词的共现频率成正比,与两词的共现距离成反比,同时把每一词单独出现的频率作为惩罚项,避免一些通用的词语的激活力过大。规定如果两个词的共现位置是相邻的,那么为0,并把WAF值置为1。根据如上公式,可以计算出全部词对所构成的WAF矩阵。
其中n是文本中提取出的命名实体的个数,该矩阵其实表示的也是一张有向图,图中每个节点代表一个命名实体,边的权重代表一个实体到另一个实体的激活程度。根据词激活力矩阵,可以进一步计算出命名实体的词亲和力矩阵,计算公式如下
image.png
从公式可以看出,词亲和力矩阵考虑了词激活力矩阵中两个词入度和出度的重合率,即如果两个词总是拥有同一批词的入度和同一批词的出度,则认为两个词的亲和度较大。后续本文会利用词激活力矩阵和词亲和力矩阵提出两种构造命名实体对特征向量的方法

相关文章

  • 词激活力理论

    引用:北京邮电大学硕士论文《基于知识图谱的领域知识库管理系统的设计与实现》 化立志 传统处理文本类数据构造特征向量...

  • 金句摘录

    “映照着改革决心,激扬着创新活力”,着子句,映照和激扬相对,改革创新相对,决心和活力相对;也是互文吧,映照着激...

  • 什么样的女性是有活力的?

    什么样的女性是有活力的? 一提到“活力”,我们脑海里最先蹦出来的词就是年轻,好像活力这个词就要与年轻、青春有关。比...

  • 2018.5.18温儒敏解读部编版

    关键词: 师:教阅读方法,激阅读兴趣 生:海量读

  • 【读书笔记】精神分析的理论之争

    树的活力在于它在不断的向上生长;河流的活力在他得奔涌不息源远流长;人的活力在于他的不断成长;一个理论也是如此,它的...

  • 感叹

    也不是多愁善感什么的,就是忽然有感而发,忽然想起的关于活力这词,活力与年龄无关与心态相关! 人有活力跟没活力所表现...

  • 开学――时下最具活力的词

    利用网络上课已经到了第七周了,当初接到领导通知时天气还寒冷,所以最开始时我们几个直播员都是穿着棉袄或者羽绒服的。 ...

  • 外教英语,我们回来了!

    今天是外教英语低段第一课《Introduction》,授课教师仍然是Theresa老师,一个活力四射,又激...

  • 批语之妙

    表扬鼓励 催孩锐气 文字彩绘 巧妙激趣 亲爱的教师朋友,孩子们需要此类批语,它有活力,它催人奋进!么么哒!

  • 洒脱拍打 彰显 力量

网友评论

      本文标题:词激活力理论

      本文链接:https://www.haomeiwen.com/subject/xuqxqltx.html