美文网首页
机器学习_语义处理

机器学习_语义处理

作者: zhree003 | 来源:发表于2020-03-31 23:15 被阅读0次

在看到语义处理——降维处理环节时,有用到LSA(潜语义分析)通过对大量的文本集进行统计分析,从中提取出词语的上下文使用含义

LSA和传统向量空间模型(vector space model)一样使用向量来表示词(terms)和文档(documents),并通过向量间的关系(如夹角)来判断词及文档间的关系;不同的是,LSA 将词和文档映射到潜在语义空间,从而去除了原始向量空间中的一些“噪音”,提高了信息检索的精确度。

LSA处理过程中需要用到SVD算法,将多维向量进行 拆解 M x N = M x B · …B x N 

SVD分解,即奇异值分解,听起来很高大上,其实就是将一个矩阵用其他几个矩阵的乘积来表示。假设有 m×n 的矩阵 A,那么 SVD 就是要找到如下式的这么一个分解,将 A分解为 3 个矩阵的乘积:

A m x n = Um x k X ∑ k x k X Vk x nT

流程:

(1)分析文档集合,建立词汇-文本矩阵A。(相比PCA最大的区别)

(2)对词汇-文本矩阵进行奇异值分解。

(3)对SVD分解后的矩阵进行降维。

(4)使用降维后的矩阵构建潜在语义空间。(潜在语义空间仅针对所用的文档中的词,对文档中的词进行聚类)

疑问1:什么是潜在语义空间?(个人理解为仅在文档范围类的“词-词”对应关系)

主成分分析(PCA):调出数据集中 最具“代表”的几个数据(多维,即向量定义)

也可以用SVD算法进行降维处理。 (用最大的k个的奇异值和对应的左右奇异向量来近似描述矩阵)

疑问2:如何将SVD用于推荐算法,将用户和喜好对应的矩阵做特征分解,进而得到隐含的用户需求来做推荐?  (个人理解为 空余-空间向量补充)

区分 传统向量空间模型 与 潜在语义空间模型:

传统向量空间模型:有什么匹配什么

潜在语义空间模型:有什么匹配什么 + 关联什么匹配什么

相关文章

  • 机器学习_语义处理

    在看到语义处理——降维处理环节时,有用到LSA(潜语义分析)通过对大量的文本集进行统计分析,从中提取出词语的上下文...

  • 隐语义模型与推荐算法

    隐语义模型与推荐算法 标签:机器学习深度学习 LFM(latent factor model)隐语义模型,这也是在...

  • 人工智能机器学习数据集收集整理--持续更新中

    关键词:机器学习;人工智能;数据集;标准数据集;自然语言处理;图像识别 自然语言处理相关数据集 1、实体/名词语义...

  • 3.1.1.14 规则学习

    规则学习 原理 《机器学习》周志华 15.1 基本概念 机器学习中的“规则”(rule)通常是指语义明确、能描述数...

  • 人工智能领域的热点

    人工智能领域的细分,包括机器学习、自然语言处理、计算机视觉、算法、图像识别、语义网、语音识别等。 通过分析Ange...

  • "众包中的统计推断与激励机制" 主题报告速记与评述(三)

    笔者按 :机器学习正在走向基于“语义”的可解释模型的新时代。但在很多场合,例如“语义”驱动的监督学习器在能够达到更...

  • 智能机器人的难点

    智能机器人再怎么智能,核心要点之一是对自然语言语义的理解和处理。自然语言语义处理不会达到一个十全十美的状态,只能不...

  • 第二天,给自己做一个在线简历吧

    什么是web语义化? 简单的来说就是能让计算机读懂的语言,语义明确、机器可读,就用机器可读的、被广泛认可的语义信息...

  • 小析智能 - 用AI改变招聘

    小析智能介绍 小析智能在人工智能(AI),机器学习和语义理解技术等方面处于国际领先地位,专注于更科学地处理候选人和...

  • 机器学习—路线图

    机器学习数据处理步骤: 机器学习基础与实践(一)----数据清洗 机器学习基础与实践(二)----数据转换 机器学...

网友评论

      本文标题:机器学习_语义处理

      本文链接:https://www.haomeiwen.com/subject/oqlqvttx.html