美文网首页
2019-03-25

2019-03-25

作者: T_129e | 来源:发表于2019-03-26 14:38 被阅读0次

    在用户定性画像建模中就有必要考虑一下几个问题:1.如何定义和表示标签?包括标签名称、标签类别、标签值的取值范围等。2.如何解释标签?主要是对标签的语义信息进行描述,从语义上给出标签的解释。3.如何推理标签?主要是定义相应的推理规则,从而实现标签之间的推理。4.如何验证标签?包括标签的定义是否合理,标签关系是否一致、正确。

    在使用标签表示用户定性画像的基础上,还可以进行用户调研,根据目标、行为和观点的差异,将用户区分为不同的类型,在每种类型中抽取出典型特征。例如,一些个人基本信息,家庭、工作、生活环境描述,赋予一个名字、一张照片、场景等描述,就形成了一个典型的用户画像。人物角色一般会包含与产品使用相关的具体情景、用户目标或产品使用行为描述等。为了让用户画像容易记忆,可以用具体的名字、标志性语言、几条简单的关键特征进行描述。一个产品通常会设计3~6个标签代表所有的用户群体。

    标签是用户定性画像的基础,如何表示、解释、推理、验证标签是用户定性画像建模的关键。

    在推荐系统中,存在两类元素,一类称为用户(User),另一类称为项(Item)。对于视频推荐应用,用户是观看视频的观众,项则是视频内容本身。因此基于知识的用户定性画像主要以观众和视频的相关只是作为画像建模的核心。从用户维度来看,相关知识包括视频特征等。

    用户特征是对用户属性的描述,主要用来区分并识别用户身份。

    用户行为主要包括视频点播行为和视频浏览行为。视频点播行为可以进一步细分为用户点播的视频内容、点播视频的时间长度,以及在观看视频期间发生的暂停、跳转、退出等交互行为,这些信息可以由播放器的日志数据得到。

    用户的兴趣偏好是用来反应用户的潜在兴趣,是通过用户的历史浏览数据来进行推理的。研究表明,用户的点播和浏览行为能很好的反应用户的兴趣偏好。例如,观看视频的时间反应了不同用户在观看时间方面的偏好,有的用户喜欢在周末观看视频,有的用户喜欢在工作日晚上观看视频等。

    视频特征是对视频属性的描述。

    从知识类型【(知识类型是现代心理学提出的对知识的分类。一般分为三类:(一)陈述性知识。关于世界“是什么”的知识。有三种:(1)关于事物名称或符号的知识;(2)简单的命题知识或事实知识;(3)有意义的命题的组合知识,即经过组织的前述两种知识。(二)程序性知识。关于“怎么办”的知识。(三)策略性知识。关于“如何学习”的知识。程序性知识涉及的对象是客观事物,策略性知识处理的则是学习者自身的认知活动。)】来看,在视频推荐应用中,相关知识的类型主要有以下三种:(1)与用户和视频特征有关的属性知识。属性类知识的获取主要来源于推荐系统数据库。例如,年龄(U,20),时长(M,100),U表示某个用户,M表示某部影片。(2)反映用户兴趣偏好的规则知识,其中规则的左部一般包括用户、视频的属性特征,以及用户观看视频的行为事实,规则的右部则是有关用户兴趣偏好的结论。(3)用于推理和确保关系完整性、正确的约束性知识,对于规则和约束知识的获取,一般由领域专家根据经验给出,当然也可以利用数据挖掘和机器学习技术自动学习规则,然后由知识工程师进行过滤,采用迭代的方式来学习规则。

    什么是本体论: 人工智能的本体论,就是建立本体的那一整套方法。它是通过头、角、蹄子等等概念与羊之间的关系来说明什么是羊的。比如说“羊”这个概念,我们忽略了羊长着一只头、两只角、四只蹄子、一身毛、会吃草、喝水、叫唤等等具体属性,而把它定义为“一种哺乳动物”。而人工智能建构本体的方法却恰恰与此相反,它要做的不是对事物进行抽象,而是对抽象的概念进行详细的描述,把抽象的概念还原成具体的东西,把“一种哺乳动物”的羊,描述成一只长着一只头、两只角、四只蹄子、一身毛,吃草、喝水、会叫唤……的羊。

    构建用户定性画像的关键是利用本体对用户画像领域中的标签进行表示、验证、推理和解释。那么本体中包含哪些要素?本体和标签之间的关系又是怎么样的呢?

    本体的结构一般包括类、属性、实例、公理和推理规则。其中类是对领域中具有相同性质的概念或术语的一种抽象,可以形成一定的类层次结构。属性是对类概念的描述。实例则是描述本体中类的具体对象,公理是本体中的永真式,用于描述类概念间的约束条件,并且这一条件在领域中是永远成立的。推理规则则是对本体所在领域中的专家知识的一种形式化表示,一般写为类似产生式的条件结论形式。

    基于知识的用户定性画像主要以用户和视频的相关知识作为画像建模的核心。标签对应用户画像领域内的概念或术语,如何让计算机理解这些标签,使计算机表现的具有智能化,这就需要借助本体,利用本体赋予标签含义,因此对于用户画像领域内可能出现的任何标签,在本体中都应当有对应的定义,并给出语义解释。所以,本体可以对用户画像领域中的标签,以及标签间的关系进行建模,给出这些标签的语义解释,本体的构建则成为基于知识的用户定性画像构建的基础。

    弄清楚问题的需求,包括需要输入什么数据,最后应输出什么。在建立本体前必须先确定本体将覆盖的专业领域、范围和应用目标,本体应该在哪些方面发挥作用以及他的系统维护者与应用对象。我们根据构建的用户画像设定一系列相关的问题,检测本体的知识是否能够完全覆盖和解决,以此来界定本体的范围。

    将于视频以及用户相关的资源进行读取、整理、分析,提取出分类、属性和对应的属性值,数据分析是用户画像本体构建的基础和前提,通过数据分析,可以确定用户画像本体所涉及的相关知识,总结出本体的结构信息和约束信息。

    在本体构建过程中,需要结合视频及用户的相关特点,并遵循一定的原则:首先,要尽可能使用标准术语,本体中将对使用的视频标准术语、用户行为及兴趣偏好等概念的含义进行详细、有效、准确的定义和说明;其次,本体应当保持前后一致,即支持与其定义相一致的推理;第三,本体将提供一个可共享的词汇表,这个可共享的词汇表可以为预期的任务提供概念基础;最后,本体构建过程中应当使用多种概念层次,同层次的概念之间应当保持最小的语义距离,并采用多种机制来增强表达能力。

    领域词汇表一般包括类词汇表,属性词汇表,其中,属性词汇表又包括对象属性词汇表和数据属性词汇表。因为用户画像进行定性描述,主要包括用户和视频这两个领域。因此相关词汇也是从用户和视频这两个领域进行提取的。

    相关文章

      网友评论

          本文标题:2019-03-25

          本文链接:https://www.haomeiwen.com/subject/mvavvqtx.html