美文网首页
知识图谱化的思考

知识图谱化的思考

作者: 魏佳斌 | 来源:发表于2018-11-09 11:59 被阅读71次

    决策是日常我们经常要做的事情,无论是一个公司还是个人。个人大到升学、求职,结婚,买房,在哪个国家或城市定居;小到吃饭,穿衣,购物,交友,旅行。公司决定战略方向,战术打法,产品节奏,营销方案,团队搭建等等。

    要了解一个事情的发展,预测它未来的发展方向,做好决策,通常有三大利器数据,逻辑与历史。统计就是对数据做分析,横向、纵向对比看看,逻辑是结合自己的经验,方法论,对输入的数据,与即有的经验做好关联,而历史则提供了丰富的素材可资借鉴与参考。

    比如买房,目标到底自住还是投资,这背后的分析逻辑就大不一样。如果是投资,那得对比横向其它投资方式的收益,横向对比其他可比国家的楼市增值规律,纵向看中国市场的发展情况等;历史是用一个更宏观的视野,比如“回到”上世纪80年代的日本,香港楼市看它未来的走势,解读一些不一样的信息。

    再简化一下决策模型,其实就是:信息->知识体系+方法论+逻辑分析->结论。我们去收集数据,提取出有用的信息,结论我们即有的知识与逻辑分析,得到相应的结论。收集与存储海量的信息,是计算机的强项,在目前大数据架构下,这个容量似乎无限,而且它没有遗忘的问题,这不是人类大脑可以比拟。信息在当下不是问题,信息一直都在过载,当然,当下存在大量的信息孤岛,很多大数据掌握上少数大公司手里也是事实。计算机的问题,在于对于原始信息,新增输入的信息,无法产生关联,联想,甚至是推理。比如我们有很多数据库,理解这些表结构的工程师,可以通过SQL语句对这些结构化的数据进行查询,得到相应的结果。但这些信息都是静态的,都是素材,本身没有生命力。

    计算机本质上,还不能有效理解非结构化数据。比如文本,在它眼里就是字符串。我们提取到数据里的结构化数据,才可以进行挖掘与分析。图谱化比数据库的结构化更进一步,相当于给每个字段赋于了现实中的意义。而且这个意义还在一个语义网络当中。举个例子,有一张学生信息表,有如下几个字段:name,age,sex等。记录有:小明,16,男;小李,18,女等。这个表容易统计一个班男女比例等,但age,sex这些字段,只有设计表格的工程师自己知道。另外,sex与另一个数据库中的gender能不能进行关联。图谱化相当于结构化的数据基础上,让每一个字段具备了语义——(小明,年龄,16),(小明,性别,男)

    有一个问题,是不是知识都可以量化——图谱化?

    有一篇财经的分析文章,开篇是这么写的——“零售业属于我国开放最早、市场化程度最高、竞争最为激烈的行业之一”。短短这一句话,包括了很多的信息点,观点,甚至可能是偏见。

    实体:零售业(is a 行业),属性:开放时间(最早之一),市场化程度(最高之一),竞争度(最激烈之一)。要得到如上这句话,需要对所有行业的如上属性做量化,然后进行排序,并取top 5%作为最xxx之一的度量。

    随着近年来行业环境变化,线上线下融合发展,一些较大规模的零售企业在发展多种业态的同时,也开始进行地域性扩张,新的竞争重点区域由一线城市转移到二、三线城市。

    实体:零售企业,发展,多种业务,进行,地域性扩张,竞争区域,下沉到二、三线城市。

    目前看来,不容易,如果是计算范式,需要严格的大师证明。就像0,1可以表示整个虚拟世界,知识是否完备的表示,不知道,但部分肯定是可以的

    第二个问题,有了大数据量的图谱,图谱自身如何进行知识推理?

    人具备这样的能动性,而且会带着目的性。机器即没有目标,也没有能动性。目标可以由人赋于。比如想让机器去分析——为何欧洲长期分裂,而中国倾向统一。人会自然分解目标,形成一个个子问题,寻找证据,分析结论。

    第三个问题,这种推理可否由自然语言的问答式驱动。

    相关文章

      网友评论

          本文标题:知识图谱化的思考

          本文链接:https://www.haomeiwen.com/subject/rnsnxqtx.html