美文网首页程序员
设计网站信息架构必须了解的叙词表、受控词表以及元数据(下)

设计网站信息架构必须了解的叙词表、受控词表以及元数据(下)

作者: KurokoZ | 来源:发表于2017-12-12 22:34 被阅读147次

本文为下篇,建议先浏览上篇,点此即可查看

技术行话

以下的技术行话,或者说专业术语,并不是指望用户能够明白亦或是用在网站上体现出你的专业性,学习了解技术行话,只是为了让你在做受控词表和叙词表时,能和其他该领域的专家能更高效的沟通。

优选术语
也称为可接受术语、可接受值、标题词,或者描述语。所有的关系都是根据优选术语定义的。

异形术语
也称为入口语或非优选术语。异形术语的定义是等价于优选术语,或者大致上和有优选术语同义。

上位类术语
是优选术语的上层术语,在等级中的较高一层位置。

下位类术语
是优选术语的子术语,在等级中的较低一层位置。

相关术语
是通过相关关系与优选术语相连结。这种关系通常用“参见”的范式说明。


传统的叙词表时长采用下面的语法作为索引者和使用者的工具:异形术语“”优选术语,很多人比较熟悉“见”,例如:陆(表示数字)“”六

范围注释
本质上是优选术语定义的特定类型,用来限定术语的意义,尽可能把模糊性消除掉。

由上可见,优选术语是其自身语义世界的核心

叙词表实例

叙词表实例

当然,这个例子只是展现了叙词表的最小实例,异形术语往往超过2个,和优选术语一起构成同义词环圈;同样的,可以用穷举法列出N个上位类术语、下位类术语、相关术语,只要能想到。

叙词表的种类

叙词表有三种类型:经典式叙词表、索引式叙词表、搜索事叙词表
决策的依据是你打算怎么使用叙词表,以及设计是主要牵涉到的事情。

经典式叙词表

经典式叙词表用于做索引和搜索之时。索引者对文件做索引时,以叙词表把异形术语对应到优选术语。搜索者使用叙词表进行检索,不管是否了解叙词表在它们的搜索体验中所扮演的角色。查询的属于会和叙词表的丰富词汇进行对比,从而获得同义词管理、等级式浏览,以及相关链接。

索引式叙词表

建立经典式叙词表常常并不是必要或者可能的。
假设有一种情况,你有办法开发受控词表,而且可以对文件做索引,但是,你没有办法把同义词管理功能放入搜索体验之中(搜索引擎部分不是你负责,无法调整),这时就无法在搜索时,把用户的异形术语对应到优选术语,这时致命的弱点。
但即使这样,有索引式叙词表仍比没有要好:

  • 索引式叙词表会将整个索引的过程结构化,提升一致性和效率。
  • 索引式叙词表可以让你建立优选术语的可浏览式索引,赋予用户通过单一途径就找到某个主题或产品的所有文件。

搜索式叙词表

有时候,由于内容上的问题,使得我们无法对文件做索引:

  • 面对的是第三方提供的内容;
  • 每天要更新的动态新闻;
  • 或者是面对非常多的新闻,使得人工索引的成本巨大无比;

搜索式叙词表会在搜索时利用受控词表,而不是索引时。
例如,当用户在搜索引擎输入一术语时,搜索式叙词表在使用该查询术语比对全文索引前,会把该术语映射到受控词表。此搜索式叙词表可能只是执行等价术语的扩展,就像同义词环圈的做法一样,或者不用等价关系,直接展开语义层次,把所有下位类术语包含进来。这些方法显然可以提升查全率,但会牺牲查准率。

此时可以给用户更多的权限,有选择性的启用或关闭使用任何优选术语、异形术语、上位类术语、下位类术语或相关术语的组合。

搜索式叙词表也可以提供更多灵活的浏览方式。可以让用户浏览部分或全部的叙词表,导航等价、等级和相关关系。
搜索式叙词表的主要优点是其开发和维护的费用与内容的数量无关,但另一方面,在等价和映射的质量上要求较高。

叙词表标准

ISO 2788(1974,1985,1986,国际标准)
ANSI/NISO Z39.19(1994,1998,2005,美国)
等等
阅读标准规范很无趣,但善用标准的优点如下:

  • 这些标准原则中包含很多考虑和智慧;
  • 大部分叙词表管理软件的设计都是兼容ANSI/NISO,所以,从技术整合观点来看,和标准走在一起是有用的。
  • 和标准兼容可以提高跨数据库兼容的机会,所以,当你的公司和竞争者合并时,你就有从容的时间把两种词汇合并起来。

语义关系

等价

等价关系

等价关系连接优选术语和异形术语,统称为“同义词管理”。
但是,等价术语是比同义词更宽泛的属于,了解这一点很重要。
目标是把“术语”聚集起来,定义为“搜索目标一致”,其中可能包含同义词、近似同义词、反义词、缩写、词语变体,以及常见的错误拼法。
对于一个存放产品信息的数据库而言,可能还包含过时的产品信息,以及竞争品的产品信息。
根据你所需的受控词表的具体程度,可以把更一般化和更具体的属于挤入等价关系中,以免除太多层次。
目标是建立丰富的入口词,作为“漏斗”,让用户和他们要找的以及你希望他们去找的产品、服务和内容相接触。

等级

等级关系

等级关系把信息空间分成类别和子类别,通过父子关系把上位类概念和下位类概念连接起来。
等级有三种关系类型:

  • 属:B属于A;
  • 整体 - 部分:B是A的一部分;
  • 实例:B是A的实例。

等级关系看起来直截了当,但其实没那么简单,任何信息空间都有很多方式进行层次化的组织(例如,按主旨、按产品类别、按地理位置等)。同时也必须解决粒度的问题,决定等级要开发几层。
最终目标都是让用户能够找到他们需要的东西。

相关

相关关系

相关关系通常比较难理解,在叙词表的构造上,相关关系通常定义为强烈暗示其语义的连接关系,但是,他们无法在等价关系或等级关系中表现出来。
相关关系的观念是“强烈暗示”,但事实上,定义这种关系是很主观性的。
在电子商务领域,相关关系提供了很棒的工具,可以把顾客和相关的产品与服务连接在一起,可以让营销人员进行所谓的“交叉销售”,比如给购买衣服的客户,推荐相应的裤子。如果做得好,相关关系可以提升用户体验和商业目标。

优选术语

术语形式

议题 我们的解释和建议
语法形式 鼓励以名词作为优选术语,这是好的原则,应为用户对于名词比较容易理解和记忆,远胜于动词或形容词
拼法
单数和复数 对“可数名词”采用复数,概念性名词保留单数
简写和缩写 建议采用最常见写法,一般情况下,优选术语应该是全词,但不包含通用的简写,如TV

术语选择

选择ANSI/NISO标准:

  • 文献中出现的术语是选择优先术语的主要原则;
  • 优选术语的选择应能满足多数用户的需求;

术语定义

根据叙词表使用的具体情境或者一个术语具有多种含义时,可能需要对术语限定解释范围,以控制模糊性。
括号式术语限定词提供了一种控制同形异义词的方式。
例如:优选术语(术语限定词)

术语专指度

术语专指度是所有叙词表设计者必须面对的一个难题。例如“北京工作者”代表的是一个术语或两个术语?
标准规范的说法是:

  • 每一描述词,应代表单一概念。
  • 通则是,复合术语应该拆解成简单元素。
    规范是建议走单元术语,但实际应用中,需要根据具体情境取得平衡,最重要的是网站大小。当内容的数量成长时,使用复合术语增加专指度就有必要性,否则结果将是成百上千。

复合式等级体系

复合等级系统

处理大型信息系统时,复合式等级就无法避免。文件数目增长时,就必须使用更高层次的预先协调(使用复合术语)以增加专指度,结果就形成了复合式等级系统。

分面分类法

20世纪30年代,印度一图书管理员认识到自上而下的单一分类法的问题和局限,于是根据文件和物体都具有多维度和分面的特征,建立了新的分类系统。他建议了五种全方面的分面,能够组织任何事物:

  • 本体
  • 事物
  • 动力(能量)
  • 空间
  • 时间

旧的模式提出的问题是:“这东西要放在哪儿?”
相反地,分面式做法提出的问题是:“这东西要怎么描述?”

在我们的经验中,分面式分类法的做法很有价值,商业界常见的分面如下:

  • 主题
  • 产品
  • 文件类型
  • 用户
  • 地理位置
  • 价格

分面分类法的好处是提供了强大的能力和灵活性。底层有了描述性的元数据和结构之后,信息架构师和界面设计师就能试验好几百种做法展示导航选项。界面可以随时测试和调试,而分面分类法提供了耐用的基础。

相关文章

网友评论

    本文标题:设计网站信息架构必须了解的叙词表、受控词表以及元数据(下)

    本文链接:https://www.haomeiwen.com/subject/lxjoixtx.html