美文网首页程序员
设计网站信息架构必须了解的叙词表、受控词表以及元数据(下)

设计网站信息架构必须了解的叙词表、受控词表以及元数据(下)

作者: KurokoZ | 来源:发表于2017-12-12 22:34 被阅读147次

    本文为下篇,建议先浏览上篇,点此即可查看

    技术行话

    以下的技术行话,或者说专业术语,并不是指望用户能够明白亦或是用在网站上体现出你的专业性,学习了解技术行话,只是为了让你在做受控词表和叙词表时,能和其他该领域的专家能更高效的沟通。

    优选术语
    也称为可接受术语、可接受值、标题词,或者描述语。所有的关系都是根据优选术语定义的。

    异形术语
    也称为入口语或非优选术语。异形术语的定义是等价于优选术语,或者大致上和有优选术语同义。

    上位类术语
    是优选术语的上层术语,在等级中的较高一层位置。

    下位类术语
    是优选术语的子术语,在等级中的较低一层位置。

    相关术语
    是通过相关关系与优选术语相连结。这种关系通常用“参见”的范式说明。


    传统的叙词表时长采用下面的语法作为索引者和使用者的工具:异形术语“”优选术语,很多人比较熟悉“见”,例如:陆(表示数字)“”六

    范围注释
    本质上是优选术语定义的特定类型,用来限定术语的意义,尽可能把模糊性消除掉。

    由上可见,优选术语是其自身语义世界的核心

    叙词表实例

    叙词表实例

    当然,这个例子只是展现了叙词表的最小实例,异形术语往往超过2个,和优选术语一起构成同义词环圈;同样的,可以用穷举法列出N个上位类术语、下位类术语、相关术语,只要能想到。

    叙词表的种类

    叙词表有三种类型:经典式叙词表、索引式叙词表、搜索事叙词表
    决策的依据是你打算怎么使用叙词表,以及设计是主要牵涉到的事情。

    经典式叙词表

    经典式叙词表用于做索引和搜索之时。索引者对文件做索引时,以叙词表把异形术语对应到优选术语。搜索者使用叙词表进行检索,不管是否了解叙词表在它们的搜索体验中所扮演的角色。查询的属于会和叙词表的丰富词汇进行对比,从而获得同义词管理、等级式浏览,以及相关链接。

    索引式叙词表

    建立经典式叙词表常常并不是必要或者可能的。
    假设有一种情况,你有办法开发受控词表,而且可以对文件做索引,但是,你没有办法把同义词管理功能放入搜索体验之中(搜索引擎部分不是你负责,无法调整),这时就无法在搜索时,把用户的异形术语对应到优选术语,这时致命的弱点。
    但即使这样,有索引式叙词表仍比没有要好:

    • 索引式叙词表会将整个索引的过程结构化,提升一致性和效率。
    • 索引式叙词表可以让你建立优选术语的可浏览式索引,赋予用户通过单一途径就找到某个主题或产品的所有文件。

    搜索式叙词表

    有时候,由于内容上的问题,使得我们无法对文件做索引:

    • 面对的是第三方提供的内容;
    • 每天要更新的动态新闻;
    • 或者是面对非常多的新闻,使得人工索引的成本巨大无比;

    搜索式叙词表会在搜索时利用受控词表,而不是索引时。
    例如,当用户在搜索引擎输入一术语时,搜索式叙词表在使用该查询术语比对全文索引前,会把该术语映射到受控词表。此搜索式叙词表可能只是执行等价术语的扩展,就像同义词环圈的做法一样,或者不用等价关系,直接展开语义层次,把所有下位类术语包含进来。这些方法显然可以提升查全率,但会牺牲查准率。

    此时可以给用户更多的权限,有选择性的启用或关闭使用任何优选术语、异形术语、上位类术语、下位类术语或相关术语的组合。

    搜索式叙词表也可以提供更多灵活的浏览方式。可以让用户浏览部分或全部的叙词表,导航等价、等级和相关关系。
    搜索式叙词表的主要优点是其开发和维护的费用与内容的数量无关,但另一方面,在等价和映射的质量上要求较高。

    叙词表标准

    ISO 2788(1974,1985,1986,国际标准)
    ANSI/NISO Z39.19(1994,1998,2005,美国)
    等等
    阅读标准规范很无趣,但善用标准的优点如下:

    • 这些标准原则中包含很多考虑和智慧;
    • 大部分叙词表管理软件的设计都是兼容ANSI/NISO,所以,从技术整合观点来看,和标准走在一起是有用的。
    • 和标准兼容可以提高跨数据库兼容的机会,所以,当你的公司和竞争者合并时,你就有从容的时间把两种词汇合并起来。

    语义关系

    等价

    等价关系

    等价关系连接优选术语和异形术语,统称为“同义词管理”。
    但是,等价术语是比同义词更宽泛的属于,了解这一点很重要。
    目标是把“术语”聚集起来,定义为“搜索目标一致”,其中可能包含同义词、近似同义词、反义词、缩写、词语变体,以及常见的错误拼法。
    对于一个存放产品信息的数据库而言,可能还包含过时的产品信息,以及竞争品的产品信息。
    根据你所需的受控词表的具体程度,可以把更一般化和更具体的属于挤入等价关系中,以免除太多层次。
    目标是建立丰富的入口词,作为“漏斗”,让用户和他们要找的以及你希望他们去找的产品、服务和内容相接触。

    等级

    等级关系

    等级关系把信息空间分成类别和子类别,通过父子关系把上位类概念和下位类概念连接起来。
    等级有三种关系类型:

    • 属:B属于A;
    • 整体 - 部分:B是A的一部分;
    • 实例:B是A的实例。

    等级关系看起来直截了当,但其实没那么简单,任何信息空间都有很多方式进行层次化的组织(例如,按主旨、按产品类别、按地理位置等)。同时也必须解决粒度的问题,决定等级要开发几层。
    最终目标都是让用户能够找到他们需要的东西。

    相关

    相关关系

    相关关系通常比较难理解,在叙词表的构造上,相关关系通常定义为强烈暗示其语义的连接关系,但是,他们无法在等价关系或等级关系中表现出来。
    相关关系的观念是“强烈暗示”,但事实上,定义这种关系是很主观性的。
    在电子商务领域,相关关系提供了很棒的工具,可以把顾客和相关的产品与服务连接在一起,可以让营销人员进行所谓的“交叉销售”,比如给购买衣服的客户,推荐相应的裤子。如果做得好,相关关系可以提升用户体验和商业目标。

    优选术语

    术语形式

    议题 我们的解释和建议
    语法形式 鼓励以名词作为优选术语,这是好的原则,应为用户对于名词比较容易理解和记忆,远胜于动词或形容词
    拼法
    单数和复数 对“可数名词”采用复数,概念性名词保留单数
    简写和缩写 建议采用最常见写法,一般情况下,优选术语应该是全词,但不包含通用的简写,如TV

    术语选择

    选择ANSI/NISO标准:

    • 文献中出现的术语是选择优先术语的主要原则;
    • 优选术语的选择应能满足多数用户的需求;

    术语定义

    根据叙词表使用的具体情境或者一个术语具有多种含义时,可能需要对术语限定解释范围,以控制模糊性。
    括号式术语限定词提供了一种控制同形异义词的方式。
    例如:优选术语(术语限定词)

    术语专指度

    术语专指度是所有叙词表设计者必须面对的一个难题。例如“北京工作者”代表的是一个术语或两个术语?
    标准规范的说法是:

    • 每一描述词,应代表单一概念。
    • 通则是,复合术语应该拆解成简单元素。
      规范是建议走单元术语,但实际应用中,需要根据具体情境取得平衡,最重要的是网站大小。当内容的数量成长时,使用复合术语增加专指度就有必要性,否则结果将是成百上千。

    复合式等级体系

    复合等级系统

    处理大型信息系统时,复合式等级就无法避免。文件数目增长时,就必须使用更高层次的预先协调(使用复合术语)以增加专指度,结果就形成了复合式等级系统。

    分面分类法

    20世纪30年代,印度一图书管理员认识到自上而下的单一分类法的问题和局限,于是根据文件和物体都具有多维度和分面的特征,建立了新的分类系统。他建议了五种全方面的分面,能够组织任何事物:

    • 本体
    • 事物
    • 动力(能量)
    • 空间
    • 时间

    旧的模式提出的问题是:“这东西要放在哪儿?”
    相反地,分面式做法提出的问题是:“这东西要怎么描述?”

    在我们的经验中,分面式分类法的做法很有价值,商业界常见的分面如下:

    • 主题
    • 产品
    • 文件类型
    • 用户
    • 地理位置
    • 价格

    分面分类法的好处是提供了强大的能力和灵活性。底层有了描述性的元数据和结构之后,信息架构师和界面设计师就能试验好几百种做法展示导航选项。界面可以随时测试和调试,而分面分类法提供了耐用的基础。

    相关文章

      网友评论

        本文标题:设计网站信息架构必须了解的叙词表、受控词表以及元数据(下)

        本文链接:https://www.haomeiwen.com/subject/lxjoixtx.html