技术行话
以下的技术行话,或者说专业术语,并不是指望用户能够明白亦或是用在网站上体现出你的专业性,学习了解技术行话,只是为了让你在做受控词表和叙词表时,能和其他该领域的专家能更高效的沟通。
优选术语
也称为可接受术语、可接受值、标题词,或者描述语。所有的关系都是根据优选术语定义的。
异形术语
也称为入口语或非优选术语。异形术语的定义是等价于优选术语,或者大致上和有优选术语同义。
上位类术语
是优选术语的上层术语,在等级中的较高一层位置。
下位类术语
是优选术语的子术语,在等级中的较低一层位置。
相关术语
是通过相关关系与优选术语相连结。这种关系通常用“参见”的范式说明。
用
传统的叙词表时长采用下面的语法作为索引者和使用者的工具:异形术语“用”优选术语,很多人比较熟悉“见”,例如:陆(表示数字)“见”六
范围注释
本质上是优选术语定义的特定类型,用来限定术语的意义,尽可能把模糊性消除掉。
由上可见,优选术语是其自身语义世界的核心
叙词表实例
叙词表实例当然,这个例子只是展现了叙词表的最小实例,异形术语往往超过2个,和优选术语一起构成同义词环圈;同样的,可以用穷举法列出N个上位类术语、下位类术语、相关术语,只要能想到。
叙词表的种类
叙词表有三种类型:经典式叙词表、索引式叙词表、搜索事叙词表。
决策的依据是你打算怎么使用叙词表,以及设计是主要牵涉到的事情。
经典式叙词表
经典式叙词表用于做索引和搜索之时。索引者对文件做索引时,以叙词表把异形术语对应到优选术语。搜索者使用叙词表进行检索,不管是否了解叙词表在它们的搜索体验中所扮演的角色。查询的属于会和叙词表的丰富词汇进行对比,从而获得同义词管理、等级式浏览,以及相关链接。
索引式叙词表
建立经典式叙词表常常并不是必要或者可能的。
假设有一种情况,你有办法开发受控词表,而且可以对文件做索引,但是,你没有办法把同义词管理功能放入搜索体验之中(搜索引擎部分不是你负责,无法调整),这时就无法在搜索时,把用户的异形术语对应到优选术语,这时致命的弱点。
但即使这样,有索引式叙词表仍比没有要好:
- 索引式叙词表会将整个索引的过程结构化,提升一致性和效率。
- 索引式叙词表可以让你建立优选术语的可浏览式索引,赋予用户通过单一途径就找到某个主题或产品的所有文件。
搜索式叙词表
有时候,由于内容上的问题,使得我们无法对文件做索引:
- 面对的是第三方提供的内容;
- 每天要更新的动态新闻;
- 或者是面对非常多的新闻,使得人工索引的成本巨大无比;
搜索式叙词表会在搜索时利用受控词表,而不是索引时。
例如,当用户在搜索引擎输入一术语时,搜索式叙词表在使用该查询术语比对全文索引前,会把该术语映射到受控词表。此搜索式叙词表可能只是执行等价术语的扩展,就像同义词环圈的做法一样,或者不用等价关系,直接展开语义层次,把所有下位类术语包含进来。这些方法显然可以提升查全率,但会牺牲查准率。
此时可以给用户更多的权限,有选择性的启用或关闭使用任何优选术语、异形术语、上位类术语、下位类术语或相关术语的组合。
搜索式叙词表也可以提供更多灵活的浏览方式。可以让用户浏览部分或全部的叙词表,导航等价、等级和相关关系。
搜索式叙词表的主要优点是其开发和维护的费用与内容的数量无关,但另一方面,在等价和映射的质量上要求较高。
叙词表标准
ISO 2788(1974,1985,1986,国际标准)
ANSI/NISO Z39.19(1994,1998,2005,美国)
等等
阅读标准规范很无趣,但善用标准的优点如下:
- 这些标准原则中包含很多考虑和智慧;
- 大部分叙词表管理软件的设计都是兼容ANSI/NISO,所以,从技术整合观点来看,和标准走在一起是有用的。
- 和标准兼容可以提高跨数据库兼容的机会,所以,当你的公司和竞争者合并时,你就有从容的时间把两种词汇合并起来。
语义关系
等价
等价关系等价关系连接优选术语和异形术语,统称为“同义词管理”。
但是,等价术语是比同义词更宽泛的属于,了解这一点很重要。
目标是把“术语”聚集起来,定义为“搜索目标一致”,其中可能包含同义词、近似同义词、反义词、缩写、词语变体,以及常见的错误拼法。
对于一个存放产品信息的数据库而言,可能还包含过时的产品信息,以及竞争品的产品信息。
根据你所需的受控词表的具体程度,可以把更一般化和更具体的属于挤入等价关系中,以免除太多层次。
目标是建立丰富的入口词,作为“漏斗”,让用户和他们要找的以及你希望他们去找的产品、服务和内容相接触。
等级
等级关系等级关系把信息空间分成类别和子类别,通过父子关系把上位类概念和下位类概念连接起来。
等级有三种关系类型:
- 属:B属于A;
- 整体 - 部分:B是A的一部分;
- 实例:B是A的实例。
等级关系看起来直截了当,但其实没那么简单,任何信息空间都有很多方式进行层次化的组织(例如,按主旨、按产品类别、按地理位置等)。同时也必须解决粒度的问题,决定等级要开发几层。
最终目标都是让用户能够找到他们需要的东西。
相关
相关关系相关关系通常比较难理解,在叙词表的构造上,相关关系通常定义为强烈暗示其语义的连接关系,但是,他们无法在等价关系或等级关系中表现出来。
相关关系的观念是“强烈暗示”,但事实上,定义这种关系是很主观性的。
在电子商务领域,相关关系提供了很棒的工具,可以把顾客和相关的产品与服务连接在一起,可以让营销人员进行所谓的“交叉销售”,比如给购买衣服的客户,推荐相应的裤子。如果做得好,相关关系可以提升用户体验和商业目标。
优选术语
术语形式
议题 | 我们的解释和建议 |
---|---|
语法形式 | 鼓励以名词作为优选术语,这是好的原则,应为用户对于名词比较容易理解和记忆,远胜于动词或形容词 |
拼法 | |
单数和复数 | 对“可数名词”采用复数,概念性名词保留单数 |
简写和缩写 | 建议采用最常见写法,一般情况下,优选术语应该是全词,但不包含通用的简写,如TV |
术语选择
选择ANSI/NISO标准:
- 文献中出现的术语是选择优先术语的主要原则;
- 优选术语的选择应能满足多数用户的需求;
术语定义
根据叙词表使用的具体情境或者一个术语具有多种含义时,可能需要对术语限定解释范围,以控制模糊性。
括号式术语限定词提供了一种控制同形异义词的方式。
例如:优选术语(术语限定词)
术语专指度
术语专指度是所有叙词表设计者必须面对的一个难题。例如“北京工作者”代表的是一个术语或两个术语?
标准规范的说法是:
- 每一描述词,应代表单一概念。
- 通则是,复合术语应该拆解成简单元素。
规范是建议走单元术语,但实际应用中,需要根据具体情境取得平衡,最重要的是网站大小。当内容的数量成长时,使用复合术语增加专指度就有必要性,否则结果将是成百上千。
复合式等级体系
复合等级系统处理大型信息系统时,复合式等级就无法避免。文件数目增长时,就必须使用更高层次的预先协调(使用复合术语)以增加专指度,结果就形成了复合式等级系统。
分面分类法
20世纪30年代,印度一图书管理员认识到自上而下的单一分类法的问题和局限,于是根据文件和物体都具有多维度和分面的特征,建立了新的分类系统。他建议了五种全方面的分面,能够组织任何事物:
- 本体
- 事物
- 动力(能量)
- 空间
- 时间
旧的模式提出的问题是:“这东西要放在哪儿?”
相反地,分面式做法提出的问题是:“这东西要怎么描述?”
在我们的经验中,分面式分类法的做法很有价值,商业界常见的分面如下:
- 主题
- 产品
- 文件类型
- 用户
- 地理位置
- 价格
分面分类法的好处是提供了强大的能力和灵活性。底层有了描述性的元数据和结构之后,信息架构师和界面设计师就能试验好几百种做法展示导航选项。界面可以随时测试和调试,而分面分类法提供了耐用的基础。
网友评论