美文网首页翻译技术应用
技术应用 | 语料辅助查询与收集:高效搜索网站推荐

技术应用 | 语料辅助查询与收集:高效搜索网站推荐

作者: 翻译技术点津 | 来源:发表于2023-01-03 12:01 被阅读0次

词汇类网站

1)The free dictionary

网址:https://www.thefreedictionary.com/

简介:

这个综合网站能翻译多种语言,集字典、辞典和百科全书于一身。网站可以免费使用医学、金融和法律词典,查找大量的成语、缩略语、名言,翻译英语、汉语、西班牙语、法语、葡萄牙语和日语等等。查词时,页面上会有10个标签,对应10个查询功能。

以单词map为例:

其同义词页面如下:

其惯用语页面如下:

另外,The free dictionary还有语法、小测试、论坛、图书馆等各种强大无比的功能,图书馆里可以查到各种免费的文学作品和学术论文。

    2)Thesaurus

    网址:https://www.thesaurus.com/

    简介:

    最全同义词总结,最实用的同义词词典。

    以单词map为例:

    下划页面可以看到相关词汇:


词典类网站

1)牛津在线词典

网址:https://www.oxfordlearnersdictionaries.com

2)韦氏在线词典

网址:http://www.merriam-webster.com/

3)剑桥在线词典

网址:https://dictionary.cambridge.org

4)朗文在线词典

网址:ldoceonline.com

例句类网站

1)Linggle

网址:https://linggle.com/

简介:

Linggle 是一个非常好用的语言搜索引擎,其实质上是一个从大数据中搜索类似例句的网站,而非词典类的工具。文章、例句主要来自于Google Web 1T 5-gram, British National Corpus, New York Times Annotated Corpus等

主要用法示范:

(1)词汇搭配

如果想要描述一个事物,但是不知道前面应该用哪一个形容词描述行动好?或者描述一个动作,动词后面应该接什么名词比较正确?

查询sky前面的常用形容词,可以使用“adj. sky”

run 后面常见名词搭配,可以使用“run n.”

  1. 只要输入不同词性的缩写,就可以快速查询一个动作或形容的句子应该怎么描述。例如动词、名词、形容词、副词、介词、代词、感叹词、连接词。

  2. 下面列出了一些常见的词性的缩写,大家可以自己自由搭配使用,注意最后都要加点(.)

v. = 动词(verb)

b. = 名词(noun)

adj. = 形容词(adjective)

adv. = 副词(adverb)

prep. = 介词(preposition)

conj. = 连词(conjunction)

pron. = 代词(pronoun)

det. = 限定词(determiner)

(2)单词二选一,使用/符号

如查询light up a fire还是light up the fire,可以用light up a/the fire

我们还可以在词条上单击,网站会显示使用的一些范例,具体每种搭配在什么情况下使用,可点开看例句。

如查询winter holiday还是winter vacation,用winter holiday/vacation

相比而言,winter vacation更为常用。

(3)是否需要某个词,使用?符号

“保护自然”是protect the nature还是protect nature,可以用protect ?the nature

似乎不够确定,接着我们点开例句。

可以发现,是protect nature。

(4)同义词,使用~符号

如gorgeous同义词有哪些,可以用~gorgeous

joint efforts同义词有哪些,可以用~joint efforts

(5)查找合适的任意词,使用_符号和*符号。

其中"_"指代一个单词,其中"*"指代多个(包括0)单词。注意:"..."的作用与"*"相同。

有时候,我们希望能够在词组的前后或者中间加一些修饰的词,如the issue后面还能接什么词,查询一个词可以用the issue _

查询两个词可以用the issue _ _,_符号代表一个词。

或者直接使用the issue *,*符号代表多个词。

再如a * world

    2)Linguee

    网址:https://www.linguee.com/

    简介:

    Linguee是DeepL开发的机器翻译工具,既有网站在线翻译,又可以使用app翻译 (Apple Store和Google Play均有下载)。

    特点:

    Linguee将查询字典与搜索引擎合二为一,提供更广的搜索空间。搜索结果包含高达一亿多条双语互译的例句。

    Linguee网站将关键词搜索结果分为两部分。网页的左半部分是词条的翻译列表,右半部分是来自网络的双语互译的例句示范。左边简洁明了的单词表源自可靠的印刷版词典,使该词汇的翻译可能性一目了然。右边来自网络的译文例句帮助用户了解判断该词汇的使用语境及使用方法。(以词组on his own为例)

    Linguee提供的现成翻译资料数据不仅庞大而且完整。是目前所有的在线词典的上千倍。所有例句都是完整的句子或者段落。因此,用户可以快捷方便地查询所有搜索词条,包含成语或者俗语的完整意思乃至译文例句,甚至包括专业用语词汇的含义及翻译难点。

    语料库网站

    1)美国当代英语语料库——COCA

    网址:www.english-corpora.org/coca/

    简介:美国当代英语语料库,简称COCA,是目前最大的免费英语语料库,它由包含 5.2 亿词的文本构成,这些文本由口语、小说、流行杂志、报纸以及学术文章五种不同的文体构成。从 1990 年至 2015 年间语料库以每年增加两千万词的速度进行扩充,以保证语料库内容的时效性。因此,美国当代英语语料库被认为是用来观察美国英语当前发展变化的最合适的英语语料库。

    2)英国国家语料库——BNC

    网址:www.jianshu.com/p/9aa2c3527e9f

    简介:英国国家语料库(British National Corpus)是目前世界上非常有代表性的当代英语语料库之一,由英国牛津出版社、朗文出版公司、牛津大学计算机服务中心、兰卡斯特大学英语计算机中心以及大英图书馆等联合开发建立。以来源广泛的书面语和口语为样本,呈现了20世纪后期以来的英式英语。其中词容量超过一亿,书面语占90%,口语占10%。BNC包含了各个年龄段、各个社会阶层的语言,覆盖英国语言的方方面面。整个语料库包含4054篇文本取样,每篇抽样文本的长度不超过45000词。

    3)美国国家语料库——ANC

    网址:www.anc.org/

    简介:美国国家语料库(American National Corpus)记录了20世纪90年代以来,2200万美式英语的口语和书面语词汇。它是目前规模最大的关于美式英语使用现状的语料库,也极大地促进了语料库语言学的发展。


    术语库网站

    1)术语在线

    网址:www.termonline.cn/index

    简介:术语在线针对全国科学技术名词审定委员会30余年来由数百个学科分委员会和数千位专家通过收词、定名、定义、审定、公布的各学科共计四十余万词条进行整理入库。内容覆盖基础科学、工程与技术科学、农业科学、医学、人文社会科学、军事科学等各个领域术语数据库和海峡两岸名词对比数据库。数据结构包括学科、中文名、英文名、台湾名、简称、全称、又称、曾称、俗称、其他语 种名、定义等,基于这些各类术语名词进行科学、个性、智能检索服务。

    2)中国特色话语对外翻译标准化术语库

    网址:210.72.20.108/index/index.jsp

    简介:中国特色话语对外翻译标准化术语库是中国外文局、中国翻译研究院主持建设的首个国家级多语种权威专业术语库。目前,平台发布了中国最新政治话语、马克思主义中国化成果、改革开放以来党政文献、敦煌文化等多语种专业术语库的5万余条专业术语,并已陆续开展少数民族文化、佛教文化、中医、非物质文化遗产等领域的术语编译工作。该术语库平台以语种的多样性、内容的权威性为突出特色,提供中文与英、法、俄、德、意、日、韩、西、阿等多种语言的术语对译查询服务。

    3)中华思想文化术语

    网站:www.chinesethought.cn/TermBase.aspx

    简介:2013年经国务院批准,设立“中华思想文化术语传播工程”,并建立了由教育部、国家语委作为召集单位,中央编译局、中国外文局、外交部、民政部、文化部、新闻出版广电总局、国务院新闻办、新华社、中国科学院、中国社会科学院等十一个部委(单位)为成员的部际联席会议机制,负责统筹协调中华思想文化术语传播工作。该站主要为中华思想术语,收集孔孟之道、诸子百家等思想文化术语。

    4)联合国多语言术语库

    网站:unterm.un.org/UNTERM/portal/welcome

    简介:联合国多语言术语库(UNTERM)是联合国内部官方多语种术语库,UNTERM 收集的词汇主要源自于联合国大会、安全理事会、经济及社会理事会、托管理事会等主要机构日常文件。UNTERM 主要收集与各类全球议题相关的术语,比如气候变化、民主、难民、反恐、可持续发展目标、非殖民化等主题。该术语库以内容独一性和权威性为亮点,提供联合国 6 种工作语言(英、法、俄、汉、阿、西)的术语对应查询服务。

相关文章

网友评论

    本文标题:技术应用 | 语料辅助查询与收集:高效搜索网站推荐

    本文链接:https://www.haomeiwen.com/subject/nlwhcdtx.html