美文网首页
网新关键词3

网新关键词3

作者: 干脆面x | 来源:发表于2018-01-02 10:50 被阅读0次

搜索引擎

  • 搜索引擎是指自动从因特网搜集信息,经过一定整理以后,提供给用户进行查询的系统。

  • 在搜索引擎中,有多种种类划分:

  • 全文索引

全文搜索引擎是目前广泛应用的主流搜索引擎,它们从互联网提取各个网站的信息(以网页文字为主),建立起数据库,并能检索与用户查询条件相匹配的记录,按一定的排列顺序返回结果。

根据搜索结果来源的不同,全文搜索引擎可分为两类:

第一类 第二类
拥有自己的检索程序(Indexer),俗称“蜘蛛”(Spider)程序或“机器人”(Robot)程序,能自建网页数据库,搜索结果直接从自身的数据库中调用,Google和360搜索就属于此类 租用其他搜索引擎的数据库,并按自定的格式排列搜索结果,如Lycos搜索引擎
  • 目录索引

  • 也能称为分类检索,是因特网上最早提供WWW(也就是万维网)资源查询的服务,主要通过搜集和整理因特网的资源,根据搜索到网页的内容,将其网址分配到相关分类主题目录的不同层次的类目之下,形成像图书馆目录一样的分类树形结构索引。

目录索引虽然有搜索功能,但严格意义上不能称为真正的搜索引擎,只是按目录分类的网站链接列表而已。用户完全可以按照分类目录找到所需要的信息,不依靠关键词(Keywords)进行查询。(例:Yahoo、新浪分类目录搜索)

  • 元搜索引擎

  • 元搜索引擎(META Search Engine)接受用户查询请求后,同时在多个搜索引擎上搜索,并将结果返回给用户。(例:著名的元搜索引擎有InfoSpace、Dogpile、Vivisimo等,中文元搜索引擎中具代表性的是搜星搜索引擎

  • 集合式搜索引擎

  • 该搜索引擎类似元搜索引擎,区别在于它并非同时调用多个搜索引擎进行搜索,而是由用户从提供的若干搜索引擎中选择,如HotBot在2002年底推出的搜索引擎

  • 垂直搜索引擎

  • 不同于通用的网页搜索引擎,垂直搜索专注于特定的搜索领域和搜索需求(例如:机票搜索、旅游搜索、生活搜索、小说搜索、视频搜索等等),在其特定的搜索领域有更好的用户体验。相比通用搜索动辄数千台检索服务器,垂直搜索需要的硬件成本低、用户需求特定、查询的方式多样

  • 门户搜索引擎

  • 门户搜索引擎:AOLSearch、MSNSearch等虽然提供搜索服务,但自身既没有分类目录也没有网页数据库,其搜索结果完全来自其他搜索引擎。

  • 免费链接列表

  • 免费链接列表(Free For All Links简称FFA):一般只简单地滚动链接条目,少部分有简单的分类目录,不过规模要比Yahoo!等目录索引小很多。

  • 搜索引擎的组成部分

①搜索器:其功能是在互联网中漫游,发现和搜集信息;
②索引器:其功能是理解搜索器所搜索到的信息,从中抽取出索引项,用于表示文档以及生成文档库的索引表;
③检索器:其功能是根据用户的查询在索引库中快速检索文档,进行相关度评价,对将要输出的结果排序,并能按用户的查询需求合理反馈信息;
④用户接口:其作用是接纳用户查询、显示查询结果、提供个性化查询项。

  • 工作原理

①抓取网页:每个独立的搜索引擎都有自己的网页抓取程序(spider)。Spider顺着网页中的超链接,连续地抓取网页。被抓取的网页被称之为网页快照。由于互联网中超链接的应用很普遍,理论上,从一定范围的网页出发,就能搜集到绝大多数的网页

②处理网页:搜索引擎抓到网页后,还要做大量的预处理工作,才能提供检索服务。其中,最重要的就是提取关键词,建立索引文件。其他还包括去除重复网页、分词(中文)、判断网页类型、分析超链接、计算网页的重要度/丰富度等。

③提供检索服务:用户输入关键词进行检索,搜索引擎从索引数据库中找到匹配该关键词的网页;为了用户便于判断,除了网页标题和URL外,还会提供一段来自网页的摘要以及其他信息。

参考文献:https://wenku.baidu.com/view/ef3fe01c10a6f524ccbf85df.html?from=search

相关文章

  • 网新关键词3

    搜索引擎 搜索引擎是指自动从因特网搜集信息,经过一定整理以后,提供给用户进行查询的系统。 在搜索引擎中,有多种种类...

  • 网新关键词3

    第二章 垃圾识别术入门:如何找到需要的信息及如何辨别信息真伪 信息力 定义对信息的注意力,它描述的是一种思维模式,...

  • 网新关键词3

    第三章 网络参与者:那些能够投入精力去思考、评分、复核材料、给内容加标签以及上传图片和视频的人 产草的绵羊:使用资...

  • 网新关键词3

    参与文化 詹金斯是参与文化概念的早期提出者 与艺术表达和公民事务相比门槛较低。 鼓励和他人创造和分享作品。 存在某...

  • 网新关键词3

    集体智慧 在传统的定义里,集体智慧指的是没有人知道所有东西,每个人都知道一些,任意成员的知识可以通过即时问答的方式...

  • 网新关键词

    参与性媒体 参与性媒体是社会化媒体,其价值和能量来自许多人的积极参与。这种价值不仅来源于受众的数量,更来源于人与人...

  • 网新关键词

    第一章 神经重构:指的是人脑进行自我更新的能力。 工作记忆:在这个虚拟的寻找钥匙的过程中,你的大脑将记住的信息从潜...

  • 网新关键词

    区分交往、协作、协调、合作 社会学家把人们投资市场、组建军队、创立宗教的行为称 做“集体行动”。 概念: 1.交往...

  • 网新关键词

    关键词 1、搜索引擎:是指自动从因特网搜集信息,经过一定整理以后,提供给用户进行查询的系统。 2、Twitter:...

  • 网新关键词

    第一章 ● 关于媒体的多任务处理 实际上是在不同的任务之间迅速切换,而不是同时处理多个任务,而这种切换对精神的影...

网友评论

      本文标题:网新关键词3

      本文链接:https://www.haomeiwen.com/subject/dfpxnxtx.html