#关注微信公众号"清梓与否",查看更多产品内容,欢迎您的到来。
在做商业画布的时候,怎么都查不到自己想要的资料。不禁反思搜索引擎是怎么从海量的数据中找到我们搜索的数据的?以下是做出的简单的整理:
搜索引擎的基本工作原理包括如下三个过程:
首先在互联网中发现、搜集网页信息;同时对信息进行提取和组织建立索引库;再由检索器根据用户输入的查询关键字,在索引库中快速检出文档,进行文档与查询的相关度评价,对将要输出的结果进行排序,并将查询结果返回给用户。
首先是搜索引擎搜集网页信息放到自己的数据库,当用户通过关键词进行查询的时候,搜索引擎会有自己的一个检索机制,通过关键词对比 相关性 历史检索访问数据 来绝对搜索结果展现的排名 理论上讲 排名越靠前 相关性越强。
几种精准搜索的方法:
1、完整搜索”关键词“表示查询词不能被拆分,在搜索结果中必须完整出现。
2、不含某个词,表示所有搜索结果不包含减号后面的词,含有它的网页将被过滤掉。
3、标题中搜索intitle,表示搜索结果的标题都必须含有intitle:后的查询词,帮助排除无关网页。
4、指定网站site:表示搜索结果一定来自你输入的网站。
5、并行表示搜索结果中包含词语A和B中的任意一个,不必同时包含这两个词。
6、ERL中搜索inurl,表示搜索结果中,查询词需要出现在网页的URL里。
7、搜索政府网页inurl:gov,表示搜索出来的网页都是URL中带有gov的政府网站。
8、指定格式filetype,表示搜索特定的文件格式。
信息搜索和资源搜索方式的整理
![](https://img.haomeiwen.com/i22582795/74972949af8ca9fa.png)
![](https://img.haomeiwen.com/i22582795/864ebd903c0b9910.png)
#关注微信公众号"清梓与否",查看更多产品内容,欢迎您的到来。
![](https://img.haomeiwen.com/i22582795/963d6bd8917c1845.jpg)
网友评论