1、什么是搜索
搜索是现代互联网的命脉。
二十年前的互联网,雅虎凭借着门户网站一跃成为了把持互联网的巨头。但仅仅几年之后,门户网站便迅速地被搜索引擎所取代,致使雅虎一落千丈,而谷歌也趁机一跃而起,直至今日,谷歌在互联网中的地位仍然是执牛耳者。
门户网站的逻辑是像一个电话本(也就是俗称的黄页)一样,把每家每户的号码信息登记在上面,用户想要找谁,就在上面循着顺序找下去。这很方便,因为最初的互联网的规模也很小,并没有如今那么庞大,多数的访问量也都是集中在少数的几个网站上,只需要列出就可以很方便地被用户访问,而无需用户进行记忆。
但是时过境迁,谁都没有料到互联网的发展竟可以如此迅速,犹如星火燎原般在全世界扩散开来。这些门户网站开始捉襟见肘了,一个小小的页面,怎么可能囊括得下如此浩瀚的互联网呢?因此搜索引擎应运而。通过关键词,在互联网上查找用户想要的网站,这其中的逻辑很简单,但是困难也不少,可是最初想到这个方法的人可没有在意那么多,想到了就去做了,走一步看一步,于是就有了今天的谷歌。
通俗一点地来说现在谷歌的搜索技术就是,谷歌在全世界建了很多的存储站,然后利用网络爬虫技术,不断地在互联网中遍历网站,并且将遍历到的网站记录下来,当用户发起搜索查询时,谷歌就在自己的数据库中搜索相关页面,并且将结果呈现出来给用户。其中有很多细节的问题需要处理,就不在这里赘述。
2、搜索引擎的种类
搜索的种类可以有很多,我个人倾向于按照下面几类来分:
【1】综合搜索引擎
很容易理解什么是综合搜索引擎,什么都能搜的就是综合搜索引擎。比如百度,比如谷歌,比如必应。它们的应用范围很广,收录的信息很多,因此也是最多人使用。
综合搜索【2】专业领域搜索引擎
该类搜索引擎有自己特定的搜索范围,比如学术搜索,专利搜索,BT搜索,相较于综合搜索来说,其搜索内容局限在某一领域中,因此可以为我们提供更加准确的搜索结果。
【3】图片搜索引擎
这是我常用但是使用效果并不是太好的一类搜索引擎,一般的识图有两个目的:1)找出图片来源 2)查找类似图片。但是受限于现有的搜索技术,目的1往往能够达到,但是目的2却不尽人意。
【4】数学搜索
在这里单独列出来一个很有意思的搜索引擎 Wolfram Alpha,可以直接计算公式,很多的问题也可以回答。
数学搜索3、如何进行搜索?
1、搜索引擎的指令搜索
如果你只是在百度的搜索引擎输入框输入你想要的关键字,那么百度就会在其拥有全部的数据中搜索该关键字,并且按照其推荐算法呈现结果。但是很多时候我们并不需要那么多的结果,并且太多的数据反而可能掩盖了我们真正要寻找的内容,因此我们需要用到搜索指令,来使得我们的关键词搜索更加准确。
搜索指令一般用于加在我们的关键词之中,用于指定我们需要搜索的范围。而且大多数的搜索指令在各个综合搜索引擎中都是通用的。我们列出常用的指令
1、site 指令
用于搜索在某个域名下搜索引擎收录的所有页面。一般的使用场景有很多,比如我们想要寻找一位中科大老师的联系方式,那么在中科大的域名下面搜索该老师显然是一个事半功倍的办法。
用法:包信和 site:ustc.edu.cn
搜索在科大的域名下面收录的所有页面。
2、intitle 指令
用于搜索网页的标题中包含某个词的所有收录页面。
用法:intitle:中科大
搜索网页标题中出现中科大的页面。
3、filetype 指令
用于搜索特定文件格式的文件。
用法:行为心理学 filetype:pdf
搜索关键词为行为心理学的pdf文件
4、- 指令
用于关键词的进一步筛选
用法:心理学 -培训机构
(减号前面的空格不能忽略) ,搜索包含心理学的但是不包含培训机构的页面(无法过滤百度的广告)
指令太多就不在这里一一赘述,只列出一些常用的就够了。
更多的指令搜索可以看简书的这篇文章谷歌、百度、必应高级搜索指令整理
如果懒得输入指令,那么可以使用高级搜索,百度谷歌搜狗均有。如下图,使用方法应该也是同样简洁明了。
高级搜索2、资源搜索
在综合搜引擎对资源(电影,电子书,种子)的搜索结果往往不如人意,因为太多的页面信息对检索造成了掩盖,导致结果中太多的垃圾信息,反而资源信息不见踪影。因此我们需要专门的资源搜索引擎来进行搜索,一般我们会这么使用:
-
影视搜索:
我个人一般在六维空间找到种子,然后再用utorrent下载。但是由于现在的IPV6网络还没有完全普及,所以该方法一般只适用于校园网环境下。
另外海盗湾也是一个很不错的资源站(英文),下载速度也很快,一般在这里下好生肉,然后在字幕网站里找字幕导入就可以观看,唯一的问题是好像在去年被墙了。
至于乱七八糟的其它电影搜索有很多,包括网盘搜索等等,下面是一些影视聚合搜索引擎:
-
书籍搜索
主要是指搜索一些PDF教材和书籍。通常在百度,Bing之中搜索往往只能够得到CSDN或者其它一些坑爹的资源站的PDF,所以在这里列出来一些方便易用的图书搜索引擎:
万千集 :用过的最好用的教材辅导PDF书籍搜索网站
学搜索:书籍聚合搜索引擎
除此之外,GitHub也是一个非常庞大的电子书库,里面的书籍基本都是免费,而且一般都是关于新技术的内容。直接在Github搜索关键词(
xxx
+book
)就可以了。 -
综合资源搜索
网盘和种子库是两个资源非常丰富的宝库,不但上面说的影视书籍都可以搜索,而且很多软件破解版和其它稀奇古怪的东西都能找到。提供一个比较有趣的Tip,用百度搜索
资源名称
+提取码
这几个字很多时候就能够直接找到对应的百度网盘分享链接了。至于更多的方法就是使用专门的网盘搜索和BT搜索:
例如:
乱七八糟的BT网盘搜索有很多,上面两个还算是比较良心的。
3、平台搜索
这里讲的是几个有趣的平台搜索,和之前讲的网页搜索或者是资源搜索又有所不同。对于微博,微信和知乎等平台,它们的网站有自己的协议规定,不允许其它家的搜索平台抓取它们的页面,所以要是想利用平台上的信息来进行搜索,我们就要利用到特定的搜索引擎:
微博搜索:搜索微博话题,用户等
搜狗知乎:搜索知乎上的用户,回答,文章
搜狗微信:搜索公众号文章
不要小看这三板斧,在我看来这三个搜索引擎已经囊括了我国网民的绝大部分,微博知乎对应年轻男女,微信则是老年和中年人士的主阵地。很多问题在这三个平台就能找到很好的解答和溯源。
4、学术搜索
这块倒是没有什么好说的,Sci-Hub就完事了。要推荐的一个搜索引擎就是”术语搜索“,看文献的时候很多术语不知道该怎么翻译,就可以用该搜索引擎查找是否已经有了对应的翻译,避免出现自造词这种尴尬的情况。
4、搜索小结
在我看来,搜索已经越来越成为一项必备的能力了。
很多觉得搜索很简单,就是简单地输入关键词,然后回车检索。但是它其实是需要逻辑思考能力的,我们该用什么样的关键词来搜索,我们搜索到的内容该限定在什么范围,我们搜索到的结果中得到的信息又可以给我们什么样的反馈?通过不断地精确定位关键词,不断限定和缩小我们的查找范围,我们才能有效准确地找到我们想要的结果。不然互联网上的资源那么多,像无头苍蝇那样找岂不是在大海捞针?
最后插播我之前干过的一件非常有意思的事情,大致就是我在等校车坐到另一个校区上课的半个小时里,利用各种可能的搜索途径,成功地为我的某位朋友找到了一个我们只在毛概的课堂上见过一面的双马尾妹子的联系方式,打听到对方已经脱单(一个悲伤的故事),也因此成功骗取到这位朋友的一
顿晚饭。
The End
网友评论