美文网首页SEO优化文章
分词与索引库-国平

分词与索引库-国平

作者: shameyou | 来源:发表于2017-05-30 15:58 被阅读10次

    用户搜索一个关键词,搜索引擎马上找到相关的网页给用户。这个过程要怎么实现呢?
    首先搜索引擎要尽可能多的把互联网上的网页搜集下来,这样能提供大量的网页给用户查询。这一部分由爬虫来解决,顺着互联网上的链接一个个往下抓取。最后就有了一堆记录着网页各种信息的资料库。目前的现状,最后能使这个资料库里有大概100多亿个网页。资料库里记录了这些网页的URL,整个网页的HTML代码,网页标题等等信息。
    然后,搜索引擎拿到用户输入的这个关键词后,要从这个资料库里把相关的网页找出来给用户。

    1.搜索引擎如何找到匹配的网页呢?

    建立一份索引库

    搜索引擎查找网页流程

    2.索引库的分类方式:词语/分词

    搜索引擎的索引库

    3.搜索引擎处理过程

    搜索引擎处理过程

    相关文章

      网友评论

        本文标题:分词与索引库-国平

        本文链接:https://www.haomeiwen.com/subject/wmjrfxtx.html