美文网首页spring bootES
全站搜索引擎:ElasticSearch整合到SpringBoo

全站搜索引擎:ElasticSearch整合到SpringBoo

作者: 肖sir_嘉立老师 | 来源:发表于2019-11-29 01:20 被阅读0次

    一、什么是Elastic Search

    1.ElasticSearch的定义

    ElasticSearch(简称:ES)是一个基于Lucene的分布式、高扩展、高实时的搜索与数据分析引擎。
    特性:

    • 面向文档的(存储整个对象或文档)
    • 底层基于Lucene封装
    • 采用多shard分片的方式保证数据安全
    • 提供RESTful API
    • 使用JSON作为文档的序列化格式

    ElasticSearch官网

    作用:提供了一个分布式多用户的全文搜索引擎,用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。

    ES执行过程:

    1. 用户将数据提交到Elastic Search 数据库;
    2. 通过分词控制器去将对应的语句分词,将其权重和分词结果一并存入数据;
    3. 当用户搜索数据时候,再根据权重将结果排名,打分,再将返回结果呈现给用户。

    ES的数据存储:

    Elastic Search要实现快速检索,首先必须要把数据结构化存储起来。那再Elastic Search中是如何存储数据的呢?
    Elastic Search通过索引来进行存储数据,一个索引中可以有若干个不同的类型,每种类型都由若干条字段组成,每次存储实际上都是存储一种类型的实例,叫做一个文档。


    es架构图.jpg

    为了方便理解,可以类比到关系型数据库中的概念进行对比,如下表:

    关系型数据库 Elasticsearch
    Databases(数据库) Indices(索引)
    Tables(表) Types(类型)
    Rows(行) Documents(文档)
    Columns(列) Fields(字段)

    Elasticsearch包含多个索引(indices)(数据库),每个索引可以包含多个类型(types)(表),每个类型包含多个文档(documents)(行),每个文档包含多个字段(Fields)(列)。

    例如:若我们开发一个文件检索系统,当要添加一篇文章时,指定Indices为毕业论文,Type为_doc,Fields包括:标题、简介、摘要、论文主体、参考文献等,Document的id为1。

    相关概念:

    cluster:代表一个集群,集群中有多个节点,其中有一个为主节点,这个主节点是可以通过选举产生的,主从节点是对于集群内部来说的。es的一个概念就是去中心化,字面上理解就是无中心节点,这是对于集群外部来说的,因为从外部来看es集群,在逻辑上是个整体,你与任何一个节点的通信和与整个es集群通信是等价的。

    shards:代表索引分片,es可以把一个完整的索引分成多个分片,这样的好处是可以把一个大的索引拆分成多个,分布到不同的节点上。构成分布式搜索。分片的数量只能在索引创建前指定,并且索引创建后不能更改。

    replicas:代表索引副本,es可以设置多个索引的副本,副本的作用一是提高系统的容错性,当某个节点某个分片损坏或丢失时可以从副本中恢复。二是提高es的查询效率,es会自动对搜索请求进行负载均衡。

    recovery:代表数据恢复或叫数据重新分布,es在有节点加入或退出时会根据机器的负载对索引分片进行重新分配,挂掉的节点重新启动时也会进行数据恢复。

    river:代表es的一个数据源,也是其它存储方式(如:数据库)同步数据到es的一个方法。它是以插件方式存在的一个es服务,通过读取river中的数据并把它索引到es中,官方的river有couchDB的,RabbitMQ的,Twitter的,Wikipedia的。

    gateway:代表es索引快照的存储方式,es默认是先把索引存放到内存中,当内存满了时再持久化到本地硬盘。gateway对索引快照进行存储,当这个es集群关闭再重新启动时就会从gateway中读取索引备份数据。es支持多种类型的gateway,有本地文件系统(默认),分布式文件系统,Hadoop的HDFS和amazon的s3云存储服务。

    discovery.zen:代表es的自动发现节点机制,es是一个基于p2p的系统,它先通过广播寻找存在的节点,再通过多播协议来进行节点之间的通信,同时也支持点对点的交互。

    Transport:代表es内部节点或集群与客户端的交互方式,默认内部是使用tcp协议进行交互,同时它支持http协议(json格式)、thrift、servlet、memcached、zeroMQ等的传输协议(通过插件方式集成)。

    资源汇总:

    ElasticSearch官网下载地址
    spring-data-elasticsearch开源项目
    ElasticSearch官方文档

    二、Elasitc Search安装与运行

    1.JDK安装与环境变量配置

    (略)

    2.Windows下载并运行Elasitc Search

    若使用Spring Data Elasticsearch的方式调用ElasticSearch,则需要注意把版本对应好,如下:

    Spring Data Elasticsearch ElasticSearch
    3.2.x 6.5.0
    3.1.x 6.2.2
    3.0.x 5.5.0
    2.1.x 2.4.0
    2.0.x 2.2.0
    1.3.x 1.5.2

    下载Elasticsearch:由于我的电脑上JDK使用的是1.8,所以我下载使用ElasticSearch 6.5.0的版本。下载地址:ElasticSearch 6.5.0下载
    运行Elasticsearch:双击运行elasticsearch-2.4.4\bin 目录下的elasticsearch.bat文件。
    访问Elasticsearch:浏览器访问 http://localhost:9200。(默认使用9200端口)

    Elasticsearch运行成功

    3.安装head插件

    为便于管理Elasticsearch,安装head插件可实现可视化管理。
    安装head插件:打开cmd命令行:

    > cd C:\elasticsearch-2.4.4\bin
    > plugin install mobz/elasticsearch-head
    

    访问head插件:浏览器中访问http://localhost:9200/_plugin/head/

    head插件可视化管理Elasticsearch

    4.把Elasticsearch安装成Windows服务

    以上已经把本地的Elasticsearch运行起来了,但生产环境每次都这样启动,未免过于麻烦且不安全。最好的方式是把Elasticsearch加入到Windows服务中(Service),每次开机自动后台启动。
    打开cmd命令行:

    > cd C:\elasticsearch-2.4.4\bin
    > service.bat install
    > service.bat start
    

    5.使用RESTful API 向ElasticSearch中进行HTTP访问

    使用POSTman软件模拟发送HTTP请求到ElasticSearch服务器

    例如:

    操作 示例请求 备足
    添加1号文档 POST : http://localhost:9200/索引/类型/1 body中写入JSON对象
    修改1号文档 PUT : http://localhost:9200/索引/类型/1 body中写入JSON对象
    查询1号文档 GET : http://localhost:9200/索引/类型/1 body中返回JSON对象
    删除1号文档 DELETE : http://localhost:9200/索引/类型/1 body中返回操作结果
    检查是否存在1号文档 HEAD : http://localhost:9200/索引/类型/1 若存在则返回200状态,否则返回404状态
    查询所有文档 GET : http://localhost:9200/索引/类型/_search body中的hits返回JSON对象集合
    条件过滤查找 GET : http://localhost:9200/索引/类型/_search?q=字段:关键字 body中的hits返回JSON对象集合
    表达式过滤查找 POST : http://localhost:9200/索引/类型/_search body中添加查询表达式

    三、SpringBoot整合ElasticSearch

    SpringBoot默认支持两种形式整合ElasticSearch。

    1.Jest(默认不生效)

       使用标准的HTTP请求方式进行交互(略)
       需要手工导入Jest的工具包(io.searchbox.client.JestClient)
    

    2.Spring Data ElasticSearch

    SpirngBoot自动完成了以下配置:

    • 完成Client节点信息clusterNodes:clusterName:用于连接ES节点;
    • 完成ElasticsearchTemplate:用于对ES进行数据映射;
    • 编写了一个ElasticsearchRepository的子接口,用于操作ES的CRUD;

    1.pom.xml中引入Spring-Data-ElasticSearch的依赖

            <dependency>
                <groupId>org.springframework.data</groupId>
                <artifactId>spring-data-elasticsearch</artifactId>
                <version>3.2.0.RELEASE</version>
            </dependency>
    

    注意:如果Spring-Data-ElasticSearch与ElasticSearch版本不一致,会出现ConnectTransportException异常,使得SpringBoot无法启动。
    此时需要修改Spring-Data-ElasticSearch版本,或修改服务器中ElasticSearch的版本。

    Spring Data Elasticsearch ElasticSearch
    3.2.x 6.5.0
    3.1.x 6.2.2
    3.0.x 5.5.0
    2.1.x 2.4.0
    2.0.x 2.2.0
    1.3.x 1.5.2

    2.配置Spring-Data-ElasticSearch

    spring.data.elasticsearch.repositories.enabled = true
    #配置ElasticSearch节点名称
    spring.data.elasticsearch.cluster-name=elasticsearch
    #配置ElasticSearch节点地址
    spring.data.elasticsearch.cluster-nodes=localhost:9300
    #注: 9300 是 Java 客户端的端口。9200 是支持 Restful HTTP 的接口。
    

    配置完成后,运行SpringBoot;若运行成功,则表示ElasticSearch整合成功!

    3.添加绑定的实体类

    实体类:文章

    package com.zhbit.es.bean
    
    @Document(indexName = "zhbit", type = "article")
    public class Article implements Serializable{
        private Integer id;
        private String auther;
        private String title;
        private String content;
        ……
    }
    

    4.DAO层继承ElasticsearchRepository

    package com.zhbit.es.dao
    import com.zhbit.es.bean.Article;
    import org.springframework.data.elasticsearch.repository.ElasticsearchRepository;
    
    public interface ArticleDao extends ElasticsearchRepository<Article, Integer>{
        public List<Article> findByTitleLike(String title);
    }
    

    更多参考

    5.编写测试方法,测试上面的ES访问操作

    @RunWith(SpringRunner.class)
    @SpringBootTest
    public class SpringbootElasticApplicationTests{
        @Autowired
        ArticleDao articleDao;
        @Test
        public void testArticleDao(){
            Article a1 = new Article(1,"肖sir","论智慧城市","智慧城市是现代化发展的必然副产品。");
            articleDao.index(a1);
        }
        @Test
        public void testArticleDao2(){
            for(Article a1 : articleDao.findByTitleLike("智慧"))
            {
                System.out.println(a1);
            }
        }
    }
    
    

    相关文章

      网友评论

        本文标题:全站搜索引擎:ElasticSearch整合到SpringBoo

        本文链接:https://www.haomeiwen.com/subject/ywrbwctx.html