美文网首页
数据输入:文档和索引

数据输入:文档和索引

作者: 磨飞 | 来源:发表于2019-11-04 22:01 被阅读0次

写在前面:最好的文档是官网

数据输入:文档和索引

Elasticsearch是一个分布式文档存储。Elasticsearch不会将信息存储为列数据的行,而是存储已序列化为JSON文档的复杂数据结构。当集群中有多个Elasticsearch节点时,存储的文档会分布在整个集群中,并且可以从任何节点立即访问。

存储文档时,将在1秒内几乎实时地对其进行索引和完全搜索。Elasticsearch使用成为倒排索引的数据结构,该结构支持非常快速的全文本搜索。倒排索引列出了出现在任何文档中的每个唯一单词,并标识了每个单词出现的所有文档。

索引可以认为是文档的优化集合,每个文档都是字段的集合,这些字段是包含数据的键值对。默认情况下,Elasticsearch对每个字段中的所有数据建立索引,并且每个索引字段都具有专用的优化数据结构。例如,文本字段存储在倒排索引中,数字字段和地理字段存储在BKD树中。使用按字段数据结构组合并放回搜索结果的能力使Elasticsearch如此之快。

Elasticsearch还具有无模式的能力,这意味着可以为文档建立索引,而无需明确指定如何处理文档中可能出现的每个不同字段。启用动态映射后,Elasticsearch自动检测并将新字段添加到索引。此默认行为使索引和浏览数据变得容易-只需开始建立索引文档,Elasticsearch就会检测布尔值,浮点数和证书值,日期和字符串并将其映射到适当的Elasticsearch数据类型。

但是,最终,您比Elasticsearch更了解您的数据以及如何使用它们。您可以定义规则以控制动态映射,并显示定义映射以完全控制字段的存储和索引方式。

定义自己的映射使您能够:

  • 区分全文字符串字段和精确值字符串字段
  • 执行特定于语言的文本分析
  • 优化字段以进行部分匹配
  • 使用自定义日期格式
  • 使用无法自动检测到的数据类型,例如 geo_point 和 geo_shape

为不同的目的以不同的方式对同一字段建立索引通常很有用。例如,您可以希望将一个字符串字段索引为全文搜索的文本字段,以及作为排序或汇总数据的关键字字段。或者,您可以选择使用多个语言分析器来处理包含用户输入的字符串字段的内容。

在搜索时也会使用在索引期间应用于全文字段的分析链。当您查询全文字段时,对查询文本进行相同的分析,然后再在索引中查找术语。

相关文章

  • 数据输入:文档和索引

    写在前面:最好的文档是官网 数据输入:文档和索引 Elasticsearch是一个分布式文档存储。Elastics...

  • Elasticsearch 索引

    索引 ElasticSearch是文档型数据库,索引(Index)定义了文档的逻辑存储和字段类型,每个索引可以包含...

  • 2017 12-01 ELK的应用

    一.搜索引擎的介绍 (1)索引组件:获取数据-->建立文档-->文档分析-->文档索引(倒排索引)(2)搜索组件:...

  • 【ES】ElasticSearch 文档操作

    内容来自《ES 权威指南》 [TOC] 一、索引文档 文档通过 index API 被索引--使数据可以被存储和搜...

  • Elasticsearch基本概念

    数据组织: 1、逻辑设计:索引、类型、文档 索引名+类型名+文档ID,唯一确定一篇文档。可以搜索特定的类型、索引,...

  • ES基本概念:索引 文档 REST API

    一、文档(Document) 二、JSON文档 三、文档的元数据 _all 在7.0版本废除 四、索引 五、索引的...

  • 搭建elk服务

    一、搜索引擎 1、搜索引擎是由索引组件、搜索组件和用户接口组成: 流程: 索引组件:获取数据-->建立文档-->文...

  • 1-4 5.6.9ES的API操作

    索引操作 创建索引 查询索引信息 创建索引并建立映射 查看索引类型和映射 文档操作 向user中插入文档 修改文档...

  • 创建索引

    索引含有相同属性的文档集合 类型索引可以定义一个或多个类型,文档必须属于一个类型 文档文档是可以被索引的基本数据单...

  • A Secure and Dynamic Multi-Keywo

    系统框架 数据拥有者DO构建加密索引树,将加密文档和索引外包给云服务。云存储服务根据数据使用者Data User发...

网友评论

      本文标题:数据输入:文档和索引

      本文链接:https://www.haomeiwen.com/subject/puzdbctx.html