美文网首页elasticsearch
【es】对es查询返回内容字段值的一个解读

【es】对es查询返回内容字段值的一个解读

作者: Bogon | 来源:发表于2024-08-21 23:35 被阅读0次

对如下es集群的中的查询数据做一个解读

$ curl --location \
  --user username:password   \
  --header 'Content-Type: application/json'   \
  "http://xx.xx.xx.xx:9200/test/_search?size=1&pretty"


{
  "took" : 2,
  "timed_out" : false,
  "_shards" : {
    "total" : 3,
    "successful" : 3,
    "skipped" : 0,
    "failed" : 0
  },
  "hits" : {
    "total" : {
      "value" : 12,
      "relation" : "eq"
    },
    "max_score" : 1.0,
    "hits" : [
      {
        "_index" : "test",
        "_type" : "_doc",
        "_id" : "6645a970b29a3f2e8f664952",
        "_score" : 1.0,
        "_source" : {
          "all" : true,
          "subordinateOrgs" : [ ],
          "summary" : "深圳不怕影子斜但能力有限公司运营管理制度",
          "catalogInfoId" : "66457d60b29a3f2e8f66493c",
          "eid" : "25201954",
          "updateDate" : 1715842058228,
          "code" : "YWYY-20240516-001",
          "roles" : [ ],
          "creatorPersonId" : "64d0bd50d08e8f52db7b054f",
          "title" : "深圳不怕影子斜但能力有限公司运营管理制度",
          "type" : 0,
          "content" : "<p><br /></p><p><br /></p><p><br /></p><p>深圳不怕影子斜但能力有限公司运营管理制度</p>",
          "customPermission" : false,
          "jobIds" : [ ],
          "notSubordinateOrgs" : [ ],
          "top" : false,
          "attachmentList" : [ ],
          "personIds" : [ ],
          "id" : "6645a970b29a3f2e8f664952",
          "createDate" : 1715841392401
        }
      }
    ]
  }
}

"content" : "<p><br /></p><p><br /></p><p><br /></p><p>深圳不怕影子斜但能力有限公司运营管理制度</p>"
这个content字段的值,这些特殊字符是干什么用的?

content字段中的特殊字符(如<p><br /></p>)是HTML标签。它们用于格式化文本:

  • <p>:表示段落的开始和结束。
  • <br />:表示换行。

这些标签用于在网页中控制文本的显示方式。

<p><br /></p><p><br /></p><p><br /></p><p>深圳不怕影子斜但能力有限公司运营管理制度</p>
表示一个包含多段空白行的HTML内容,最后一段中包含实际的文本。

具体解释如下:

  1. <p><br /></p>:每个<p>标签代表一个段落,<br />标签插入一个换行。这段HTML在每个<p>标签中插入了一个换行,意味着在段落之间有空行。这通常用于在网页中插入间隔。

  2. 最终的<p>深圳不怕影子斜但能力有限公司运营管理制度</p>:这是最终的段落内容,显示了实际的文本。

综合起来,这段HTML内容的显示效果如下:

  • 在网页中,会有三行空行(由三个<p><br /></p>标签产生)。
  • 最后一行包含文本“深圳不怕影子斜但能力有限公司运营管理制度”。

这通常表示文档中在实际内容之前留出了一些空间,可能用于分隔不同的内容部分或者使文档的排版看起来更整洁。

作为Elasticsearch中的content字段值,<p><br /></p><p><br /></p><p><br /></p><p>深圳不怕影子斜但能力有限公司运营管理制度</p>中的HTML标签对搜索本身没有直接意义。

Elasticsearch会对存储的内容进行分析和索引,但这些HTML标签通常会被解析和忽略,只保留纯文本进行索引。
因此,搜索时主要关注文本“深圳不怕影子斜但能力有限公司运营管理制度”,而忽略HTML标签对结果的影响。

相关文章

  • Elasticsearch 字段类型

    在学习 ES 文档相关操作之前,我们先学习 ES 中常用的字段类型。 1、text 当一个字段的内容需要被全文检索...

  • 数据查询

    ES查询用例 单个index 1、全文检索 多字段查询 2、地图搜索 地图字段查询,依赖数据中包含带有geo_lo...

  • 面试要点

    1、includes(es7) 与 indexOf()(es6) indexOf():可返回某个指定的字符串值在...

  • Elasticsearch Search API

    在ES中,text类型的字段,保存时会分词,查询时也会分词后进行查询。而keyword类型字段保存和查询时都不会分...

  • ElasticSearch 7.x 聚合查询

    聚合查询 |ES 的聚合查询和MyQL的聚合查询类型,ES 的聚合查询相比MySQL 要强大的多,ES提供的统计数...

  • ES简单实用DSL查询

    ES版本信息 查看所有索引 查看字段类型 创建索引 删除索引 批量(_bulk)加载数据 查询数据 查询1000条...

  • 安装head插件 (es 6.2)

    head插件是一个es集群的web前端工具,我们可以es查询,查看es集群状态等 es 6.2.2版本es自带 需...

  • 对Elasticsearch字段进行去重,结果保存为文件

    前情提要 据任务要求:从ES集群中查询出ip字段,对ip字段去重,并且将纯净的ip保存到文件中。这里基于某个字段去...

  • ES返回结果集个数修改

    问题 查询ES中数据时出现如下错误image.png 解决方案 ES配置的默认返回记录数量为10000条,于是进行...

  • 箭头函数

    学习文章JavaScript、ES5、ES6有什么关系 有返回值 无返回值 方法中只有一句代码,可简写,两句代码及...

网友评论

    本文标题:【es】对es查询返回内容字段值的一个解读

    本文链接:https://www.haomeiwen.com/subject/fdeikjtx.html