美文网首页elasticsearch
【es】对es查询返回内容字段值的一个解读

【es】对es查询返回内容字段值的一个解读

作者: Bogon | 来源:发表于2024-08-21 23:35 被阅读0次

    对如下es集群的中的查询数据做一个解读

    $ curl --location \
      --user username:password   \
      --header 'Content-Type: application/json'   \
      "http://xx.xx.xx.xx:9200/test/_search?size=1&pretty"
    
    
    {
      "took" : 2,
      "timed_out" : false,
      "_shards" : {
        "total" : 3,
        "successful" : 3,
        "skipped" : 0,
        "failed" : 0
      },
      "hits" : {
        "total" : {
          "value" : 12,
          "relation" : "eq"
        },
        "max_score" : 1.0,
        "hits" : [
          {
            "_index" : "test",
            "_type" : "_doc",
            "_id" : "6645a970b29a3f2e8f664952",
            "_score" : 1.0,
            "_source" : {
              "all" : true,
              "subordinateOrgs" : [ ],
              "summary" : "深圳不怕影子斜但能力有限公司运营管理制度",
              "catalogInfoId" : "66457d60b29a3f2e8f66493c",
              "eid" : "25201954",
              "updateDate" : 1715842058228,
              "code" : "YWYY-20240516-001",
              "roles" : [ ],
              "creatorPersonId" : "64d0bd50d08e8f52db7b054f",
              "title" : "深圳不怕影子斜但能力有限公司运营管理制度",
              "type" : 0,
              "content" : "<p><br /></p><p><br /></p><p><br /></p><p>深圳不怕影子斜但能力有限公司运营管理制度</p>",
              "customPermission" : false,
              "jobIds" : [ ],
              "notSubordinateOrgs" : [ ],
              "top" : false,
              "attachmentList" : [ ],
              "personIds" : [ ],
              "id" : "6645a970b29a3f2e8f664952",
              "createDate" : 1715841392401
            }
          }
        ]
      }
    }
    

    "content" : "<p><br /></p><p><br /></p><p><br /></p><p>深圳不怕影子斜但能力有限公司运营管理制度</p>"
    这个content字段的值,这些特殊字符是干什么用的?

    content字段中的特殊字符(如<p><br /></p>)是HTML标签。它们用于格式化文本:

    • <p>:表示段落的开始和结束。
    • <br />:表示换行。

    这些标签用于在网页中控制文本的显示方式。

    <p><br /></p><p><br /></p><p><br /></p><p>深圳不怕影子斜但能力有限公司运营管理制度</p>
    表示一个包含多段空白行的HTML内容,最后一段中包含实际的文本。

    具体解释如下:

    1. <p><br /></p>:每个<p>标签代表一个段落,<br />标签插入一个换行。这段HTML在每个<p>标签中插入了一个换行,意味着在段落之间有空行。这通常用于在网页中插入间隔。

    2. 最终的<p>深圳不怕影子斜但能力有限公司运营管理制度</p>:这是最终的段落内容,显示了实际的文本。

    综合起来,这段HTML内容的显示效果如下:

    • 在网页中,会有三行空行(由三个<p><br /></p>标签产生)。
    • 最后一行包含文本“深圳不怕影子斜但能力有限公司运营管理制度”。

    这通常表示文档中在实际内容之前留出了一些空间,可能用于分隔不同的内容部分或者使文档的排版看起来更整洁。

    作为Elasticsearch中的content字段值,<p><br /></p><p><br /></p><p><br /></p><p>深圳不怕影子斜但能力有限公司运营管理制度</p>中的HTML标签对搜索本身没有直接意义。

    Elasticsearch会对存储的内容进行分析和索引,但这些HTML标签通常会被解析和忽略,只保留纯文本进行索引。
    因此,搜索时主要关注文本“深圳不怕影子斜但能力有限公司运营管理制度”,而忽略HTML标签对结果的影响。

    相关文章

      网友评论

        本文标题:【es】对es查询返回内容字段值的一个解读

        本文链接:https://www.haomeiwen.com/subject/fdeikjtx.html