对如下es集群的中的查询数据做一个解读
$ curl --location \
--user username:password \
--header 'Content-Type: application/json' \
"http://xx.xx.xx.xx:9200/test/_search?size=1&pretty"
{
"took" : 2,
"timed_out" : false,
"_shards" : {
"total" : 3,
"successful" : 3,
"skipped" : 0,
"failed" : 0
},
"hits" : {
"total" : {
"value" : 12,
"relation" : "eq"
},
"max_score" : 1.0,
"hits" : [
{
"_index" : "test",
"_type" : "_doc",
"_id" : "6645a970b29a3f2e8f664952",
"_score" : 1.0,
"_source" : {
"all" : true,
"subordinateOrgs" : [ ],
"summary" : "深圳不怕影子斜但能力有限公司运营管理制度",
"catalogInfoId" : "66457d60b29a3f2e8f66493c",
"eid" : "25201954",
"updateDate" : 1715842058228,
"code" : "YWYY-20240516-001",
"roles" : [ ],
"creatorPersonId" : "64d0bd50d08e8f52db7b054f",
"title" : "深圳不怕影子斜但能力有限公司运营管理制度",
"type" : 0,
"content" : "<p><br /></p><p><br /></p><p><br /></p><p>深圳不怕影子斜但能力有限公司运营管理制度</p>",
"customPermission" : false,
"jobIds" : [ ],
"notSubordinateOrgs" : [ ],
"top" : false,
"attachmentList" : [ ],
"personIds" : [ ],
"id" : "6645a970b29a3f2e8f664952",
"createDate" : 1715841392401
}
}
]
}
}
"content" : "<p><br /></p><p><br /></p><p><br /></p><p>深圳不怕影子斜但能力有限公司运营管理制度</p>"
这个content字段的值,这些特殊字符是干什么用的?
content
字段中的特殊字符(如<p><br /></p>
)是HTML标签。它们用于格式化文本:
-
<p>
:表示段落的开始和结束。 -
<br />
:表示换行。
这些标签用于在网页中控制文本的显示方式。
<p><br /></p><p><br /></p><p><br /></p><p>深圳不怕影子斜但能力有限公司运营管理制度</p>
表示一个包含多段空白行的HTML内容,最后一段中包含实际的文本。
具体解释如下:
-
<p><br /></p>
:每个<p>
标签代表一个段落,<br />
标签插入一个换行。这段HTML在每个<p>
标签中插入了一个换行,意味着在段落之间有空行。这通常用于在网页中插入间隔。 -
最终的
<p>深圳不怕影子斜但能力有限公司运营管理制度</p>
:这是最终的段落内容,显示了实际的文本。
综合起来,这段HTML内容的显示效果如下:
- 在网页中,会有三行空行(由三个
<p><br /></p>
标签产生)。 - 最后一行包含文本“深圳不怕影子斜但能力有限公司运营管理制度”。
这通常表示文档中在实际内容之前留出了一些空间,可能用于分隔不同的内容部分或者使文档的排版看起来更整洁。
作为Elasticsearch中的content
字段值,<p><br /></p><p><br /></p><p><br /></p><p>深圳不怕影子斜但能力有限公司运营管理制度</p>
中的HTML标签对搜索本身没有直接意义。
Elasticsearch会对存储的内容进行分析和索引,但这些HTML标签通常会被解析和忽略,只保留纯文本进行索引。
因此,搜索时主要关注文本“深圳不怕影子斜但能力有限公司运营管理制度”,而忽略HTML标签对结果的影响。
网友评论