美文网首页@IT·大数据玩转大数据程序员
ElasticSearch入门 官方文档翻译 - 3.Modif

ElasticSearch入门 官方文档翻译 - 3.Modif

作者: Jason__Ding | 来源:发表于2017-09-29 20:50 被阅读23次

    修改数据

    ES提供了近乎实时的数据操作和搜索功能。默认情况下,从你索引/更新/删除你的数据动作开始到它出现在你的搜索结果中,大概会有1秒钟的延迟(刷新间隔)。这和其它类似SQL的平台不同,数据在一个事务完成之后就会立即可用。

    索引/替换文档

    前面我们已经见识到了怎么索引单个文档,让我们再调一次那个命令:

    curl -XPUT 'localhost:9200/customer/external/1?pretty&pretty' -H 'Content-Type: application/json' -d'
    {
      "name": "John Doe"
    }
    '
    

    再次,以上的命令将会把这个文档索引到customer索引、external类型中,其ID是1。如果我们对一个不同(或相同)的文档应用以上的命令,ES将会用一个新的文档来替换(重新索引)当前ID为1的那个文档。

    curl -XPUT 'localhost:9200/customer/external/1?pretty' -d '
    {
      "name": "Jane Doe"
    }'
    

    以上的命令将ID为1的文档的name字段的值从John Doe改成了Jane Doe。如果我们使用一个不同的ID,一个新的文档将会被索引,当前已经在索引中的文档不会受到影响。

    curl -XPUT 'localhost:9200/customer/external/2?pretty' -d '
    {
      "name": "Jane Doe"
    }'
    

    以上的命令,将会索引一个ID为2的新文档。

    在索引的时候,ID部分是可选的。如果不指定,ES将产生一个随机的ID来索引这个文档。ES生成的ID会作为索引API调用的一部分被返回。

    以下的例子展示了怎样在没有指定ID的情况下来索引一个文档:

    curl -XPOST 'localhost:9200/customer/external?pretty' -d '
    {
      "name": "Jane Doe"
    }'
    

    注意,在上面的情形中,由于我们没有指定一个ID,我们使用的是POST而不是PUT。

    更新文档

    除了可以索引、替换文档之外,我们也可以更新一个文档。但要注意,ES底层并不支持原地更新。在我们想要做一次更新的时候,ES先删除旧文档,然后在索引一个更新过的新文档。

    下面的例子展示了怎样将我们ID为1的文档的name字段改成Jane Doe

    curl -XPOST 'localhost:9200/customer/external/1/_update?pretty' -d '
    {
      "doc": { "name": "Jane Doe" }
    }'
    

    下面的例子展示了怎样将我们ID为1的文档的name字段改成Jane Doe的同时,给它加上age字段:

    curl -XPOST 'localhost:9200/customer/external/1/_update?pretty' -d '
    {
      "doc": { "name": "Jane Doe", "age": 20 }
    }'
    

    更新也可以通过使用简单的脚本来进行。这个例子使用一个脚本将age加5:

    curl -XPOST 'localhost:9200/customer/external/1/_update?pretty' -d '
    {
     "script" : "ctx._source.age += 5"
    }'
    

    在上面的例子中,ctx._source指向当前要被更新的文档。

    注意,在写作本文时,更新操作只能一次应用在一个文档上。将来,ES将提供同时更新符合指定查询条件的多个文档的功能(类似于SQL的UPDATE-WHERE语句)。

    删除文档

    删除文档是相当直观的。以下的例子展示了我们怎样删除ID为2的文档:

    curl -XDELETE 'localhost:9200/customer/external/2?pretty'
    

    查看_delete_by_query API如何删除所有满足查询条件的文档。用Delete By QueryAPI删除所有文档没有直接删除索引效率高,也没啥意义。

    批处理

    除了能够对单个的文档进行索引、更新和删除之外,ES也提供了以上操作的批量处理功能,这是通过使用_bulk API实现的。这个功能之所以重要,在于它提供了非常高效的机制来尽可能快的完成多个操作,与此同时使用尽可能少的网络往返。

    作为一个快速的例子,以下调用在一次bulk操作中索引了两个文档(ID 1 - John Doe and ID 2 - Jane Doe):

    curl -XPOST 'localhost:9200/customer/external/_bulk?pretty' -d '
    {"index":{"_id":"1"}}
    {"name": "John Doe" }
    {"index":{"_id":"2"}}
    {"name": "Jane Doe" }
    '
    

    以下例子在一个bulk操作中,首先更新第一个文档(ID为1),然后删除第二个文档(ID为2):

    curl -XPOST 'localhost:9200/customer/external/_bulk?pretty' -d '
    {"update":{"_id":"1"}}
    {"doc": { "name": "John Doe becomes Jane Doe" } }
    {"delete":{"_id":"2"}}
    '
    

    注意上面的delete动作,由于删除动作只需要被删除文档的ID,所以并没有对应的源文档。

    bulk API按顺序执行这些动作。如果其中一个动作因为某些原因失败了,将会继续处理它后面的动作。当bulk API返回时,它将提供每个动作的状态(按照同样的顺序),所以你能够看到某个动作成功与否。

    相关文章

      网友评论

        本文标题:ElasticSearch入门 官方文档翻译 - 3.Modif

        本文链接:https://www.haomeiwen.com/subject/csdwextx.html