Filebeat Drop Fields

作者: Bean_Do | 来源:发表于2021-07-06 10:57 被阅读0次

Filebeat Drop Fields
2. filebeat 配置记录
Filebeat
Ansible Role 日志分析之【filebeat】
翻译择
Text编程指南(for iOS)三：管理文本字段和文本视图
Beats+ELK日志分析系统搭建【Windows环境】二、使用
filebeat利用kafka进行日志实时传输
ELK经典架构之Filebeat
Filebeat自身日志输出问题

在使用Filebeat导入数据的时候，Filebeat会附带一些环境相关的json数据一起发送到out端，但是在一些日志入库场景下，日志数量庞大，额外的数据字段会带来不必要的磁盘消耗，所以需要在入库的时候剔除掉，那么如何剔除呢？

在满足需求的情况下，我使用了Filebeat自身的剔除逻辑，未使用Logstash相关的功能。在Filebeat中，程序提供了processor模块，用以对数据在发送前进行自定义的处理操作。所以，可以通过此功能，将原始event中的一些不需要的字段进行剔除。

同样，在processor中，可以定义drop_fields，通过这个，就可以drop掉一些不需要的字段，当然，正如官方文档中说的那样，@timestamp和type字段是无法去除的，好在这两个字段不算大，可以保留，至于其他的字段，例如agent、host、cloud等，如不需要，可以直接去掉了，配置方法如下：

Snipaste_2021-07-06_10-45-02.png
但是，有时候，明明配置了drop掉这些字段，但是最后入库的时候仍然会保留这些字段，令人费解，然鹅实际上，drop配置是生效的，但是processor逻辑是可以重复的，也就是我们在自己的process中去掉了，但是有其他的地方又给加回去了，例如filebeat.yml配置文件中的全局processor配置，如下所示：