美文网首页
flume配置介绍

flume配置介绍

作者: 紫玥迩 | 来源:发表于2016-07-06 17:12 被阅读173次

介绍

Paste_Image.png

source: 搜集信息
channel:传递信息
sink:存储信息

概念

Paste_Image.png
  1. Flume支持用户建立多级流,多个agent可以协同工作,并且支持Fan-in、Fan-out、Contextual Routing、Backup Routes.
  2. Flume提供了大量内置的Source、Channel和Sink类型。不同类型的Source,Channel和Sink可以自由组合。组合方式基于用户设置的配置文件.
  3. Flume在传完文件之后,将会修改文件的后缀,变为.COMPLETED。
    如果一个source对应多个channel,默认就是每个channel是同样的一份数据,会把这批数据复制N份发送到N个channel中,所以如果某个channel满了会影响整体的速度.
    flume组件启动顺序:channels——>sinks——>sources,关闭顺序:sources——>sinks——>channels.

案例1

example.conf

#agent1表示代理名称
#对agent1的各个组件命名
agent1.sources=source1
agent1.sinks=sink1
agent1.channels=channel1
#配置source1
agent1.sources.source1.type=spooldir
agent1.sources.source1.spoolDir=/usr/aboutyunlog
agent1.sources.source1.channels=channel1agent1.sources.source1.fileHeader = false
#配置sink1
agent1.sinks.sink1.type=hdfs
agent1.sinks.sink1.hdfs.path=hdfs://master:8020/aboutyunlog
agent1.sinks.sink1.hdfs.fileType=DataStream
agent1.sinks.sink1.hdfs.writeFormat=TEXT
agent1.sinks.sink1.hdfs.rollInterval=4agent1.sinks.sink1.channel=channel1
#配置channel1
agent1.channels.channel1.type=file
agent1.channels.channel1.checkpointDir=/usr/aboutyun_tmp123
agent1.channels.channel1.dataDirs=/usr/aboutyun_tmp

启动

./bin/flume-ng agent -n agent1 -c conf -f example.conf -Dflume.root.logger=DEBUG,console

在/usr/aboutyunlog下新建txt并写入内容
查看结果

/opt/hadoop/bin/hadoop fs -ls /aboutyunlog
/opt/hadoop/bin/hadoop fs -cat /aboutyunlog/FlumeData.1467471199682

案例2

example.conf

a1.sources = r1
a1.sinks = k1
a1.channels = c1

a1.sources.r1.type = netcat
a1.sources.r1.bind = localhost
a1.sources.r1.port = 44444

a1.sinks.k1.type = logger

a1.channels.c1.type = memory
a1.channels.c1.capacity = 1000
a1.channels.c1.transactionCapacity = 100

a1.sources.r1.channels = c1
a1.sinks.k1.channel = c1

启动
-c/--conf 后跟配置目录,-f/--conf-file 后跟具体的配置文件,-n/--name 指定agent的名称

bin/flume-ng agent --conf conf --conf-file example.conf --name a1 -Dflume.root.logger=INFO,console

参考文章

官网API-DeveloperGuide
(重要)官网API-UserGuide
让你快速认识flume及安装和使用flume1.5传输数据(日志)到hadoop2.2
Flume内置channel,source,sink三组件介绍
flume参考文档
flume简介及配置实战
flume组件类型

相关文章

  • flume配置介绍

    介绍 source: 搜集信息channel:传递信息sink:存储信息 概念 Flume支持用户建立多级流,多个...

  • 从一份配置清单详解Flume服务器配置

    一.概述: 这是一份我们机器使用的Flume的配置,今天我们以这份配置文件详细介绍下flume的使用方法。 这台机...

  • Flume连接HDFS和Hive

    Flume连接HDFS 进入Flume配置 配置flume.conf 测试telnet通信 查看日志找到HDFS文...

  • flume实战1

    Flume实战: Flume的使用关键就是配置文件 A)配置source B)配置Channel C)配置SInk...

  • Flume 实战

    概述 Flume官网配置文档 使用Flume的关键就是写配置文件A) 配置SourceB) 配置ChannelC)...

  • Flume

    安装Flume 1.6.0-cdh5.7.0 配置环境变量 配置Flume JAVA_HOME 配置 conf 启...

  • 尚硅谷大数据技术之Flume

    4.执行配置文件分别开启对应配置文件:flume3-flume-logger.conf,flume2-netcat...

  • Flume学习系列(一)----总体介绍

    前言:本文是flume学习系列的开篇,主要介绍了flume的各种组件及相关配置。但是本篇文章并不打算从环境搭建开始...

  • flume介绍及基本配置

    Flume是一个分布式的,可靠的,可用的,非常有效率的对大数据量的日志数据进行收集、聚集、移动信息的服务。Flum...

  • Flume安装

    flume下载地址 下载Flume文件包 配置文件备份

网友评论

      本文标题:flume配置介绍

      本文链接:https://www.haomeiwen.com/subject/rtykjttx.html