Flume搭建测试

作者: 玄月府的小妖在debug | 来源:发表于2016-11-10 16:54 被阅读394次

Flume搭建测试
Hadoop大数据部门组织架构
Flume连接HDFS和Hive
Hadoop+zookeeper+Flume+Spark+Kaf
关于java进程占用cpu很高的问题定位
flume-1.9.0安装部署测试
flume测试
Flume 环境搭建
Flume学习系列(一)----总体介绍
flume测试配置

一、环境

hadoop2.7.1集群
flume1.7.0
source为syslog
sink为hdfs

二、安装

1.下载安装包
http://flume.apache.org/
2.解压

cp apache-flume-1.7.0-bin.tar /home/cms/flume```
**3.配置环境变量**
```export FLUME_HOME=$HOME/flume
CLASSPATH以及PATH```
**4.测试是否安装成功**
```flume-ng version```

![](https://img.haomeiwen.com/i1908836/eff9fefcdb8390df.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)
**5.配置flume**
注意，我这里使用的**source**为syslog
**sink**为hdfs
其他配置可参考[flume官网](http://flume.apache.org/FlumeUserGuide.html)
进入flume/conf目录
1）修改 flume-env.sh 配置文件,主要是JAVA_HOME变量设置

export JAVA_HOME=/usr/lib/jvm/java-6-sun

export JAVA_HOME=/usr/lib/jvm/java-7-openjdk-amd64

2)创建agent配置文件

cp flume-conf.properties.template flume-conf.properties```
配置souce、sink、chanel
听TCP端口作为数据源(还可以使用其他作为数据源），然后将数据写入hdfs
将文件里面的都注释掉
写入

a1.sources = r1
a1.sinks = k1
a1.channels = c1
# Describe/configure the source
a1.sources.r1.type = syslogtcp
a1.sources.r1.port = 5140
a1.sources.r1.host = 192.168.31.131
a1.sources.r1.channels = c1
# Describe the sink
a1.sinks.k1.type = hdfs
a1.sinks.k1.channel = c1
a1.sinks.k1.hdfs.path = hdfs://master:9000/flume/syslogtcp
a1.sinks.k1.hdfs.filePrefix = syslog
 
a1.sinks.k1.hdfs.fileType = DataStream
a1.sinks.k1.hdfs.roundValue = 10
a1.sinks.k1.hdfs.roundUnit = minute
# Use a channel which buffers events in memory
a1.channels.c1.type = memory
a1.channels.c1.capacity = 1000
a1.channels.c1.transactionCapacity = 100
#yi bai tiao jiu submit

三、测试

1.启动agent
flume-ng agent --conf ./conf/ -f /home/cms/flume/conf/flume-conf.properties -n a1 -Dflume.root.logger=INFO,console
--conf对于的是flume下的conf目录
-f 对应的是agent配置文件
-n 对于的是agent的名字
2.输入测试数据
打开另一个终端，

echo "hello'\t'word" | nc 192.168.31.131 5140

3.hdfs上查看读取到的数据

四、参考文档

1.官网
 2.flume 1.4的介绍及使用示例
 3.Flume-ng分布式环境的部署和配置(一)

五、总结

flume 与 spark streaming初探失败
一直报

不知道怎么解决
考虑到一般是用kafka与spark连接，所以暂时放弃

网友评论

本文标题：Flume搭建测试

本文链接：https://www.haomeiwen.com/subject/zvrxpttx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

Flume搭建测试

一、环境

二、安装

export JAVA_HOME=/usr/lib/jvm/java-6-sun

三、测试

四、参考文档

五、总结

相关文章

Flume搭建测试

Hadoop大数据部门组织架构

Flume连接HDFS和Hive

Hadoop+zookeeper+Flume+Spark+Kaf

关于java进程占用cpu很高的问题定位

flume-1.9.0安装部署测试

flume测试

Flume 环境搭建

Flume学习系列(一)----总体介绍

flume测试配置

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

大数据，机器学习，人工智能

大数据

互联网&大数据应用学习