美文网首页大数据协作框架我爱编程
Flume在企业大数据仓库中数据收集架构

Flume在企业大数据仓库中数据收集架构

作者: 明明德撩码 | 来源:发表于2018-03-26 10:31 被阅读24次

数据仓库架构

  • 文件数据和关系数据


  • 企业大数据仓库之数据收集架构||linux


  • 企业大数据仓库之数据收集架构||window


总结

  • 实时收集文件框架有很多,但是其中Flume使用最广泛,主要由于其架构设计和使用简单清晰明了,又支持Hadoop存储。
  • Flume是针对日志文件数据进行实时收集的框架,一个程序其实就是一个Flume Agent,包含三个部分Source、Channel及Sink。
  • 在企业中针对实时分析统计要求高,通常使用Flume进行实时收集文件数据,再给Kafka类似的消息队列框架进行可靠性存储,最后又实时分布式框架进行计算;当然也是用Flume将数据收集以后放入HDFS中或检索框架Solr等中。

相关文章

网友评论

    本文标题:Flume在企业大数据仓库中数据收集架构

    本文链接:https://www.haomeiwen.com/subject/djvlcftx.html