美文网首页
01-Flink是什么

01-Flink是什么

作者: 蜗牛写java | 来源:发表于2019-08-24 21:50 被阅读0次

01-Flink是什么

背景

​ 2010年到2014年,由柏林工业大学、柏林洪堡大学和哈所普特拉纳研究所联合发起名为“Stratosphere”的研究项目;早期主要关注批处理;2014年4月,Stratosphere代码被贡献给Apache软件基金会,称为Apache基金还孵化器项目。在项目孵化期间,更名为Flink。Flink在德语中是快速灵敏的意思,用棕红色松鼠作为Flink项目Logo,用来体现流式处理器速度快和灵活快速特点。

stratophere-flink.png

Apache Flink 是什么

​ 开源的,同时支持高吞吐低延迟高性能的分布式框架。

​ 一个用于对无界有界数据流进行状态计算的分布式处理引擎。

无界流

​ 有开始但是没有结束,不会在生成数据的时候终止流并提供数据。无界流必须连续的被处理,也就是事件被注入的时候必须被处理。他不太可能等待所有输入数据的到来,因为输入是无界,并且将来也不会在任意时刻结束。处理无界的数据常常需要被注入的事件是按照某一个顺序的,比如按照事件的发生顺序,并且和前面完成的结果是有关联的。

例:商场的中的滚动电梯

有界流

​ 有开始也有结束,有界流可以在计算之前注入全部的数据,处理有节数据流不需要有序的注入,因为有界的数据集总是有序的,最为熟知的处理有界数据就是批处理。

例:商场中的直行电梯

flink擅长处理有界和无界数据集

有状态流计算架构

数据产生的本质,其实是一条条真实存在的事件。批处理(包括微批处理)其实都是在一定程度上违背了这种本质,需要通过在一定时延的情况下对业务数据进行处理,然后得到基于业务数据统计的准确结果;基于流式计算技术的局限性,我们很难在数据产生过程中进行计算并直接产生统计结果。而有状态计算架构的提出,从一定程度上满足了企业的这种需求,企业基于实时的流式数据,维护所有计算过程的状态,所谓状态就是计算过程中产生的中间计算结果,每次计算新的数据进入到流式系统中都是基于中间状态的基础上进行计算,最终产生正确的统计结果。基于有状态计算的方式最大的优势是不需要将原始数据从新从外部存储中拿出来,从而进行全量计算,因为这种计算方式的代价可能是非常高的。从另一个角度讲,用户无需通过调度和协调各种批量计算工具,从数据仓库中获取数据进行统计结果,然而再落地存储,这些操作全部都可以基于流式计算完成,可以极大减轻系统对其它框架的依赖,减少数据计算过程中的时间损耗以及硬件存储。

有状态计算.png

​ flink通过实现Google Dataflow流式计算模式实现了高吞吐、低延迟、高性能;三者兼具的实时流式计算框架。

Flink特性

  • 支持批处理和流处理
  • 同时支持高吞吐、低延迟、高性能
  • 支持事件事件概念
  • 支持窗口操作
  • 支持有状态计算
  • 基于轻量级分布式快照实现的容错
  • 自动反压机制
  • 基于JVM实现独立的内存管理
  • 集成yarn/hdfs/hbase和其它Hadoop生态系统的组件

Flink使用场景

  1. 事件驱动(Event-driven Applications)
    1. 车载传感器
    2. 机械设备实时故障检测
  2. 实时分析(Data Analytics Applications)
    1. 实时只能推荐
    2. 实时欺诈检测
  3. 管道式ETL(Data Pipeline Applications)

相关文章

  • 01-Flink是什么

    01-Flink是什么 背景 ​ 2010年到2014年,由柏林工业大学、柏林洪堡大学和哈所普特拉纳研究所联合...

  • 01-flink简介

    本篇使用Java Flink1.12Apache Flink is a framework and distrib...

  • 发展

    承诺是什么?努力是什么?心态是什么?理想是什么?亲情是什么?爱情是什么?朋友是什么?自己是什么?当换了环境,...

  • 我真的害怕忘记

    空气是什么 等是什么 切断是什么 我是什么 光海是什么 爱是什么 风帆是什么 你是什么 (呼吸还在吗 恐...

  • 烦恼如何被消灭

    纠结是什么?烦恼又是什么?心是什么?阴阳又是什么?境是什么?世界又是什么?扭曲是什么?变形又是什么?真实是...

  • 疑问

    误会是什么?坚持是什么?执着是什么?三观是什么?背信弃诺又是什么? 烦躁是什么?焦躁是什么?疑...

  • 一颗心的漂流

    离开的是什么 留下的是什么 挣脱的是什么 奔赴的是什么 守护的是什么 向往的是什么 生命是什么 生活是什么 爱是什...

  • 是什么就是什么

    26岁,终于知道为什么矛盾的时候无法自持,情绪化的时候疯狂到无法控制,忧郁的时候想离开这个世界。 26岁,终于...

  • 是什么?还是什么

    世界上最尴尬的事,是否就是,胸中有千言万语,落笔却一句难寻。 现在2018年01月25日凌晨两点,某个...

  • 是什么就是什么

    任何一项任务都有其专属的评判指标,有的人能达到,有的人达不到,这也就使得一部分人成为领导或专家,一部分人只能成为下...

网友评论

      本文标题:01-Flink是什么

      本文链接:https://www.haomeiwen.com/subject/cmhcectx.html