前言
作为一个程序员大家都应该知道现在Flink里面是比较吃香的。Flink源的分布式流式处理框架不仅提供准确的结果,甚至在出现无序或者延迟加载的数据的情况下。Flink状态化的容错的,同时在维护一次完整的的应用状态时,能无缝修复错误。在大规模运行,在上千个节点运行时有很好的吞吐量和低延迟。
Flink简介
Flink是一个针对流数据和批数据的分布式引擎,主要由 java 代码实现
运行速度比Spark更快,计算量越大,性能优势更明显
真正的流计算,就像Storm一样,同时也支持批处理
比Spark更轻量级的容错
支持 scala和 Java API
相比Flink、Spark、Storm
Flink生态圈
看到这张图可以看出
支持Java和Scala API
支持Table(SQL)
支持图操作(Flink Gelly)
支持机器学习(Flink ML)
支持将Flink程序部署到YARN
怎么学习Flink大纲
有很多的小白不知道怎么去学习Flink,走了不少的盲区,下面是小编整理的大纲,希望对大家有用!
Flink基本概念和编程模型
Flink程序的基础构建模块是流(streams)与转换(transformations),每一个数据流都起始于一个或多个source,并且终止于一个或多个sink。
时间窗口:
流上的聚合需要由窗口来划定范围,比如"计算过去的5分钟"或者"最后的100个元素的和"。窗口通常被区分为不同的类型,比如滚动窗口(没有重叠),滑动窗口(有重叠),以及会话窗口(由不活动的间隙所打断)
如图:
Flink知识点
下面是小编整理的一些关于Flink的知识点,希望大家能够喜欢。
想要获取的小伙伴可以私信小编【学习】即可获取哦~~~
适合小白的入门新一代大数据计算引擎 Flink从入门到实战
网友评论