美文网首页
Flink简介

Flink简介

作者: yayooo | 来源:发表于2019-08-23 00:00 被阅读0次

Flink是一个分布式处理引擎,对无界数据流和有界数据流进行\color{red}{状态}计算。

流数据(双十一)
传统数据架构是基于有限数据集的

目标:

  • 低延迟
  • 高吞吐
  • 结果的准确性和良好的容错性

二、行业

  • 电商和市场营销
    数据报表,广告投放,业务流程

  • 物联网(IOT)
    传感器实时数据采集和显示,实时报警,交通运输业

  • 电信业
    基站流量调配

  • 银行和金融业
    实时结算和通知推送,实时检测异常行为

书:Stream Processing with Apache Flink


传统数据处理架构



CRM: 客户关系管理系统
order System : 订单系统
问题:


从传统数据库将数据进行ETL,放到数仓里面。
问题:延迟高


数据流 -》 处理逻辑 -》 本地状态 -》 周期性检查点 -》 落盘


Batch Layer 批处理(延迟)
Stream Processor 实时处理(准确性有问题)

ProcessFunction 过程函数,最底层API,啥都能干。
DataStream API
SQL/Table API 最抽象,未开发完


相关文章

  • FLINK实战-使用CEP进行网站状态监控报警和报警恢复

    flink CEP 简介 flink CEP(Complex event processing),是在Flink之...

  • Flink的API操作

    1、Flink简介 官网[https://flink.apache.org/zh/] Apache Flink® ...

  • flink简介

    Flink简介 其结构图如下: Flink架构 Flink的分布式执行主要分成两个重要进程:master和work...

  • Flink简介

    Flink是一个分布式处理引擎,对无界数据流和有界数据流进行计算。 流数据(双十一)传统数据架构是基于有限数据集的...

  • Flink简介

    1.初识Flink Flink起源于Stratosphere项目,Stratosphere是在2010~2014年...

  • Flink简介

    Flink是什么? flink Apache的一个顶级开源项目,同时它是一个 可以处理有界和无界数据流 的...

  • Flink简介

    一、Flink概述Apache Flink是一个框架和分布式处理引擎,用于对无界和有界数据流进行有状态计算。Fli...

  • Flink简介

    第一章 初识Flink 大数据开发总体架构 数据传输层:常用的数据传输工具有Flume、Sqoop、Kafka。F...

  • Apache Flink 进阶(四):Flink on Yarn

    简介: 本文主要介绍 Flink on Yarn/K8s 的原理及应用实践,文章将从 Flink 架构、Flink...

  • Flink QuickStart

    简介 本篇讲解如何创建Flink的初始项目。 Flink支持使用Java或者Scala语言来编写Flink应用。这...

网友评论

      本文标题:Flink简介

      本文链接:https://www.haomeiwen.com/subject/xzcusctx.html