美文网首页
Introduction to Apache Flink - C

Introduction to Apache Flink - C

作者: 耳边的火 | 来源:发表于2018-12-02 10:36 被阅读7次

处理持续事件数据的目标

能够以较低的延迟处理数据并不是高效流处理的唯一优点。我们对流处理的愿望清单上不仅有高吞吐与低延迟,同时还要要求它有能力应对故障。一个好的流处理技术应该能够在故障发生时,立即重启应用并且仍能计算出精确的结果。换句话说,流处理器应该有这样的特点:它可以在具备故障容忍能力的基础上同时保证数据有且仅有一次(即恰好一次)被处理。
不仅如此,即便通过某种方式实现了上述要求,我们还要要求这种实现方式在没有故障发生时不会消耗太多的资源。如果流处理可以做到基于session的数据处理,那么这对比于一刀切式的处理固定时间段内的数据方式要有用处的多;如果流处理能够对所处理的数据进行正确的排序再进行处理,也会非常有用。对于开发者来说,一套系统在书写代码与修复bug时是否容易使用是很关键的一方面,同时该系统也要运维起来更容易。当然更关键的是,该系统能够按照事件在真实世界发生的顺序来计算结果。例如:能够有能力处理乱序的事件流(一个不幸的事实),能够决定性地替换流(例如,用于审计或调试目的)。

相关文章

  • Introduction to Apache Flink - C

    传统结构与流式结构的对比 传统上,一个数据后端的典型结构是使用数据库来存储业务事务性数据。换句话说,数据库(无论是...

  • Introduction to Apache Flink - C

    消息传输与消息处理 实现一个高线的流式结构并且从使用Flink中获取巨大的便利需要什么?一个常用的方式是,通过实现...

  • Introduction to Apache Flink - C

    初识Apache Flink Apache Flink项目首页的标语写着“Apache Flink是一个可在流数据...

  • Introduction to Apache Flink - C

    这部分很短,大体翻译一下。这一部分大意为:流处理并不是新的事情,持续的流数据时自然存在的事情。只是以前我们没有更好...

  • Introduction to Apache Flink - C

    流处理技术的演化 在离线数据批处理场景中,持续的数据生产与数据消耗是分离的,这使得开发系统的工作变得更简单,但也将...

  • Introduction to Apache Flink - C

    处理持续事件数据的目标 能够以较低的延迟处理数据并不是高效流处理的唯一优点。我们对流处理的愿望清单上不仅有高吞吐与...

  • Introduction to Apache Flink

    原文链接 Continuous Processing for Unbounded Datasets 在详细介绍Fl...

  • Introduction to Apache Flink 翻译

    无链接部分暂不翻译,链接无反应代表还未翻译完成,工作之余翻译,时间琐碎,更新较慢。 1.Why Apache Fl...

  • Flink

    本文主要参考自: Apache Flink 漫谈Apache Flink 漫谈系列 - 序Apache Flink...

  • BI系统套装

    flink 文档https://flink.apache.org/[https://flink.apache.or...

网友评论

      本文标题:Introduction to Apache Flink - C

      本文链接:https://www.haomeiwen.com/subject/saxjcqtx.html