在做报表数据统计时,我们用的是mysql + kafka + Spark Streaming方案,kafka监听m...[作者空间]
编译:诚历,阿里巴巴计算平台事业部 EMR 技术专家,Apache Sentry PMC,Apache Commo...[作者空间]
作者|Stephan Ewen整理|秦江杰本文整理自 Flink 创始公司 Ververica 联合创始人兼...[作者空间]
Apache Flink(下简称Flink)项目是大数据处理领域最近冉冉升起的一颗新星,其不同于其他大数据项目的诸...[作者空间]
经常有人拿 Ignite 和 Spark 进行比较,然后搞不清两者的区别和联系。Ignite 和 Spark,如果...[作者空间]
一个Executor对应一个JVM进程。 从Spark的角度看,Executor占用的内存分为两部分:Execut...[作者空间]
一. Oozie简介 Apache Oozie是用于Hadoop平台的一种工作流调度引擎。 作用 统一调度ha...[作者空间]
前言 近两年,KUDU 在大数据平台的应用越来越广泛。在阿里、小米、网易等公司的大数据架构中,KUDU 都有着不可...[作者空间]
(一) openstack仿照的Amazon的云,hadoop仿照的是Google的云 openstack注重的是...[作者空间]
千图成像:用N张图片拼凑成一张图片。实现原理:先将所要成像的图片转化成马赛克图片,然后从图库中用对应颜色的图片替换...[作者空间]
随着社会的进步,大数据的高需求,高薪资,高待遇,促使很多人都来学习和转行到大数据这个行业。学习大数据是为了什么?成...[作者空间]
概述 在讲清楚了《zookeeper选举》的过程之后,突然有个疑问那就是既然完成了选举了,那么zookeepe...[作者空间]
1、python爬虫:比较详细介绍了爬虫所需要具备的库、工具、爬虫基础知识 2、python爬虫流程 3、pyth...[作者空间]
正常来说 neo4j是用来图存储的,neo4j企业版 的性能远远高于 社区版,毕竟是收费的,不过 只要下载到就可以...[作者空间]
REST,即Representational State Transfer的缩写。直接翻译的意思是"表现层状态转化...[作者空间]
[TOC] 简介 kafka是一个分布式消息队列。具有高性能、持久化、多副本备份、横向扩展能力。生产者往队列里写消...[作者空间]
转自:http://www.aboutyun.com/thread-6242-1-1.html 一、简介 Sqoo...[作者空间]
好久没有更新文章了……这一年过得太忙。准备一篇个人认为值得拿出来分享的文章真的需要很多时间,如果你喜欢,请评论、点...[作者空间]
LDAP入门 首先要先理解什么是LDAP,当时我看了很多解释,也是云里雾里,弄不清楚。在这里给大家稍微捋一捋。 首...[作者空间]
1,注册: 亚马逊云计算中心的网址:https://aws.amazon.com/cn(如果英文可以的,就把结尾的...[作者空间]