一、写在前面 2016年,数栈开始正式投入研发,发展至今,已经拥有了:实时开发、离线开发、算法开发这些开发平台;数...[作者空间]
模板概述 基于 Antlr4 编译 hive 相关 xxx.g 文件生成对应的模板,如 hive 源码中: 编译完...[作者空间]
功能特点 nginxWebUI是一款图形化管理nginx配置得工具, 可以使用网页来快速配置nginx的各项功能,...[作者空间]
前言 YARN是一个资源管理系统,负责集群资源的管理和分配。yarn就好比hadoop集群的操作系统,当用户向YA...[作者空间]
1.文档编写目的 在HDFS集群中NameNode存在单点故障(SPOF),对于只有一个NameNode的集群,如...[作者空间]
一、我们先要了解大数据的工作方向 01.大数据工程师 02.数据分析师 03.大数据科学家 04.其他(数据挖掘本...[作者空间]
大家好,我是帅气小伙,由于最近公司项目辗转大数据,需要做数据抽取的工作,kettle是目前比较成熟的ETL工具,而...[作者空间]
Cloudera Engineering Blog 翻译:Offset Management For Apache...[作者空间]
最近一份2018年校招高薪清单在程序员们的朋友圈里刷了屏,人工智能和算法工程师最低年薪30万,谷歌中国更是开出了5...[作者空间]
flume是我2015年为前公司主导开发【统一日志平台】时采用的技术(主要技术栈:flume+ES+Redis+m...[作者空间]
本文摘自 高扬.白话大数据与机器学习.机械工业出版社 最近在招人,大数据方面的人才请联系我 ;-) 从目前市场上的...[作者空间]
Map Reduce & YARN 简介 Apache Hadoop 是一个开源软件框架,可安装在一个商用机器集群...[作者空间]