大数据是对海量数据存储、计算、统计、分析等一系列处理手段,处理的数据量是TB级,甚至是PB或EB级的数据,是传统数...[作者空间]
大数据有两个方向,一个是偏计算机的,另一个是偏经济的。你学过Java,所以你可以偏将计算机的。 Java程序员想转...[作者空间]
一、前言 Spark作为大数据计算引擎,凭借其快速、稳定、简易等特点,快速的占领了大数据计算的领域。本文主要为作者...[作者空间]
分析技术 数据处理:自然语言处理技术 统计和分析:关联规则分析、分类、聚类 模型预测:预测模型、机器学习、建模仿真...[作者空间]
Sqoop是什么 Sqoop:SQL-to-Hadoop 连接 传统关系型数据库 和 Hadoop 的桥梁 把关系...[作者空间]
lume是干什么的? 收集日志的 flume如何搜集日志? 我们把flume比作情报人员 (1)搜集信息 (2)获...[作者空间]
Zookeeper是什么 是一个针对大型分布式系统的可靠协调系统; 提供的功能包括:配置维护、名字服务、分布式同步...[作者空间]
Flume的安装与综合使用https://www.jianshu.com/p/90e17b80f366 实时日志采...[作者空间]
HBase是一个构建在HDFS上的分布式列存储系统,主要用于海量结构化数据存储,从逻辑上讲,HBase将数据按照表...[作者空间]
MapReduce适合PB级以上海量数据的离线处理 MapReduce不擅长什么 实时计算 像MySQL一样,在毫...[作者空间]
1.简述如何安装配置apache 的一个开源的hadoop 2.列出hadoop 集群中的都分别需要启动哪些进程 ...[作者空间]
感谢你的观看,如果感觉写的不错,你可以关注一下我的微信公众号,也可以加入我们的大数家庭群。 微信公众号:程序员Of...[作者空间]
HDFS优点 高容错性 数据自动保存多个副本 副本丢失后,自动恢复 适合批处理 移动计算而非数据 数据位置暴露给计...[作者空间]
HDFS:分布式存储系统(Hadoop Distributed File System):提供了高可靠性、高扩展性...[作者空间]
很多人都知道大数据很火,就业很好,薪资很高,想往大数据方向发展。但该学哪些技术,学习路线是什么样的呢?用不用参加大...[作者空间]
摘要:12月13日,阿里发布全球首款智能互联的网络产品--云骨干网(Cloud Backbone Network)...[作者空间]
摘要:随着人工智能的火热,越来越多朋友想要进入深度学习领域,但是总会遇到一个问题:想要系统的入门,但是身边的资料铺...[作者空间]
全球100款大数据工具汇总 Talend Open Studio 是第一家针对的数据集成工具市场的ETL(数据的提...[作者空间]
一文教你看懂大数据的技术生态圈 Hadoop,hive,spark 原文地址:http://data.qq.com...[作者空间]
背景 双十一购物狂欢节马上又要到来了,最近各种关于双十一的爆品购物列表在网上层出不穷。如果是网购老司机,一定清楚通...[作者空间]