又到了一年年末,2016年发生了太多。谷歌的围棋机器人“阿尔法狗(AlphaGo)”在比赛中击败了围棋世界冠军李世...[作者空间]
在互联网时代,或者说是碎片化时代,很多人多会抱怨自己忙的没有时间,然而打开手机查看耗电情况,每天与实时通讯的...[作者空间]
大数据技术正飞速地发展着,催生出一代又一代快速便捷的大数据处理引擎,无论是Hadoop、Storm,还是后来的Sp...[作者空间]
大数据应用已经十分广泛,需求越来越大,先不说使用的程度如何,但作为数据工程师你知道最重要的能力是什么吗?下面大圣众...[作者空间]
自定义实现wordcount的workflow 在yarn上测试wordcount程序 生产一个应用目录,并把wo...[作者空间]
本节我们将向大家介绍 Numpy 数组计算的一些进阶技巧。 数组相加 在之前的课程中我们曾经谈到过 Numpy 数...[作者空间]
大数据几乎是新兴行业当中绕不开的话题了,当真正接触或从事大数据以后,应该以什么思路去把这个不容易啃的硬骨头解决掉呢...[作者空间]
1.HBase和Hive都是基于Hadoop,为什么Hive查询起来非常慢,但HBase不是? Hive是类SQL...[作者空间]
刚开始使用cassandra的时候,不太清楚为什么要使用cassandra。在想用mysql或redis等不是可以...[作者空间]
大数据技术不断升温,相关技术人才的市场需求也日益看涨。跟随大圣众包威客平台(www.dashengzb.cn)一起...[作者空间]
WOT2016大数据技术峰会将于2016年11月25、26日在北京粤财JW万豪酒店召开。数十位大数据领域一线专家、...[作者空间]
调用 Numpy 库中的相关函数,我们可以很方便地运用 Python 进行数组的统计汇总,本节将向大家演示 Pyt...[作者空间]
我是猴子,一个从二本院校,通过蜕变,成功保送到中国科学院的研究生,毕业后在 IBM 工作过两年。现从事数据分析工作...[作者空间]
随着一阵阵冷空气的来袭,大城市的夜似乎也降温了许多,然而啤酒、烤串、小龙虾的滋味似乎还留香唇齿间,不管是夏天还是冬...[作者空间]
引言 近年来涌现出越来越多的非结构化数据,我们很难直接利用传统的分析方法从这些数据中获得信息。但是新技术的出现使得...[作者空间]
Spark Streaming 在数据接收与导入方面需要满足有以下三个特点: 兼容众多输入源,包括HDFS, Fl...[作者空间]
在 Spark Streaming 中,DStreamGraph 是一个非常重要的组件,主要用来: 通过成员 in...[作者空间]
一个 Streaming Application 往往需要7*24不间断的跑,所以需要有抵御意外的能力(比如机器或...[作者空间]
Java之美[从菜鸟到高手演练]之初识Hadoop - 智慧演绎,无处不在 - 博客频道 - CSD...[作者空间]
前言 Gephi是一款开源免费跨平台基于JVM的复杂网络分析软件, 其主要用于各种网络和复杂系统, 特别是在处理网...[作者空间]