这篇文章介绍的思路和方法,不仅适用于公众号的编辑和排版,对于其他支持 Markdown 的博客网站,如 csdn、...[作者空间]
在如何用Github搭建博客中,我们基于 Git 仓库建立了一个分支 blog-source 来管理博客的源码,每...[作者空间]
搭建的博客的域名是 padluo.github.io,自定义域名为 www.padluo.ml,现在已经运行在 G...[作者空间]
GBDT 是表格型数据挖掘比赛的大杀器,其主要思想是利用弱分类器(决策树)迭代训练以得到最优模型,该模型具有训练效...[作者空间]
pphhCentOS安装tensorflow-gpu的过程遍地是坑,有条件的哥们还是遵从Tensorflow官方建...[作者空间]
应用背景 有时想看看大数据平台上Hive表的结构和数据字典,或者对数据进行简单查询、核验,可以装一个SQL开发工具...[作者空间]
macOS搭建Python的cx_Oracle开发环境的过程总结。 环境与版本, OS: macOS High S...[作者空间]
数据取值与选择 NumPy数据取值的方法,包括取值操作(如arr[2, 1])、切片操作(如arr[:, 1:5]...[作者空间]
背景介绍 在日常工作中,我们可以在一个shell脚本里面利用spark-sql -e执行sql脚本,而且可以传参数...[作者空间]
Spark版本 cdh5.9.0集成的spark的版本1.6.0,集成的hadoop版本2.6.0。查看的网址: ...[作者空间]
主备切换机制原理剖析 Master可以配置两个,Spark原生的standalone模式支持Master主备切换。...[作者空间]
TaskScheduler的初始化机制 TaskScheduler,如何注册Application,executo...[作者空间]
Standalone模式 提交Spark应用的机器,Application(自己的Spark程序),spark-s...[作者空间]
Kafka概述 a distributed streaming platform Kafka架构和核心概念 pro...[作者空间]
业务现状分析 我们有很多servers和systems,比如network device、operating sy...[作者空间]
问题引入 数据生产者的分组策略? 如何保证数据的完全生产? partition数量和broker数量关系? 每个p...[作者空间]
应用场景 在解决内网环境集群主机的时间同步问题时,遇到了ntp的错误no server suitable for ...[作者空间]
Zookeeper简介 Zookeeper是一个分布式协调服务,为用户的分布式应用程序提供协调服务。 为别的分布式...[作者空间]
环境安装软件准备 CentOS-7-x86_64-Everything-1611.iso spark-2.0.1-...[作者空间]
CDH Hadoop系列目录: Hadoop实战(3)_虚拟机搭建CDH的全分布模式 Hadoop实战(4)_Ha...[作者空间]