什么场景会出现死锁 两个或者两个以上的事务在执行过程中,出现了因为争夺资源造成的一种互相等待情况。 共享锁死锁的情...[作者空间]
更多精彩好文,尽在微信公众号《大数据阶梯之路》 一、数据仓库工程师是什么 首先,我要声明一点,数仓工程师不能有一个...[作者空间]
肝了几个晚上,梳理总结了一份万字长文超详述hive企业级优化文章,也整理了一份hive优化总结思维导图和hive优...[作者空间]
本文会提到52条SQL语句性能优化策略。 1、对查询进行优化,应尽量避免全表扫描,首先应考虑在where及orde...[作者空间]
简单点儿,直接ODS+DM就可以了,将所有数据同步过来,然后直接开发些应用层的报表,这是最简单的了;当DM层的内容...[作者空间]
00背景 规范约束是数仓建设的全流程,以及后续的迭代和运维的参照。事实上,数仓规范文档,应该随着架构设计文档,在数...[作者空间]
索引 索引 索引的建立对于数据库的高效运行是很重要的。索引可以大大提高数据库的检索速度。 索引分单列索引,组合索引...[作者空间]
有一个需求是按月份统计环比和同比值,每次都取一遍非常麻烦,同时也容易出错,这里我把要取的数据报表化,这里提供一个模...[作者空间]
刚参加工作的我们,都以为使用 MySQL 是非常的简单的,无非都是照着 【select from where gr...[作者空间]
视频链接:数仓实战项目[https://www.bilibili.com/video/BV1bv411x7vr?p...[作者空间]
在Hive支持的诸多函数当中,窗口函数是重要的一部分,能够对数据库当中的数据,进行实时分析处理,这也是当下大数据分...[作者空间]
我们先来看看下面的对话,早上上班开完早会的一个聊天: 前情描述 为了方便理解,我们还是以游戏行业来讲述这个案例。在...[作者空间]
一、单行函数 1、字符函数 concat拼接substr截取子串upper转换成大写lower转换成小写trim去...[作者空间]
1.项目目的:基于现有数据,以业务带看情况为主题,搭建实时更新的BI看板。2.基础数据源介绍现有数据源为三张表:带...[作者空间]
前言 之前工作中,有接触到大数据的需求,虽然当时我们体系有专门的大数据部门,但是由于当时我们中台重构,整个体系的开...[作者空间]
工作中常用的 hive 参数调优,整理如下。原则:• 最少数据• 最少字段• 最少Job数• 最少读取次数• 避免...[作者空间]
一条SQL语句过来的流程是什么样的? 1.当客户端连接到MySQL服务器时,服务器对其进行认证。可以通过用户名与密...[作者空间]
前言 在众多SQL中,统计型SQL绝对是让人头疼的一类,之所以如此,是因为这种SQL中必然有大量的判读对比。而条件...[作者空间]
1,索引作用 2,索引的分类(算法) 3,BTree索引算法演变 4,BTree索引功能上的分类 辅助索引 聚集索...[作者空间]
为了一场紧急考试,没有正经系统学习过大数据知识的我开始恶补概念 涉及Hadoop、Hbase、Spark、Flin...[作者空间]