手机版
网站地图
美文美图
最新动态
你好,欢迎访问
好美文阅读网
个性皮肤
搜索
网站首页
美文
文章
散文
日记
诗歌
小说
故事
句子
作文
签名
祝福语
情书
范文
读后感
文学百科
美文摘抄
节日文章
名家散文
网名大全
座右铭
口号大全
面试技巧
说说大全
阅读答案
诗词默写
流言蜚语
节日祝福
好句子
经典台词
谚语大全
亲情故事
友情故事
表白情书
工作报告
活动总结
心得体会
专题汇总
美文网首页
大数据,机器学习,人工智能
大数据 爬虫Python AI Sql
大数据
阿里大数据工程师:教你如何快速的搭建数据库
阿里大数据工程师:教你如何快速的搭建数据库
作者:
yoku酱
| 来源:发表于
2018-12-26 09:51 被阅读4次
数据仓库
,是为企业所有级别的决策制定过程,提供所有类型数据支持的战略集合。它是单个数据存储,出于分析性报告和决策支持目的而创建。为需要业务智能的企业,提供指导业务流程改进、监视时间、成本、质量以及控制。
下面我们来讲
大数据开发核心流程
。
当我们接到一个需求,首先会进行需求分析,然后做工作流设计,比如这个任务是什么时候跑的、依赖于哪些业务。工作流设计完成后进行数据采集和数据同步。接下去就是数据开发,我们提供了WEB-IDE,支持SQL、MR、SHELL和 PYTHON等。然后我们提供了冒烟测试的场景,测试完成后发布到线上,让它每天定时进行自动调度,并进行数据质量监控。以上步骤都完成后,就能把我们的数据环流到业务系统库,或者用QuickBI、DataV这些工具进行页面展现。
我们设计的任务是离线的,每天会在12点的时候把设计的任务变成一个实例快照。目前我们的任务依赖在业内也是最先进的。
现在最常见的需求就是每天有日报,每周要写周报,每月要写月报。为了节省资源,就可以使用日报的数据直接转成周报或月报。
线上系统在每天6点的时候要保证数据已经回笼到业务系统,系统要开始使用了。
如上图所示,假设有D和E两个任务,它们依赖于B和A。任务D的运行时间是1.5小时,E是2小时。我们必须确保B每天在4点之前把B的任务运行完成,一般正常运行时间是2小时。那就要保证A每天任务完成的时间不晚于2点。如果A的运行时间是10分钟,到1点的时候发现A的任务失败了,这时就能计算出A还剩下多少余量,我们可以进行人工监督排查。在1:50之前人工介入,从而保证任务D和E能在6点前准时产出。
总结
如图所示,MaxCompute是图上小人的“心脏”,所有运行的任务都在MaxCompute里面。调度是数据架构的“大脑”。“眼睛”是数据监控,目前在数据架构平台上它还是一个“近视眼”,还没有正式推出。数据集成就像两只“手”,不停地从其它地方搬运数据。底层的开发环境和运维中心就像两条“腿”,保证整个数据架构平台走得更远。而数据质量就像是一个“人体健康中心”,也就是数据质量的监控。
对大数据的概念都是模糊不清的,大数据是什么,能做什么,学的时候,该按照什么线路去学习,学完往哪方面发展,想深入了解
想学习的同学欢迎加入大数据学习qq群:458345782,有大量干货(零基础以及进阶的经典实战)分享给大家
并且有清华大学毕业的资深大数据讲师给大家免费授课,给大家分享目前国内最完整的大数据高端实战实用学习流程体系 。
相关文章
网友评论
大数据,机器学习,人工智能
大数据 爬虫Python AI Sql
大数据
程序员
大数据开发
本文标题:
阿里大数据工程师:教你如何快速的搭建数据库
本文链接:
https://www.haomeiwen.com/subject/sriclqtx.html
延伸阅读
那年盛夏诗歌
环境监察队工作总结范文
优秀教师学习心得范文
华胥引的读后感300字
《Its red》教学反思范文
农资购销的合同范本
竞选中队委优秀演讲稿
辞金蹈海的成语解释
《世纪宝鼎》公开课教案设计
因为爱你,所以牵挂
今生今世红尘醉——美到
一个90后的内心独白
致已逝去的高中年华
深度阅读
您也可以注册成为美文阅读网的作者,发表您的原创作品、分享您的心情!
情人节
母亲节
重阳节
清明节
端午节
植树节
元宵节
妇女节
愚人节
圣诞节
父亲节
教师节
儿童节
劳动节
青年节
建军节
万圣节
平安夜
光棍节
中秋节
国庆节
感恩节
腊八节
更多话题
栏目导航
大数据,机器学习,人工智能
大数据 爬虫Python AI Sql
大数据
程序员
大数据开发
摄影
故事
互联网
读书
旅行
热点阅读
36号公园推荐:孩子最重要的“黄金八年”,怎么教?不看亏大了!
乱世佳人|斯佳丽的表白及与瑞特初遇
《行走在城市角落的蚁族》第十五章 分手快乐
GridView.extent中maxCrossAxisExte
用享元模式写一个文件上传控件
熬一次夜,死一次
寻找蓝天计划——西双版纳游学营
如何把作文分数提高到35分以上
6部经典电影英文台词,哪一句最打动你!
git常用命令
大数据,机器学习,人工智能
[深蓝] 视觉SLAM进阶:从零开始手写VIO
干货 | 阿里巴巴HBase高可用8年抗战回忆录
小团队?大数据!
超全的并发编程模型总结
快学Scala1-逻辑控制
快学Scala2-数组
快学Scala3-类
快学Scala4-对象
2016年的十大技术趋势之机器学习:一切都关乎数据
完美解决 Spark:java.net.URISyntaxExc
大数据 爬虫Python AI Sql
复盘-如何使用金数据打造一次成功的选美活动
SQLite数据库框架--FMDB
MySQL基本操作
你们是不是很缺大数据工程师?
大数据猿们,是时候想想这几个问题了
史上最全Python数据分析学习路径图
NodeJS基础
使用Visual Studio Code搭建Python开发环境
数据分析|移动应用APP数据分析方法论
Python即时网络爬虫项目: 内容提取器的定义
大数据
大数据后要有大结果
小机器成就大数据
互联网世界的“人工智能”——探秘“深度学习”的前世今生
2014DTCC-中国数据库技术大会经历篇(一)
Hadoop DataNode的读和写流程
从《大数据时代》谈起
开机必用神器(二)
“神”之降临——人在哪里?
也谈大数据
hbase介绍与安装
程序员
开源 BI 工具 Metabase 简介
对象和引用
Python中list的实现
iOS 开发入门
领域驱动设计DDD和CQRS落地
字符编码的奥秘
传统 Ajax 已死,Fetch 永生
nodejs中异步
Web 服务器性能与站点访问性能优化思路
mysql & mongo aggregate
大数据开发
到底学不学大数据?来看看大咖对大数据发展未来趋势的预测
直接影响你薪资的一套大数据企业面试题,看完记得收藏转发哦!
10行代码-利用Python做一个微信聊天机器人
python开发源码:调用摄像头并进行人脸识别截图
强烈推荐收藏的大数据平台常见开源工具集锦
大数据采集、清洗、处理:使用MapReduce进行离线数据分析完
DKhadoop大数据平台基础框架方案概述
Hadoop SQL客户端工具之Dbeaver安装及使用
你将被机器人取代!数据科学即将迎来“无代码”时代
Spark大数据平台应用实战
网友评论