大数据处理业务架构探索

作者: 皮皮杂谈 | 来源:发表于2019-03-04 17:30 被阅读19次

        大数据处理流程包含数据预处理、统计分析、数据挖掘和数据质量管理等系列环节。如下图所示:

数据处理业务架构

        其中,数据预处理是对数据集进行抽样、转换、合并、删除、解析等数据预处理工作,主要是对数据格式、缺失值、异常值、记录、字段等进行处理,以便得到符合后续业务应用、数据统计和挖掘所需的高质量数据。数据统计和数据挖掘是通过大数据挖掘和机器学习模型对海量数据进行挖掘和学习,从而得到潜在的数据知识和规律。同时,作为数据质量相关的工作标准和规范的管理,也贯穿了整个数据处理的过程。        (1)数据预处理为保证入库数据质量和数据规范性,提高存储和数据访问效率,为后续的统计分析功能提供数据基础,我们将数据预处理过程分解成数据质量校验、清洗转换、质量提升三个步骤,采用专家知识库及核心算法库,利用时间序列、数据融合、内存计算等技术,建立数据处理模型,对海量数据进行数据清洗,生成具有一定关系和逻辑的高质量数据。

(2)统计分析数据统计分析。对设备运行的各种指标进行统计分析,包括发电指标统计、光资源指标统计、组件关键运行指标统计、逆变器关键运行指标统计、系统效率指标统计等,提供分类汇总、同比环比、偏差分析、排名分析等统计维度。主要侧重点是对不同维度的数据分布情况、时间变化趋势规律、多维度数据横向比较等进行数据统计计算。

(3)数据挖掘数据挖掘。通过时间序列、聚类分析、关联算法等算法,借助支持向量机等深度学习模型,挖掘历史运行数据中的隐藏规律,为用户提供决策支持。

(4)数据质量管理数据质量管理是数据工作的指导和规范文件,主要用于数据的开发、管理、维护、处理和应用的参照。根据流程将数据工作标准分为数据开发标准、数据处理标准、数据存储标准、数据建模标准和数据应用标准。

相关文章

  • 大数据处理业务架构探索

    大数据处理流程包含数据预处理、统计分析、数据挖掘和数据质量管理等系列环节。如下图所示: 其中,数据...

  • IronCloud:浅谈服务治理与微服务

    互联网架构演变 一体架构 在计算机软件发展早期,一般桌面软件都是采用这种架构,不管是界面还是业务处理还是数据处理都...

  • hudi调研

    最近因为想对业务数据处理架构的调整,想要实现对大数据的增量插入/更新的功能,通过调研,Apache Hudi可以实...

  • 上海五角场机会:大数据平台架构师/Java后台架构师/Web前端

    大数据平台架构师 岗位描述 - 使用Hadoop和Spark技术搭建灵活的大数据处理框架,处理每天数百亿条业务数据...

  • 2018-04-04

    整体架构图 架构说明: 整个数据处理流程包括四部分,一部分是数据接入层,该部分从前端业务系统获取数据;中间部分是最...

  • 领域驱动设计GAP

    公司 创业公司,中小型开发团队,早期业务探索阶段,更多的关注业务逻辑、快速迭代以及验证商业模式,较少去关注技术架构...

  • Android架构方面的归纳

    Android架构探索 标签(空格分隔):Android 概要 也许我们写业务代码的时候,能提升对代码的熟练度。但...

  • 随记:我眼里的架构师

    架构师,分基础架构和业务架构。做业务项目,自然是接触业务架构师比较多。一般业务会划分多领域,每个领域都有自己的架构...

  • 架构的一些记录

    架构可细分为业务架构、应用架构、技术架构,业务架构是战略,应用架构是战术,技术架构是装备。其中应用架构承上启下,一...

  • 架构设计原则

    架构坚持组件化,持续重构,小而美。架构设计十大原则: 1.全面解耦原则:对业务进行抽象建模,业务数据与业务逻辑解耦...

网友评论

    本文标题:大数据处理业务架构探索

    本文链接:https://www.haomeiwen.com/subject/tgniuqtx.html