美文网首页大数据
企业数据采集系统建设思考要点

企业数据采集系统建设思考要点

作者: 有点胖的瘦子 | 来源:发表于2022-04-30 08:26 被阅读0次

大范围的数据采集可能会遇到的问题

  • 数据类别多
  • 设计平台组件多
  • 采集周期长,接入新的数据类型周期长,需要经过需求评审、开发、测试、联调、数据核对、上线。
  • 接入效率低,采集稳定性:接入每种数据类型需要和业务方对接,效率不高,采集过程出现异常中断,不能及时感知到

明确采集哪些数据

  • 定义采集对象:
    • 包括逻辑名及主要采集字段

数据提取方案

整体方案

  • 从现有源头系统(或组件)的表直接获取
  • 从现有源头系统(或组件)的API服务中直接获取
  • 让采集源头系统(或组件)进行推送,一般适合于自研系统
  • 解析源头系统(或组件)的配置文件获取关系数据

具体采集源头的数据获取思路

  • 例如:通过JDBC的方式访问核心业务表A数据
  • 例如:通过API的方式访问核心业务表B数据

已知采集方案优缺点对比

  • 不同方案的优点和缺点
  • 对比维度包括:侵入性、接入速度、耦合性、数据实效性
  • 给出推荐方案

自研数据上报方案

  • 展示数据流图
  • 客户端设计说明
    • 如何支持数据质量检测通用规则
    • 如何支持已定义的通用数据模型打包
  • 服务端设计说明
    • 鉴权机制
    • 数据入库服务
    • 大量数据下数据限流机制
  • 数据模型介绍
    • 采集入库的模型及关系
  • 数据安全性介绍
    • 如何确保数据不是伪造的?
    • 签名机制
  • 采集模式介绍
    • 增量采集模式
    • 全量采集模式
    • 定期采集模式
    • 实施采集模式
  • 数据存储机制
    • 根据实际数据量,进行数据库选型
    • 从使用者角度,设计数据宽表
    • 核心数据表说明
  • 数据更新模式说明
    • 支持同步更新,确保实时性
    • 支持全量跟新,确保数据完整性
  • 数据生命周期
    • 采集源头下线机制

系统监控

数据等级

  • 不同采集源系统对应不同的数据等级
  • 不同等级的数据,发生问题时走不同的告警方式

告警

  • 告警信息模板定义
  • 紧急通知渠道定义,例如电话或者短信

日常通报

  • 没有问题也发发送日报给干系人

系统自监控

  • 容易产生性能问题的核心组件,利用第三方系统进行自监控及预警机制
    • 例如数据阻塞

数据质量对比

  • 一般都是事后对比
  • 定期执行数据质量规则定义,并预警异常
  • 数据采集趋势对比:当日vs 7日内平均值

相关文章

  • 企业数据采集系统建设思考要点

    大范围的数据采集可能会遇到的问题 数据类别多 设计平台组件多 采集周期长,接入新的数据类型周期长,需要经过需求评审...

  • 有没有更好的信息收集软件

    企业信息采集软件 企业名录、电话号码、大数据信息搜索采集系统 企业公司店铺行业电话销售号码名录数据信息搜索采集软件

  • 数据仓库概念

    # 数据仓库概念 定义:为企业所有决策制定过程,提供所有系统数据支持的战略集合。 数据包括:日志采集系统,业务系统...

  • C#对接modbusRTU采集数据方案

    【背景】前段时间接到一个需求,需要做一个化工企业环保数据(COD、VOCs)采集系统,这里主要是数据采集部分,数据...

  • 携程的数据采集系统架构

    实时数据采集系统 原文链接 1. 典型的数据采集分析系统 数据采集数据传输数据清洗/建模/存储数据统计/分析/挖掘...

  • 数据采集

    数据采集概述: 1.采集目的: 获取数据,用户后续的建设,建立数据仓库提供统一的数据分析准备。 2.采集的数据源:...

  • vivo大数据日志采集Agent设计实践

    作者:vivo 互联网存储技术团队- Qiu Sidi 在企业大数据体系建设过程中,数据采集是其中的首要环节。然而...

  • 新能源汽车空调数据采集系统

    空调数据采集系统用于整车空调试验过程中对各采集点的数据记录。空调数据采集系统能有效完成对车辆空调系统有关的温度、风...

  • redis监控指标

    服务器系统数据采集 Redis Server数据采集 Redis响应时间数据采集 Redis监控Screen 一、...

  • 第一章 总述

    大数据系统体系:数据采集、数据计算、数据服务、数据应用 一. 数据采集层: 1)web端日志采集技术方案:Aplu...

网友评论

    本文标题:企业数据采集系统建设思考要点

    本文链接:https://www.haomeiwen.com/subject/rmxtyrtx.html