数据工程构建策略
- 业务规划线性
- 技术架构统一
- 平台架构做大——从中长期规划入手规划大数据平台框架
- 实施做小——具体项目分阶段实施,逐步完善,业务优先,在技术规划轨道内实施
数据治理管控
- 不同应用,不同业务,需求不同(稳定性、时效性、高可用度的需求不同)
- 存储层要统一,应用层要分层分级。对应用层的构建,要基于对应用的解耦合,提高效能。
- 对数据按安全级分层,分开存储,避免全量丢失泄露。
机器学习一般过程
从业务出发——由问题着手、分析梳理、确认业务模型
构建数学模型——从业务模型建模
数据——根据实际条件、模型需求,来采集、处理、存储数据
算法选型——基于数据模型开展实施,这时就不再与业务相关了
企业级应用开发的核心要素
- 数据——基础核心
- 业务分析——起点,由业务领域专家、分析问题场景、给出业务模型
- 模型——这里是从业务模型构建的数学与数据模型,要持续更新,基于场景和数据不断修正。更新周期可能是一天、三天、一周,根据实际情况而定。基于自动化数据流水线,数据平台,快速响应。给一线的用户提供可靠的分析模型应用。
网友评论