美文网首页
华为公司的信息化管理工作是怎样的?

华为公司的信息化管理工作是怎样的?

作者: rudypine | 来源:发表于2016-08-11 17:23 被阅读0次

本文作者在电力企业从事信息化工作近6年,深知IT系统建设和运维工作的繁琐和不可控性,经常有这样的疑问,“看看别人家是怎么做的呢?”。此次有幸到世界100强华为公司质量与流程IT管理部亲临现场进行调研,颇有收获,现在发挥简书的风格,跟大家一起分享讨论下!

华为的信息化规模

类型 数量 单位
IT员工 7500
业务应用 800
数据中心 70
VM虚拟机 400,000
网络带宽 185 Gbps
数据总量 320 PB
内部用户 100,000
机柜数量 are neat $1
机房面积 13,000
  1. 需求收集:需求提出包括两种情形,一是用户直接在需求管理平台中直接提出,适用于日常零星需求;另一种是需求管理团队主动收集,包括访谈、调研、领导讲话、社区等渠道中发现的IT需求,适用于年度规划或IT项目需求收集。年度规划由业务部门使用《需求跟踪矩阵》主动收集需求,作为规划输入,规划结束后归入IT项目,由各业务部门的需求接口人导入需求管理平台。IT项目由项目组使用《需求跟踪矩阵》主动收集需求,经过业务主管确认后,由项目组的需求接口人导入需求管理平台。
  2. 需求评审:由各需求管理团队(RAMT)中的业务代表、解决方案专家主导对需求进行分析评审,主要包括:确认需求合理性,决定需求是否要做,决定应由哪个项目承接等。对于一些负责重要需求(包括跨领域或跨产品、流程/IT综合、有争议的需求等)可以发起有RAMT团队评审决策,把分析结果和建议提交RAMT例会进行评审。【SLA时限要求:需求分流2天,需求确认15天】
  3. 需求实施:分为两个阶段,a、解决方案分析阶段,主要输出需求规格说明书;b、IT实施开发阶段,交付IT系统,包括待排版本、启动开发、开发完成、测试、发布等环节。【SLA时限要求:需求解决方案分析15天】
  4. 需求关闭:主要是用户对需求交付的实际结果给出满意度评价,对不满意的需求指明原因,以指导需求处理人员不断改进。

3. IT支撑

上述流程(需求收集、需求评审、需求实施跟踪、用户反馈)均通过需求管理平台在线填报、审批、流转,整个过程均可视化,做到可跟踪、可提醒。需求单关联到项目、关联到系统版本。

应用系统监控

从2015年开始,华为对内部的IT系统启动做产品运营,通过产品运营报告展示应用系统的使用情况,建立了产品运营平台(用户分析、行为分析、实时运营、关键业务量、产品质量分析)。

数据指标体系

  • 用户数据(用户量、访问量、用户活跃度);
  • 产品使用数据(页面参与度、页面停留时间、跳出率、弹出率、访问轨迹、各功能/资源使用、按钮提交成功率、按钮平均处理时长、用户满意度);
  • 产品健康度(访问性能、事件分析);
  • 业务数据(业务量、转化率、业务流程效率、办公效率提升、审批通过操作时长、驳回操作时长、业务提交成功率)

系统开发管控

  • 敏捷开发与交付 将需求自上而下分解为业务问题、问题解决方案、实现版本、敏捷迭代不同的颗粒度及关注点,通过专题看板的形式进行流水线式的开发,流水线中包含“待确认、需求、分析、待排发布版本、启动开发、开发完成、转测试”等环节,通过看板中任务的拖拉形式来调整当前任务所在的阶段。敏捷开发一般以5-12人为一个团队,大小视项目或任务复杂情况而定。看板的管理应由项目组长或技术经理完成,通过每日例会等形式布置工作并调整任务阶段。
  • 开发平台 华为的系统开发平台是统一的,外包无论是项目还是人员均是到华为指定的时间地点,在指定的平台上进行开发。通过统一的平台可以便于统一开展优化,也可以能降低运维的工作量,临时性的任务也便于调集资源进行处置。
  • 项目工作量评估 主要还是采用基于功能点的工作量评估方式。在开发工作量上,主要基于对代码量的方式开展评估:通过工具统计代码的部分特征(包括代码行、分支情况、嵌套情况等),评估代码的复杂度,通过复杂度评估出工作所需要的人天,并根据成本基线核算成本,在验收的时候检查成本与工作量的符合程度。

信息系统运维

华为公司有15年以上的IT运营实践,其运维遵循ITIL3.0标准 ,开展以IT服务为导向的运维,采用全球运维理念提升运维效率和质量。目前正在建设统一的运维操作平台,构建故障自动监控及自愈平台。结合云计算、大数据提升系统监控和运维效率也是下一步待解决的问题。

华为公司在处理故障过程中,按照故障的严重程度进行等级划分,其中一级/二级事件工作日要求1h内解决,10min响应;三/四级事件要求8h内解决,非工作日24h内解决。监控人员24小时值班,夜间采用手机接收告警或通知值班。华为公司在重大业务上都会做好保障一级临时处置措施,除非有非常紧急且必要的故障需要到现场。

华为公司基于HP ITSM的运维工具进行了修改,形成一套完善的自动化运维工具平台。事件管理方面,运维过程中若发生故障,采用尽快恢复正常IT服务,使业务负面影响减到最少,保证服务水平。运维安全方面,运维人员通过专门的运维通道和运维工具保证,运维过程有详细的审计日志记录,并通过大数据实时分析日志,判断是否出现运维权限的异常行为如拷贝了机密资料等,极大提升了内部人员的安全隐患。

故障处理经验积累:华为同事认为运维主要还是要靠经验,只有通过不断的积累,才能增加快速定位故障的能力。建议在日常运维过程中应增加知识库管理,充分发挥技术骨干、专家的经验,要把知识的传承工作固化到工作过程中,并设立相应的知识积累检查点,便于知识的积累与传承。对系统的每个模块定责任人CIO,根据事件级别通知人员到位,快速恢复业务,并注意将事件处理和问题处理分开。运维过程中遇到的最大故障问题一般为采用了新技术的系统,因此,为了系统的安全稳定运行,应尽量避免过多使用新产品新技术,待技术成熟后再做引进。

相关文章

网友评论

      本文标题:华为公司的信息化管理工作是怎样的?

      本文链接:https://www.haomeiwen.com/subject/zmcssttx.html