当然要做第一件事情就是在工作中培训他们,但是每个人学习方式不同,我们该如何设计培训课程?
google推荐培训方式:
1.设计一个具体的,有延续性的大得学习体验额,以便学员跟进。
2.鼓励反向工程,利用统计学的来思考问题,以及多思考问题本质
3.鼓励学员分析失败的安利,分享好的时候总结来阅读。
- 创造一些受控的,但是逼真的场景让学员利用真是的监控环境和工具来修复
- 在团队内以角色扮演的形式演习理论上可能发生的问题,让大家在这个过程中交流此的解决问题的方式。
6.给学员创建条件让他们参与见习on-call,和实际轮值的on-call工程师交流经验。
7.让学员与sre老手一起共同修订培训计划中的某个部分
8.帮助学员一起找到一个具有一定复杂度的项目,帮助他们在整个技术栈内建立自己的地位。
培训初期:重体系,而非混乱
系统性,累积性的学习方式
在系统中加入某种顺序性
目标性强的项目工作,而非琐事。
培养反向的工程能力和随机应变能力。
sre应该具备的特点:
a.在日常工作中,他们会遇到从未见过的系统,必须亚具有很强的反向工程能力
b.在海量规模下,很多异常情况都很难检测,他们必须具有统计学知识,用统计学而不是流程化的方式去发现问题。
c.当标准的流程不工作时,他们必修能够随机应变,解决问题。
反向工程:弄明白系统如何工作。
统计学和比较性思维:在压力下坚持科学方法论。
随机应变能力:当意料之外的事情发生时改怎么办
a.将知识串联起来:反向工程某个生产和环境服务
有抱负的on-call工程师的5个特点:
1.对事故的渴望,时候总结的阅读和书写
2.故障处理分角色演习。
3.破坏真的东西,并且修复它们。
4.维护文档是学徒任务的一部分。
a.这个文档可以帮助学员了解运维系统的边界。
b.通过学习这个文档,学员可以了解系统的重要组件,以及背后的原因。
5.尽早 尽快见习on-call
6.on-call之后,通过培训的仪式感,以及日后的持续教育。
网友评论