SRE是Site Reliability Engineering的缩写,意思是网站可靠性工程学
对于人员来说,就是Site Reliability Engineer,网站可靠性工程师
对于一个SRE来说,工作职责有:
- 应急响应
- 监控
- 事件处理
- 事后总结
- 日常运维
- 变更管理
- 容量规划和置备
- 性能和效率
- 工程研发
- 工具研发
- SLO制定和保障
- 无人值守运维
《凤凰项目》中说,运维工作主要有四类:业务项目,内部项目,变更和计划外的工作。
与SRE的工作职责很类似。
还有一种类型的工作,也许是最重要的一类,因为它的破坏性实在很强,就是计划外的工作。 与其他种类的工作不同,计划外工作是恢复性工作,几乎总是让你远离目标。因此,知道你计划外工作从何而来就显得尤为重要。
网友评论