接触云时间不长,差不多截止到现在3年不到的样子吧,最大的感触是:失业倒计时。开玩笑拉,主要是对于 Ops 同学来说要求真的是越来越高了。
大家都需要思考的一个问题:每天最大的一块是在做什么,如果用了云你还在重复劳动,麻烦思考下为什么,有没有办法解决,先从自己的身上去搜寻答案吧,明白人总能想明白的。
云的优势是什么?那就是弹性啊、Elastic啊,如果这朵云连弹性都无法支持,麻烦思考下,用户为什么还需要使用你呢?
如何使用弹性呢?
- 基于云上 api :依靠工具 Or api 开机器关机器发布服务,如此其实也算一种弹性,如果虚拟机启动够快的话,其实还是相当牛的。
- k8s + autoscaling 的弹性伸缩:云厂商解决机器的问题,k8s 解决服务的问题,简直堪称完美。
- 无状态服务基于 autoscaling 的弹性管理:比如,nginx 从前在 idc 里面如果宕机,我们需要快速加新机器 Or 做好足够的容量预留。但是基于云的话完全不用思考这个问题,我们设置好伸缩组就好了,这样连高可用都帮我们做了,还担心宕机吗?「没机器是另外一个故事了」
- 大数据的存算分离场景:晚上算算算弹弹弹,白天固定在一些机器上面即可,全部依靠厂商的存储就好了 「解放大数据运维啊,真的需要纯运维吗?」
- 数据库的伸缩:其实数据库也是可以伸缩的,比如磁盘的无感知自动扩容,只读节的伸缩 「就看未来写节点怎么扩了,当然数据库都是状态,比较难处理,但是未来可期啊」
弹性的最终是什么?
- Serverless:想都不用想的,未来就是给你 cpu + mem 的世界,机器是什么?
成本优势
- Ri 是什么:Reserved Instances,先给一部分钱来保证资源的同时,拿到比较好的折扣
- Spot 是什么:Spot Instances,厂商总有一些边角料没切好 Or 基础机器算多了,导致总有那么些机器多出来了,那么我们就可以上去竞价啦!
- OD 是什么:按量付费,用多少算多少
-
如何配合呢:如上三种其实是可以配合使用的,我们可以用买过 Ri 的 OD 来保证最最基础的使用量,突然一波用 Spot + OD 去覆盖,做到成本的最优化。如上对于厂商就有巨大的考验了,供应链「又见到你了」,资源管理等一系列的问题,那天国内能把这块做好了,那差不多了「Ops 真的会很开心」。我们可以使用 autoscaling 配合 OD + Spot 在一个升缩组里面配置合理的比例来控制成本「ROI 奇高」,比例怎么来需要厂商 api获取指标!
OD + SPOT
我们能做什么?
- 这个是对于传统 Ops 就必须升级到一个 infra 工程师的视角来思考问题,无论有没有状态的东西,未来都是弹性的,而且厂商现在都在努力做工具,各种解决重复劳动的自动化工具,社区还有大量的工具同样在努力,大家可以了解下 Hashicorp 这家公司,从资源管理、编排、安全几乎全覆盖了云上核心场景。
- infra 工程师更多的去考虑合理分配、多AZ、多云的基建的考虑,去帮助公司提升基础 sdk的规范;发挥监控数据的价值;发挥我们的专业能来帮助业务提升稳定性 & 扩展性,这样是不是更有价值呢?
- 产业结构调整,迎难而上!
网友评论