美文网首页
每日一读-数千台服务器,千万用户量:居然之家两年云原生改造历程

每日一读-数千台服务器,千万用户量:居然之家两年云原生改造历程

作者: locoder | 来源:发表于2019-08-13 17:01 被阅读0次

    写在前面的话

    Stay Hungry Stay Foolish!!!
    每天进步一点点!!!

    《每日一读》是博主每日学习的一篇文章所记录的笔记,大多数是提取文章中关键内容而成;文章类型不限,内容不限。

    意义:培养自己的阅读能力,学习更多的知识

    郑重声明:如果涉及到文章侵权深感抱歉,请及时联系我我会第一时间删除,谢谢!!

    个人总结

    组织

    1967 年,马尔文·康威提出康威定律, 用一句话概况就是:“设计系统的架构受制于产生这些设计的组织的沟通结构。”

    技术架构的重大的升级必然伴随着组织架构的调整,基本所有的公司都是自顶而下的驱动形式,组织架构的调整有利于减少重复造轮子,信息封闭等问题,这就类似运营SOA或中台战略,职责清晰化可以有效提升整体效率。

    云原生

    相信不少同学在工作的过程中也都有接触服务器相关的运维工作,尤其是初创公司,其特点比较明显:

    1. 没有标准的技术栈
    2. 缺少或没有运维人员
    3. 开发流程基本研发全程参与

    其带来的缺陷也是很明显:

    1. 成本不可控
    2. 易出问题
    3. 不易维护
    4. 无法专注于业务

    云计算时代的来临,通过云原生及当下相关的ServerlessServiceMesh等技术架构,很好的解决了这些问题。

    所以综合来看,云原生正在慢慢的改变传统技术架构,未来已来,技术人能做的唯有更好的去学习、适应新的架构;(ps:这里的新不是指的是云原生是新出现的事务)

    正文

    背景

    • 技术栈相对传统:Scala和C++
    • 单体应用架构
    • 整体迭代速度慢,需求响应周期长
    • 传统机房运维的问题:
      1. 稳定性:网络与软硬件设施不稳定
      2. 系统弹性:高峰扩容,低峰缩容,需要人工参与
      3. 高性能:CPU密集型,计算能力要求较高
      4. 服务器运维、网络成本高

    目标

    上云,专注核心业务,将基础设施相关的事项由云架构来解决

    演进

    1. 组织架构调整及微服务改造:Service Mesh
    2. 上云及云原生
    3. DevOps 实践
      1. 及时感知:节点运行状态
      2. 可触达:阶段问题单独解决,具备自愈能力
      3. 智能化运维:机器学习算法

    云集群管理:

    1. 集群管理
    2. 网络管理
    3. 存储管理
    4. 镜像管理

    实践效果

    1. 基础设施费用减半,在规模扩大的基础上,在基础设施上的投入还缩减了近50%
    2. 研发成本降低,整个团队50% 以上的人员为研发和产品,在基础设施交付给阿里云之后,整个团队可以集中精力进行核心业务研发,交付速度大幅提升;
    3. 系统可用性提高到99.96%,在人员及成本缩减的情况下,整体可用性却有了很大提升。
    4. 安全性提高,原来受限于整体架构,在达到99%之后,小数点之后的每一次提高的成本都是非线性的,而通过云原生改造,可以用相对经济的方式达到较高安全度。

    相关文章

      网友评论

          本文标题:每日一读-数千台服务器,千万用户量:居然之家两年云原生改造历程

          本文链接:https://www.haomeiwen.com/subject/clpbjctx.html