美文网首页
服务网格遇到的坑

服务网格遇到的坑

作者: 迪克dike | 来源:发表于2021-12-31 18:10 被阅读0次

最近服务在迁移到k8s+istio服务网格上,迁了之后遇到了一些问题,经过调研发现并解决了部分问题,在此记录下。

问题一:
迁移后监控发现redis时延变高。普遍增高约1-2ms
原因:
机器所在区域不同,之前ECS和redis机器同属阿里云的同一个区域,网络间调用时延很低,基本保证了redis时延在1ms一下。服务网格申请的机器在另外一个不同的区域,导致redis时延增高到了2.5ms左右,一定程度上增加了服务时延。

问题二:
某些服务突然fd暴涨,连带着内存暴涨,最后服务崩溃。
原因一:
阿里云上的ECS是网络增强型的机器,网络参数都是经过系统调优的,后面k8s上的机器都是cpu比较强悍的机器,网络参数优化不足,另外pod上的容器用的镜像也是未经网络参数调优的,结果就导致了系统中存在大量的TIME_WAIT的fd导致端口资源耗尽fd上涨。
原因二:
envoy的性能不足,在qps超过4500之后性能下降明显(envoy配置了2核cpu),从而导致服务响应延迟变高,从而有大量新请求进来占用fd端口资源。

经测试,对上述容器进行了如下调整:

      sysctl -w net.ipv4.ip_local_port_range="12000 60999"
      sysctl -w net.ipv4.tcp_max_tw_buckets=10000
      sysctl -w net.ipv4.tcp_tw_reuse=0
      sysctl -w net.core.somaxconn=4096
      sysctl -w net.ipv4.tcp_syncookies=1

destinationRules也进行了如下限制:
trafficPolicy:
connectionPool:
http:
http1MaxPendingRequests: 1000
maxRetries: 3
idleTimeout: 60s
tcp:
connectTimeout: 1s
maxConnections: 1000

envoy性能暂时没有很好的办法,就先注意着不要让服务qps过高了。

相关文章

  • 服务网格遇到的坑

    最近服务在迁移到k8s+istio服务网格上,迁了之后遇到了一些问题,经过调研发现并解决了部分问题,在此记录下。 ...

  • istio是什么?怎么搭建?

    服务网格(service mesh) 首先引入服务网格的概念,服务网格就是service mesh ,在很多年前就...

  • 服务网格

    服务网格 微服务的自然演进 引言 服务网格是当前最热门的技术之一,服务网格代表了从集中式架构向分布式架构过渡的下一...

  • Istio-非侵入式服务网格系统

    什么是服务网格 术语服务网格(Service Mesh)用于描述微服务之间的网络,以及通过此网络进行的服务之间的交...

  • 微服务:Service mesh 学习资源

    概念篇 什么是微服务(是什么) -什么是服务网格以及为什么我们需要服务网格 - Service Mesh的诞生,从...

  • 【网格汤山】听民声解民忧 网格服务群暖民心

    自从建立了网格居民服务微信群,居民可以更方便的寻求网格员的帮助。前几日,有住户在网格服务群内反应汤水雅居...

  • ZUUL路由服务遇到的坑

    项目采用Spring cloud微服务框架,使用ZUUL作为路由服务,在使用过程中遇到了如下问题,记录下来供大家借...

  • arcmap网格服务

    工具 开发工具为arcMap,下面是相关安装包和安装教程连接 戳这里 数据 开发人员有国内省、市、区县的数据,可适...

  • 上庄镇城市管理工作日报(2019.2.2)

    一、城市服务管理指挥分中心工作动态 1. 网格监督员上报案件:通过网格化城市服务管理系统网格监督员共上报案件78件...

  • Cesium加载网格影像服务

    在Cesium的viewer中加载网格影像服务。

网友评论

      本文标题:服务网格遇到的坑

      本文链接:https://www.haomeiwen.com/subject/mlfnqrtx.html