k8s与GPU

作者: 缘尤会 | 来源:发表于2021-02-02 14:42 被阅读0次

为什么要用k8s管理以GPU为代表的异构资源?

  • 加速部署:通过容器构建避免重复部署机器学习复杂环境
  • 提升集群资源使用率: 统一调度和分配集群资源
  • 保障资源共享:利用容器隔离异构设备,避免互相影响

如何利用容器运行GPU程序

  • 构建支持GPU容器镜像
  • 利用docker run 将改镜像运行起来,并把GPU设备和依赖库映射到容器中

如何准备GPU容器镜像

  • 直接到dockerhub使用官方深度学习容器镜像
    简单 便捷 安全 可靠 如 TensorFlow
  • 基于Nvidia 的CUDA镜像基础构建
    官方镜像无法满足需求时 需要定制修改
image.png

device plugin的工作机制

  • 资源的上报和监控


    image.png
  • Pod的调度和运行


    image.png

device plugin 机制的缺陷

  • 设备调度发生在kubelet层面,缺乏全局调度视角
  • 资源上报信息有限导致调度精度不足
  • 调度策略简单,并且无法配置,无法应对复杂需求

https://www.bilibili.com/video/BV1BJ411i7Yo?from=search&seid=8227645815944614357

相关文章

  • 把显卡/GPU跑在k8s集群里

    使k8s集群可以调度GPU 背景:最近接到任务,要使k8s集群支持调度GPU,我对硬件资源不是很懂,大概看了看官方...

  • k8s与GPU

    为什么要用k8s管理以GPU为代表的异构资源? 加速部署:通过容器构建避免重复部署机器学习复杂环境 提升集群资源使...

  • GPU On K8s

    最近机缘巧合、莫名其妙,玩起了 GPU 的东西。算法同学要求又高,裸跑 GPU 是不可能的,要 K8s。被逼只好开...

  • 性能优化02-布局优化

    性能优化02-布局优化 一、CPU与GPU 1、定义 为什么要了解CPU与GPU呢?因为布局绘制就是CPU与GPU...

  • GPU编程(二): GPU架构了解一下!

    目录 前言 GPU架构 GPU处理单元概念GPU GPU线程与存储 参考 最后 前言 之前谈了谈CUDA的环境搭建...

  • k8s运行GPU

    1、docker2、nvidia-container-toolkit(nvidia-docker)https://...

  • k8s gpu 支持

    NVIDIA drivers ~= 361.93 nvidia-docker version > 2.0 (see...

  • k8s GPU部署

    先把资源给足CPU内存(signal 9 表示内存不足)显存 确认基础镜像与所用深度学习框架的match 可能涉及...

  • K8s 共享GPU

  • iOS 关于iOS下渲染的理解

    关于CPU与GPU CPU(central Processing Unit): GPU(Graphics Proc...

网友评论

      本文标题:k8s与GPU

      本文链接:https://www.haomeiwen.com/subject/kelytltx.html