美文网首页
Nvidia docker学习笔记

Nvidia docker学习笔记

作者: ThisLife_88f4 | 来源:发表于2018-12-05 19:11 被阅读0次

    github: https://github.com/NVIDIA/nvidia-docker/wiki

    官方链接:https://devblogs.nvidia.com/gpu-containers-runtime/

    作用:Nvidia docker 用于开发、测试、基准测试和部署深度学习(DL)框架和HPC应用程序。大部分用户使用Nvidia-Docker来封装和运行GPU加速工作负载。

    介绍:Nvidia 通过Nvidia GPU Cloud(NGC)提供了GPU加速容器,可用于DGX系统、公共云基础设施,甚至具有GPU的本地工作站,Nvidi-docker一直是这些平台(Gpu云与本地Gpu集群加速)的关键基础技术。除了Docker之外,容器技术的采用还可以用于DL和HPC工作负载的不断变化的用例集,这使设计者从根本上考虑现有的Nvidia-Docker体系结构。主要的目标不仅是跨各种容器运行时的可扩展性,还包括容器系统的可扩展性。

    Nvidia docker运行时环境

    Nvidia在2016年设计了Nvidia-docker,以支持利用Nvidia Gpu的Docker映像的可移植性。它允许与驱动程序无关的CUDA映像,并提供Docker命令行包装器,在启动时将驱动程序的用户模式组件和GPU设备文件转载到容器中。

    在Nvidia-Docker的生命周期中,架构缺乏灵活性,原因如下:与Docker的紧密集成不允许将来支持其他容器技术,如LXC、RIO和其他运行时环境,因此设计者希望利用Docker生态中的其他工具—例如组合(用于管理由多个容器组成的应用程序)。支持GPU作为编排器(如kubernetes和Swarm)中的一级资源改进容器运行时支持GPU,特别是自动检测用户级的Nvidia驱动程序库,Nvidia内核模块,设备排序,兼容检查和GPU特性,如图形,视频加速,因此,重新设计的nvidia-docker将GPU运行时环境支持转移到另一个名为libnva-container的库中。这个库依赖于linux内核原语,并且与更高的容器运行时层无关。这使得GPU支持可以轻松扩展到不同的容器运行时环境,如Docker、LXC和RIO。这个库包含一个命令行实用程序,还提供一个API,以便将来集成到其他运行环境中。为集成到各种运行时而构建的库、工具和层统称为NVIDIA容器运行时环境(Runtime),接下来具体了解Docker和LXC的集成。

    待续

    相关文章

      网友评论

          本文标题:Nvidia docker学习笔记

          本文链接:https://www.haomeiwen.com/subject/ykwwcqtx.html