[Microsoft/AI-System]微软AI系统Lab9

作者: sagfugetabf | 来源:发表于2021-07-21 10:58 被阅读0次

2021-07-20

Lecture12: System for AI-12-Reinforcement learning systems [ PDF ]

需要两台服务器，还要保证两边python的版本和ray的版本一致

pip install -U ray
pip install ray[rllib]

新建一个3.7.6的环境，更新旧的不方便。
conda create -n py376. python=3.7.6

现在两边的服务器ray服务启动了，

配置不同的脚本，测试不同算法对应不同并行条件/不同环境下的收敛速度。至少挑选一种分布式算法，并测试其worker并行数目为4，8，16的情况下在至少两个Atari环境下的收敛情况，提交配置文件和对应的启动脚本文件

检测依赖包是否安装成功
测试ray
git clone https://github.com/ray-project/ray.git cd ray python -m pytest -v python/ray/tests/test_mini.py

测试成功

测试rllib
rllib train --run=PPO --env=CartPole-v0

单机跑，有点费时间

参考的不同分布式算法对应不同环境/并行条件的配置
代码位置：Lab9/config
参考命令：
cd Lab9
rllib train -f config/xxx-xxx.yaml

跑不起来
一直失败

网友评论

本文标题：[Microsoft/AI-System]微软AI系统Lab9

本文链接：https://www.haomeiwen.com/subject/wncdmltx.html

[Microsoft/AI-System]微软AI系统Lab9