- [Microsoft/AI-System]微软AI系统Lab9
- [Microsoft/AI-System]微软AI系统 Lect
- [Microsoft/AI-System]微软AI系统课程总结
- [Microsoft/AI-System]微软AI系统Lab5+
- [Microsoft/AI-System]微软AI系统Lab6,
- [Microsoft/AI-System]微软AI系统Lab8
- [Microsoft/AI-System]微软AI系统 Lab4
- [Microsoft/AI-System]AI系统 Lectur
- [Microsoft/AI-System]AI系统 Lectur
- Microsoft Office 2003 2007 2010
2021-07-20
Lecture12: System for AI-12-Reinforcement learning systems [ PDF ]
Lab 9 RL Systems
需要两台服务器,还要保证两边python的版本和ray的版本一致
- 安装环境依赖包 ray 和 rllib ,并测试是否安装成功。
pip install -U ray
pip install ray[rllib]
新建一个3.7.6的环境,更新旧的不方便。
conda create -n py376. python=3.7.6
现在两边的服务器ray服务启动了,
- 配置不同的脚本,测试不同算法对应不同并行条件/不同环境下的收敛速度。至少挑选一种分布式算法,并测试其worker并行数目为4,8,16的情况下在至少两个Atari环境下的收敛情况,提交配置文件和对应的启动脚本文件
测试成功检测依赖包是否安装成功
测试ray
git clone https://github.com/ray-project/ray.git cd ray python -m pytest -v python/ray/tests/test_mini.py
单机跑,有点费时间测试rllib
rllib train --run=PPO --env=CartPole-v0
参考的不同分布式算法对应不同环境/并行条件的配置
代码位置:Lab9/config
参考命令:
cd Lab9
rllib train -f config/xxx-xxx.yaml
跑不起来
一直失败
网友评论