转自deeprl~
一、学术界
1.1 国外
- 伯克利: Sergey Levine(论文高产作者)、Pieter Abbel(和Levine并列)
- UCL: David Sliver(目前好像不指导学生了)、汪军老师等
- Alberta:Richard Sutton老爷子、好几个理论的@蓝青峰大佬
- Stanford:Benjamin Van Roy
- 莫斯科国立大学:NIPS比赛很强
- 巴黎Flowers Team:Intrinsic motivation方向
- 新加坡南洋理工大学:安波老师
1.2 香港
- 香港中文大学:周博磊老师
- 香港中文大学(深圳):Jim Dai、Hongyuan Zha、Baoxiang Wang
1.3 国内
- 清华大学:张崇洁老师、李升波老师等
- 北京大学:卢宗青老师(MARL方向)
- 南京大学: 俞扬老师、高阳老师等
- 上海交通大学: 张伟楠老师、俞凯老师(Reinforcement Learning: An Introduction书翻译作者)等
- 中国科学院: 赵冬斌老师、张海峰老师等
- 天津大学:郝建业老师等
- 中科大: 李厚强老师、周文罡老师、王杰老师、庄连生老师等
- 国防科技大学: 徐昕老师
- 中科院深圳先进技术研究院: 崔允端老师(强化学习在自动驾驶、机器控制上的应用)
二、工业界
2.1 国外
- DeepMind(David Sliver, Marc G. Bellemare)
- OpenAI(John Schulman)
- FAIR(全方向):知名的有田渊栋和Noam Brown等,大佬巨多
- Google Brain(全方向):大佬巨多
- Salesforce Research
2.2 国内
- 腾讯AI Lab:游戏等;
- 百度PARL团队:自研框架+RL比赛
- 网易伏羲实验室:游戏;
- 字节跳动AI Lab:游戏、推荐;
- 地平线AI:RL+机器人、自动驾驶
- 滴滴:运筹优化;
- 阿里:推荐、运筹优化;
- 微软亚研院:Research,信息检索和搜索引擎;
- 华为诺亚方舟实验室:Research;
- 华为消费者BG自动驾驶解决方案BU:RL+自动驾驶
- 平安保险:强化学习+NLP;
- 快手AI Lab:游戏、检索;
- Momenta:RL+自动驾驶
- 超参数科技:游戏;
- 启元世界
- 南栖仙策
网友评论