Q，Friend-Q，Foe-Q，Ce-Q 简要对比

作者: 不会停的蜗牛 | 来源:发表于2020-04-10 23:56 被阅读0次

Q，Friend-Q，Foe-Q，Ce-Q 简要对比
Kotlin函数默认值完全解析
C++STL的vector源码分析、内存管理及问答
[技术干货] “专家坐诊”第47期问答汇总
PC端QQ和TIM产品对比分析
简要对比：闲鱼与转转
第二天，啦啦啦
柏拉图的改革、认识论与灵魂转向（试与亚里士多德和康德对比分析）
【知识管理】印象笔记快速提升你工作学习的效率
【小简要表白46】5015-啊Q

它们都可以用于 multi-agent 环境，下面以 soccer game 为例。

1. Q-learning vs Friend-Q

Q-learning 只是单独地考虑一个 player 的 Q 值，所以在建立Q表时就建立一个player A 的。
Friend-Q 是假设对手像个朋友一样，他会最大化大家的利益，那么就在 Q 的基础上添加 player B 的action空间即可：

left：Q，right：friend-Q

2. Friend-Q vs Foe-Q

Foe 是指对手就是完全的对抗状态，他会让另一方的利益最小，尽管这个决策对自己也不利。

Foe-Q 也要同时考虑双方的 action 空间，所以Q表和Friend-Q是一样的形式。

差别在于更新 Q 表时需要求解一个 maximin 问题：

3. Foe-Q vs Ce-Q

Ce-Q 和前三个的区别是，在建立Q表时，要同时建立两个表：
每个表都会同时考虑二者的action空间

它在更新 Q 表时自然也是要同时更新两个表格的，
更新的值是通过一个 linear programming 求解的，函数的输入也是两个表格

Q，Friend-Q，Foe-Q，Ce-Q 简要对比
它们都可以用于 multi-agent 环境，下面以 soccer game 为例。 1. Q-learning ...
Kotlin函数默认值完全解析
简要介绍 Kotlin函数定义时,支持对参数指定默认值,这样就有效减少Java之前定义重载函数的数量.简要对比如下...
C++STL的vector源码分析、内存管理及问答
标准模板库由三个部分组成：容器、迭代器、算法 Q：容器分为哪几种？ A：顺序容器、关联容器、容器适配器 Q：简要阐...
[技术干货] “专家坐诊”第47期问答汇总
Q：请问下，zabbix本身图表或者grafana能对比展示多个主机的指标信息吗？比如 cpu、内存 A：是对比一...
PC端QQ和TIM产品对比分析
QQ和TIM产品对比分析对比一：背景对比二：产品定位及用户群 QQ 从七麦数据的Appstore的排名看出，Q...
简要对比：闲鱼与转转
一、市场概况其实二手市场很早之前就存在。很多城市里之前都有类似于二手书市场之类的地方供人们交易二手商品，那么相关...
第二天，啦啦啦
Q版鲁班七号ପ( ˘ᵕ˘ ) ੭ 放上原图对比下，，，蓝胖子原图加油＾０＾~
柏拉图的改革、认识论与灵魂转向（试与亚里士多德和康德对比分析）
本文意将柏拉图在《理想国》中的思想与亚里士多德和康德进行简要对比探讨，以在对比中对于其思想进行更深入地把握。一....
【知识管理】印象笔记快速提升你工作学习的效率
2012年开始使用印象笔记，受益很大，做个简要的复盘总结附送印象笔记官方攻略http://mp.weixin.q...
【小简要表白46】5015-啊Q
她说，小时候没有条件，只能读从同学那里借来的故事会和小人书；她说，高中时读的最多的就是《青年文摘》和《读者》；她说...