1、自回归模型(AR)描述当前值与历史值之间的关系,用变量自身的历史时间数据对自身进行预测自回归模型必须满足平稳性...[作者空间]
算法1 数据平稳性与差分法 1、平稳性:1)平稳性就是要求经由样本时间序列所得到的拟合曲线在未来的一段时间内仍能顺...[作者空间]
钱伟长,1912年出生在江苏无锡一个书香门第,受家庭环境的熏陶,钱伟长的国学功底非常扎实。18岁那年,他以中文和历...[作者空间]
人们听了杰克说的话后,都哈哈大笑,表示不相信,还有人讽刺杰克,说他精神有问题。人们继续排放二氧化碳,不保护...[作者空间]
杰克进入四维空间后,看到了很多时间虫,这些时间虫,头部属于童年,中部属于壮年,尾部属于老年。 ...[作者空间]
有人认为我们生活的地方处于三维空间,也有人认为我们生活在四维空间里。到底哪一种说法对呢? 爱因...[作者空间]
随着计算能力的飞跃和深度神经网络的发展,数据科学,无论在国外还是国内,都是最近几年高科技领域的一个热点。很多公司和...[作者空间]
KWIK 算法来自论文 Knows What It Knows: A Framework For Self-Awa...[作者空间]
multiagent 是指同时有多个 agent 更新 value 和 Q 函数,主要的算法有:q learnin...[作者空间]
今天要读一篇 Amy Greenwald 的论文《Correlated-Q Learning》,先记一下论文中的基...[作者空间]
Reinforcement Learning Cheat Sheet 这篇不错,将强化学习中的经典算法基础概念清晰...[作者空间]
石头剪子布属于一种 zero-sum game,即一个人的 loss 是另一个人的 gain。 这个问题可以有多种...[作者空间]
在解决石头剪子布这个问题的过程中,我们会用到一个 maxmin 函数,先来看看这个函数的理论基础。 首先,Mini...[作者空间]
我们在求解石头剪子布的纳什均衡问题时会用到 cvxopt 里面的这个函数:solvers.lp(c=c, G=G,...[作者空间]
Cvxopt 是基于 Python 语言的用于解决凸优化问题的免费包,可以用于求解纳什均衡问题的最优策略,好用但是...[作者空间]
石头剪子布这个游戏是全球人都会玩的一个游戏,司空见惯的一个小游戏里面竟然蕴含着一个很有用的博弈论概念。 You d...[作者空间]
上一篇讲了什么是 DQN,今天来看看如何用代码实现: 算法来自:Volodymyr Mnih,Playing At...[作者空间]
上一篇文章中我们知道了 Q-learning 不适合状态空间很大的情况,因为它需要建立的 Q-table 对于较大...[作者空间]
Q-Learning 中需要建立一个 Q-table 用来查询每个state所对应的最好的action,但是当 s...[作者空间]
State–action–reward–state–action (SARSA) 也是强化学习中很重要的一个算法,...[作者空间]