Q_learning 算法（迷宫算法）

作者: 圣_狒司机 | 来源:发表于2018-08-28 17:37 被阅读13次

Q_learning 算法（迷宫算法）
强化学习——Q-learning
python迷宫游戏，迷宫生成，解决与可视化
Python3 趣味系列题7(续) ------ A
JavaScript完成迷宫的自动生成与自动求解
10分钟教你用python动画演示深度优先算法搜寻逃出迷宫的路径
动画演示深度优先算法搜寻逃出迷宫的路径
走迷宫算法（C回溯递归）
GO学习笔记(23) - 广度优先算法及迷宫实战
图形算法可视化

概述：

弄懂 Q-learning 算法的前提是了解法尔科夫过程和奖励函数，用value(max)替换了原先的value奖励函数。

代码：

import numpy as np

GAMA = 0.8
FINALLY = 5

#构造一个6*6 的小型迷宫
R = np.random.randint(1,100,[6,6])
#初始化Q表
Q = np.zeros_like(R)

# Q表更新函数
def updataq(i,j):
    try:
        while True:
            Q[i,j] = R[i,j] + GAMA * Q[j].max()
            if j == FINALLY:break
            return updataq(j,Q[j].argmax()) 
    except:pass

# 测试函数
def findway(node):
    if node != FINALLY:
        way = Q[node].argmax()
        ways.append(way)
        return findway(way)

for _ in range(600):
    updataq(*np.random.randint(0,6,2)) 

ways = []
findway(2)
print(ways)

测试结果：
希望找出2节点到5节点的路径：

[3, 1, 5]

是不是很棒！

Q_learning 算法（迷宫算法）
概述：弄懂 Q-learning 算法的前提是了解法尔科夫过程和奖励函数，用value(max)替换了原先的va...
强化学习——Q-learning
一、什么是Q_learning Q_learning是强化学习中的一个决策算法，如果你还不知道什么是强化学习，可以...
python迷宫游戏，迷宫生成，解决与可视化
代码已上传github 使用prime算法生成迷宫使用递归算法走迷宫使用pygame做可视化展示 prime算法生...
Python3 趣味系列题7(续) ------ A
前文：Python3 趣味系列题7 ------ Prim算法生成完美迷宫一、A*算法寻找路径的算法有很多，例...
JavaScript完成迷宫的自动生成与自动求解
更多算法(语言为JavaScript) 持续更新... 戳我去GitHub看更多算法问题>>>>目录迷宫生成戳...
10分钟教你用python动画演示深度优先算法搜寻逃出迷宫的路径
深度优先算法(DFS 算法)是什么？寻找起始节点与目标节点之间路径的算法，常用于搜索逃出迷宫的路径。主要思想是，...
动画演示深度优先算法搜寻逃出迷宫的路径
深度优先算法(DFS 算法)是什么？寻找起始节点与目标节点之间路径的算法，常用于搜索逃出迷宫的路径。主要思想是，...
走迷宫算法（C回溯递归）
引言迷宫算法在很多场景都非常实用，比如游戏中的机器人等。而且高级的迷宫算法与回溯、递归也是息息相关的。而且回溯的...
GO学习笔记(23) - 广度优先算法及迷宫实战
目录介绍四大特性应用场景实例-迷宫算法介绍广度优先搜索算法（英语：Breadth-First-Sear...
图形算法可视化
最近看了一些和图形、算法可视化相关的文章和代码，挺有意思，于是自己也学着做了些东西。迷宫生成算法迷宫小时候玩过...