美文网首页工作生活
《概率机器人》学习笔记

《概率机器人》学习笔记

作者: 啊呀哟嘿 | 来源:发表于2019-07-01 10:31 被阅读0次

    介绍

    这篇文章用于记录《概率机器人》(《Probalbilistic Robotics》)这本书的学习笔记和心得,将会主要按照书中的章节进行组织,穿插一些补充内容和自己的理解。

    笔记

    第一章:绪论

    • 概率机器人的主要思想就是用概率理论的运算去明确地表示机器人感知和行为的不确定性。换句话说,不再只依赖可能出现情况的单一的“最好推测”,而是用概率算法来表示在整个推测空间的概率分布信息。

    第二章:递归状态估计

    概率基础

    • 概率密度函数(Probability Density Function,PDF)
    • 正态分布\mathscr{N}(x;\mu,\sigma^2)p(x)=\frac{1}{\sqrt{2\pi\sigma^2}}exp({-\frac{1}{2}\frac{(x-\mu)^2}{\sigma^2}})
    • 多元正态分布\mathscr{N}(x;\mu,\Sigma)p(x)=\frac{1}{\sqrt{det(2\pi\Sigma)}}exp(-\frac{1}{2}(x-\mu)^T\Sigma^{-1}(x-\mu))
    • 联合分布、相互独立、条件概率(略)
    • 全概率定理(theorem of total probability):p(x)=\sum_yp(x|y)p(y) p(x)=\int p(x|y)p(y)dy
    • 贝叶斯准则(Bayes rule):p(x|y)=\frac{p(y|x)p(x)}{p(y)}该准则将条件概率p(x|y)与其逆概率p(y|x)联系起来。如果x是一个希望由y推测出来的数值,则概率p(x)称为先验分布,总结了在综合数据y之前已经有的关于x的信息。p(x|y)称为后验概率分布。
    • 期望(expectation)是随机变量的线性函数
    • 协方差:Cov(X)=\mathbb{E}[(X-\mathbb{E}[X])^2]=\mathbb{E}[X^2]-\mathbb{E}[X]^2
    • 熵(entropy):H_p(x)=\mathbb{E}[-log_2p(x)]

    机器人环境交互

    • x表示状态,z表示测量,u表示控制。
    • 状态完整假设
    • 状态转移概率:p(x_t|x_{0:t-1},z_{0:t-1},u_{0:t})=p(x_t|x_{t-1},u_t)
    • 测量概率:p(z_t|x_{0:t},z_{0:t-1},u_{0:t})=p(z_t|x_{t})
    • 置信度:bel(x_t)=p(x_t|z_{0:t},u_{0:t})
    • 刚执行完控制u_t,综合z_t之前计算后验:\overline{bel}(x_t)=p(x_t|z_{0:t-1},u_{0:t})

    基本的贝叶斯滤波算法(P20)
    包括计算\overline{bel}(x_t)(预测)和计算bel(x_t)(更新)两个步骤。
    其中:
    \overline{bel}(x_t)=\int p(x_t|u_t,x_{t-1})bel(x_{t-1})dx_{t-1} bel(x_t)=\eta p(z_t|x_t)\overline{bel}(x_t)

    第三章:高斯滤波

    • 基本思想:用多元正态分布表示置信度
    • 矩参数(Moments parameterization):均值和方差

    卡尔曼滤波(Kalman Filter)

    • 适合具有如下三个特性的系统:状态转移概率是带有随机高斯噪声的参数的线性函数;测量概率与带有高斯噪声的自变量呈线性关系;初始置信度是正态分布的。
    • 利用了性质:高斯随机变量的任何线性变换都将导致另一个高斯随机变量;高斯随机变量相乘也会导致高斯随机变量。
    • 首先通过综合控制u_t计算预测的置信度参数\overline{\mu}_t\overline{\Sigma}_t;随后通过综合测量z_t计算卡尔曼增益并更新置信度\mu_t\Sigma_t

    扩展卡尔曼滤波(Extented Kalman Filter)

    • 实际上状态转移和测量很少是线性的。
    • 扩展卡尔曼滤波放宽了一个假设:线性化假设。这里假设状态转移概率和测量概率分别由非线性函数控制。
    • EKF计算真实置信度的高斯近似值。
    • 利用一阶泰勒展开的方法,从状态转移方程和测量方程中线性化的到两个雅可比矩阵。

    无迹卡尔曼滤波

    • 通过使用加权统计线性回归过程实现随机线性化。
    • 无迹变换(unscented transform),通过提取确定的\sigma点,并将它们经过变换函数得到新的值,从而估计新的高斯概率分布。

    第四章:非参数滤波

    • 非参数滤波不依赖确定的后验函数
    • 能很好地表示复杂的多峰置信度

    直方图滤波

    • 分解技术:静态和动态
    • 动态分解技术最主要的一个例子就是密度树。
    • 选择更新。

    静态二值贝叶斯滤波

    • 状态静止时
    • 概率比的对数:l(x):=log\frac{p(x)}{1-p(x)}
    • 反向测量模型:p(x|z_t)
    • 更新算法:l_t = l_{t-1}+log\frac{p(x|z_t)}{1-p(x|z_t)}-log\frac{p(x)}{1-p(x)}

    粒子滤波

    • 步骤:首先构造一个暂时的粒子集\overline{\chi},表示置信度\overline{bel}(x_t),其中每个粒子都由\chi_{t-1}中的一个粒子经过u_t预测随机取样得到,随后\overline{\chi}中的每个粒子通过z_t赋予一个权重,最后按照权重进行重采样/重要性采样。
    • 重采样对迫使粒子回归后验bel(x_t)有重要的作用。

    第五章:机器人运动

    速度运动模型

    里程计运动模型

    相关文章

      网友评论

        本文标题:《概率机器人》学习笔记

        本文链接:https://www.haomeiwen.com/subject/uymwcctx.html