《概率机器人》学习笔记

作者: 啊呀哟嘿 | 来源:发表于2019-07-01 10:31 被阅读0次

《概率机器人》学习笔记
《概率机器人》学习笔记之短序一二
概率入门学习笔记
【非无不系列】《概率机器人》读书笔记
图像灰度变换—Apple的学习笔记
概率统计组队学习之随机事件与随机变量
Coursera台大机器学习课程笔记3 – 机器学习的可能性
大概率思维学习笔记
学习参数
概率论与数理统计笔记第二章随机变量及其概率分布

介绍

这篇文章用于记录《概率机器人》（《Probalbilistic Robotics》）这本书的学习笔记和心得，将会主要按照书中的章节进行组织，穿插一些补充内容和自己的理解。

笔记

第一章：绪论

概率机器人的主要思想就是用概率理论的运算去明确地表示机器人感知和行为的不确定性。换句话说，不再只依赖可能出现情况的单一的“最好推测”，而是用概率算法来表示在整个推测空间的概率分布信息。

第二章：递归状态估计

概率基础

概率密度函数（Probability Density Function，PDF）
正态分布 $\mathscr{N}(x;\mu,\sigma^2)$ ： $p(x)=\frac{1}{\sqrt{2\pi\sigma^2}}exp({-\frac{1}{2}\frac{(x-\mu)^2}{\sigma^2}})$
多元正态分布 $\mathscr{N}(x;\mu,\Sigma)$ ： $p(x)=\frac{1}{\sqrt{det(2\pi\Sigma)}}exp(-\frac{1}{2}(x-\mu)^T\Sigma^{-1}(x-\mu))$
联合分布、相互独立、条件概率（略）
全概率定理（theorem of total probability）： $p(x)=\sum_yp(x|y)p(y)$ $p(x)=\int p(x|y)p(y)dy$
贝叶斯准则（Bayes rule）： $p(x|y)=\frac{p(y|x)p(x)}{p(y)}$ 该准则将条件概率 $p(x|y)$ 与其逆概率 $p(y|x)$ 联系起来。如果 $x$ 是一个希望由 $y$ 推测出来的数值，则概率 $p(x)$ 称为先验分布，总结了在综合数据 $y$ 之前已经有的关于 $x$ 的信息。 $p(x|y)$ 称为后验概率分布。
期望（expectation）是随机变量的线性函数
协方差： $Cov(X)=\mathbb{E}[(X-\mathbb{E}[X])^2]=\mathbb{E}[X^2]-\mathbb{E}[X]^2$
熵（entropy）： $H_p(x)=\mathbb{E}[-log_2p(x)]$

机器人环境交互

$x$ 表示状态， $z$ 表示测量， $u$ 表示控制。
状态完整假设
状态转移概率： $p(x_t|x_{0:t-1},z_{0:t-1},u_{0:t})=p(x_t|x_{t-1},u_t)$
测量概率： $p(z_t|x_{0:t},z_{0:t-1},u_{0:t})=p(z_t|x_{t})$
置信度： $bel(x_t)=p(x_t|z_{0:t},u_{0:t})$
刚执行完控制 $u_t$ ，综合 $z_t$ 之前计算后验： $\overline{bel}(x_t)=p(x_t|z_{0:t-1},u_{0:t})$

基本的贝叶斯滤波算法（P20）
包括计算 $\overline{bel}(x_t)$ （预测）和计算 $bel(x_t)$ （更新）两个步骤。
其中：
$\overline{bel}(x_t)=\int p(x_t|u_t,x_{t-1})bel(x_{t-1})dx_{t-1}$ $bel(x_t)=\eta p(z_t|x_t)\overline{bel}(x_t)$

第三章：高斯滤波

基本思想：用多元正态分布表示置信度
矩参数（Moments parameterization）：均值和方差

卡尔曼滤波（Kalman Filter）

适合具有如下三个特性的系统：状态转移概率是带有随机高斯噪声的参数的线性函数；测量概率与带有高斯噪声的自变量呈线性关系；初始置信度是正态分布的。
利用了性质：高斯随机变量的任何线性变换都将导致另一个高斯随机变量；高斯随机变量相乘也会导致高斯随机变量。
首先通过综合控制 $u_t$ 计算预测的置信度参数 $\overline{\mu}_t$ 和 $\overline{\Sigma}_t$ ；随后通过综合测量 $z_t$ 计算卡尔曼增益并更新置信度 $\mu_t$ 和 $\Sigma_t$

扩展卡尔曼滤波（Extented Kalman Filter）

实际上状态转移和测量很少是线性的。
扩展卡尔曼滤波放宽了一个假设：线性化假设。这里假设状态转移概率和测量概率分别由非线性函数控制。
EKF计算真实置信度的高斯近似值。
利用一阶泰勒展开的方法，从状态转移方程和测量方程中线性化的到两个雅可比矩阵。

无迹卡尔曼滤波

通过使用加权统计线性回归过程实现随机线性化。
无迹变换（unscented transform），通过提取确定的 $\sigma$ 点，并将它们经过变换函数得到新的值，从而估计新的高斯概率分布。

第四章：非参数滤波

非参数滤波不依赖确定的后验函数
能很好地表示复杂的多峰置信度

直方图滤波

分解技术：静态和动态
动态分解技术最主要的一个例子就是密度树。
选择更新。

静态二值贝叶斯滤波

状态静止时
概率比的对数： $l(x):=log\frac{p(x)}{1-p(x)}$
反向测量模型： $p(x|z_t)$
更新算法： $l_t = l_{t-1}+log\frac{p(x|z_t)}{1-p(x|z_t)}-log\frac{p(x)}{1-p(x)}$

粒子滤波

步骤：首先构造一个暂时的粒子集 $\overline{\chi}$ ，表示置信度 $\overline{bel}(x_t)$ ，其中每个粒子都由 $\chi_{t-1}$ 中的一个粒子经过 $u_t$ 预测随机取样得到，随后 $\overline{\chi}$ 中的每个粒子通过 $z_t$ 赋予一个权重，最后按照权重进行重采样/重要性采样。
重采样对迫使粒子回归后验 $bel(x_t)$ 有重要的作用。

第五章：机器人运动

速度运动模型

里程计运动模型

《概率机器人》学习笔记
介绍这篇文章用于记录《概率机器人》（《Probalbilistic Robotics》）这本书的学习笔记和心得，...
《概率机器人》学习笔记之短序一二
《概率机器人》目前我仅大概过了一遍第I部分和第II部分,便发现这本书结构非常清晰,主要把第一部分的基础理论学扎实,...
概率入门学习笔记
在学习学习再学习公众号上看到一篇文章，叫《十分钟梳理概率统治世界》，把其中的精华又提炼了一下，便于自己学习。其中有...
【非无不系列】《概率机器人》读书笔记
非官方无责任不靠谱系列之概率机器人。《概率机器人》出版年：2016，作者：[美] 塞巴斯蒂安 · 特龙一、课本部...
图像灰度变换—Apple的学习笔记
图像灰度变换—Apple的学习笔记一，概率函数就是用函数y来表述x的概率。积分表述的概率累加函数对于连续型...
概率统计组队学习之随机事件与随机变量
摘要：随机事件、随机变量の学习笔记涉及概念：随机事件，概率，古典概型，条件概率，全概率公式，贝叶斯公式，随机变量，...
Coursera台大机器学习课程笔记3 – 机器学习的可能性
Coursera台大机器学习课程笔记3 – 机器学习的可能性提纲：机器学习为什么可能？引入计算橙球概率问题 ...
大概率思维学习笔记
美国有一位高材生，他从麻省理工学院毕业以后，放弃了进入金融界的绝好机会，转身走进了赌场，成为了一名赌徒。他希望自己...
学习参数
声明：概率图模型基于R语言学习笔记独立同分布（iid.）:每个变量都假设服从同样的概率分布，且每个观测又独立于数...
概率论与数理统计笔记第二章随机变量及其概率分布
# 概率论与数理统计笔记第二章随机变量及其概率分布概率论与数理统计笔记（计算机专业）作者： [CATPUB]...