美文网首页
第32课 基变换和图像压缩

第32课 基变换和图像压缩

作者: rascalpotato | 来源:发表于2019-11-11 12:39 被阅读0次

关于基变换:从一组基变换到另一组基

主题:线性变换矩阵关联线性变换不一定是在坐标系内,而矩阵用坐标来表示线性变换


例:512\times512的图,每像素8bits,值为0\le x_i<255,实际上是对R^n中的向量x做操作,x\in R^n;n=512^2(彩色图为3\times512^2)

JPEG的全称联合图像专家组,对图像数据做基变换。

值相近的相互关联(即颜色相近)

标准基为\begin{bmatrix}1\\0\\\vdots\\0\end{bmatrix},\begin{bmatrix}0\\1\\0\\\vdots\end{bmatrix},\dots,\begin{bmatrix}0\\\vdots\\0\\1\end{bmatrix}R中的其他基是这个高维数的空间

更好的基:元素都为1的向量,这个向量就能完整地给出所有像素一致图像的信息,当然我们的图像像素不是一致的,混合着一些其他信号。在基中有这样一个向量,也能解决很大问题,基中其它向量是多少,基的选择问题很关键

JPEG用到的基为傅里叶基8\times8,取8\times8的小块,有64个像素,从这一小块上做基变换。

步骤:
信号x\to \underbrace{基变换}_{无损压缩}\to 得到系数c \to 压缩 \to \underbrace{压缩系数}_{得到很多0} \to 重构信号x

视频压缩是连续的(间隔很短时间取的是同一幅图像,然后慢速播放,激烈中的动作就采用这种拍法),序列中每幅图和前一幅图非常接近,得用预估和修正一张当前瞬间的图像,然后是后一时间步的,假设图像是同一幅,然后加一个小的修正,只需要对修正进行编码和数字化,然后对修正量进行压缩,所以一系列连续高度相关的图像压缩中的问题总是用到这个相关性,实际上是在时间上和空间上事物不会瞬间变化,通常是很平滑的变化,可以根据前一个值预测一个值 出来,这些应用是纯线性代数问题。

另一组基叫做小波,以8\times8的情况描述如下
\underbrace{ \begin{bmatrix} 1&1&-1&0&1&0&0&0\\ 1&1&-1&0&-1&0&0&0\\ 1&1&-1&0&0&1&0&0\\ 1&1&-1&0&0&-1&0&0\\ 1&-1&0&1&0&0&1&0\\ 1&-1&0&1&0&0&-1&0\\ 1&-1&0&-1&0&0&0&1\\ 1&-1&0&-1&0&0&0&-1 \end{bmatrix} }_{小波基} \in R^8
关于线性代数的问题,就是找出系数p_1,\dots,p_8是标准基的系数,W为小波基
\underbrace{p=p_1w_1+\dots+p_8w_8}_{向量形式的方程}\\ p= \underbrace{ \begin{bmatrix} 1&1&-1&0&1&0&0&0\\ 1&1&-1&0&-1&0&0&0\\ 1&1&-1&0&0&1&0&0\\ 1&1&-1&0&0&-1&0&0\\ 1&-1&0&1&0&0&1&0\\ 1&-1&0&1&0&0&-1&0\\ 1&-1&0&-1&0&0&0&1\\ 1&-1&0&-1&0&0&0&-1 \end{bmatrix} }_{小波基W} \begin{bmatrix}c_1\\c_1\\c_3\\c_4\\c_5\\c_6\\c_7\\c_8\end{bmatrix} \to p=Wc \to c=W^{-1}p
很好的基能快速求逆,性质好指的是

  • 计算速度快
  • 少量基向量就能接近输入信号(即输入向量),因此足够重现图像

WcW^{-1}p计算速度快

W1,-1,0组成,用二进制计算相当快

W基向量正交,但不标准,需要标准处理,向量标准正交的逆等于其转置


基变换

基变换:已知一个基上的向量,变换到不同的基中

令:

​ 矩阵为W,W的列向量是新基的向量,然后牵扯到基变换W^{-1}​
\underbrace{x}_{老基下的向量}\to \underbrace{c}_{新基下和向量}\\ x=Wc
考虑矩阵变换,假设已知线性变换T

​ 第一组基v_1,\dots,v_8A

​ 第二组基w_1,\dots,w_8B

AB的关系如何?

​ 首先如何得到矩阵A和B

来自同一变换T在同一组基上计算得到一个矩阵,然后在另一组基上计算得到的那两个矩阵是相似的,相似阵得到B=M^{-1}AMM就是基变换矩阵
A由v_1,v_2,\dots,v_8基向量组成\\ T(v_1),\dots,T(v_8)\\ 知道T作用在每个基向量的结果就知道一切了\\ x=c_1v_1+\dots+c_8v_8\\ T(x)=c_1T(v_1)+\dots+c_8T(8)\\ T(v_1)=a_{11}v_1+\dots+a_{81}v_8\\ T(v_1)=a_{12}v_1+\dots+a_{82}v_8\\ \vdots\\ T(v_1)=a_{18}v_1+\dots+a_{88}v_8\\ A表示T在这组基上的这些数 A=\begin{bmatrix}a_{11}&\dots&a_{81}\\\vdots&\ddots&\vdots\\a_{18}&\dots&a_{88}\end{bmatrix}
假设一组特征向量基
T(v_i)=\lambda v_i
A将是多少?
A=\begin{bmatrix}\lambda_1&&&\\&\ddots&&\\&&\lambda_8\end{bmatrix}
特征向量基下,矩阵是对角阵,所以它是完美基,在图像处理中我们最想要的。但是找出像素矩阵特征向量代价太大,所以选择代价小且接近的接好的基,比如小波基

相关文章

  • 第32课 基变换和图像压缩

    关于基变换:从一组基变换到另一组基 主题:线性变换与矩阵的关联,线性变换不一定是在坐标系内,而矩阵用坐标来表示线性...

  • 线性代数笔记32

    基变换 图像压缩 选择合适的基,就能用少量的基来复现原图Few is enough 已知一个变换T对于来说有矩阵A...

  • 11 MRI图像分析--连续离散傅里叶变换

    前言 连续傅里叶变换和离散傅里叶变换经常用于MRI 图像分析之中,第11块主要讲MRI 图像和傅里叶变换的细节,涉...

  • 离散余弦变换(DCT)

    DCT变换的全称是离散余弦变换(Discrete Cosine Transform),主要运用于数据或图像的压缩。...

  • 图像傅里叶变换(二维离散傅里叶变换)

    应用:二维离散傅里叶变换是将图像从空间域转至频域,在图像增强、图像去噪、图像边缘检测、图像特征提取、图像压缩等等应...

  • H264系列七 JPEG DCT JPEG2000 DWT

    参考概述·离散余弦变换(DCT)及其实现过程基于DCT变换的JPEG图像压缩原理能不能通俗的讲解下傅立叶分析和小波...

  • OpenCV实现图像的几何变换

    图像的几何变换 几何变换主要包括缩放、平移、旋转、仿射变换、透视变换和图像裁剪等。执行这些几何变换的两个关键函数是...

  • 图像傅里叶变换

    对图像进行傅里叶变换,分出低频和高频部分。 着重参考->分别使用numpy和pytorch进行图像傅里叶变换和频域...

  • pytorch 图像预处理 transforms数据增强方法(二

    一、transforms图像变换 1.transforms图像变换之pad 2.transforms图像变换之co...

  • Python为图片加水印

    Pillow是python的一个功能强大的图像处理的库,可对图像进行高质量的压缩变换等操作,前几天看到一些公众号,...

网友评论

      本文标题:第32课 基变换和图像压缩

      本文链接:https://www.haomeiwen.com/subject/mrqatctx.html