美文网首页
第32课 基变换和图像压缩

第32课 基变换和图像压缩

作者: rascalpotato | 来源:发表于2019-11-11 12:39 被阅读0次

    关于基变换:从一组基变换到另一组基

    主题:线性变换矩阵关联线性变换不一定是在坐标系内,而矩阵用坐标来表示线性变换


    例:512\times512的图,每像素8bits,值为0\le x_i<255,实际上是对R^n中的向量x做操作,x\in R^n;n=512^2(彩色图为3\times512^2)

    JPEG的全称联合图像专家组,对图像数据做基变换。

    值相近的相互关联(即颜色相近)

    标准基为\begin{bmatrix}1\\0\\\vdots\\0\end{bmatrix},\begin{bmatrix}0\\1\\0\\\vdots\end{bmatrix},\dots,\begin{bmatrix}0\\\vdots\\0\\1\end{bmatrix}R中的其他基是这个高维数的空间

    更好的基:元素都为1的向量,这个向量就能完整地给出所有像素一致图像的信息,当然我们的图像像素不是一致的,混合着一些其他信号。在基中有这样一个向量,也能解决很大问题,基中其它向量是多少,基的选择问题很关键

    JPEG用到的基为傅里叶基8\times8,取8\times8的小块,有64个像素,从这一小块上做基变换。

    步骤:
    信号x\to \underbrace{基变换}_{无损压缩}\to 得到系数c \to 压缩 \to \underbrace{压缩系数}_{得到很多0} \to 重构信号x

    视频压缩是连续的(间隔很短时间取的是同一幅图像,然后慢速播放,激烈中的动作就采用这种拍法),序列中每幅图和前一幅图非常接近,得用预估和修正一张当前瞬间的图像,然后是后一时间步的,假设图像是同一幅,然后加一个小的修正,只需要对修正进行编码和数字化,然后对修正量进行压缩,所以一系列连续高度相关的图像压缩中的问题总是用到这个相关性,实际上是在时间上和空间上事物不会瞬间变化,通常是很平滑的变化,可以根据前一个值预测一个值 出来,这些应用是纯线性代数问题。

    另一组基叫做小波,以8\times8的情况描述如下
    \underbrace{ \begin{bmatrix} 1&1&-1&0&1&0&0&0\\ 1&1&-1&0&-1&0&0&0\\ 1&1&-1&0&0&1&0&0\\ 1&1&-1&0&0&-1&0&0\\ 1&-1&0&1&0&0&1&0\\ 1&-1&0&1&0&0&-1&0\\ 1&-1&0&-1&0&0&0&1\\ 1&-1&0&-1&0&0&0&-1 \end{bmatrix} }_{小波基} \in R^8
    关于线性代数的问题,就是找出系数p_1,\dots,p_8是标准基的系数,W为小波基
    \underbrace{p=p_1w_1+\dots+p_8w_8}_{向量形式的方程}\\ p= \underbrace{ \begin{bmatrix} 1&1&-1&0&1&0&0&0\\ 1&1&-1&0&-1&0&0&0\\ 1&1&-1&0&0&1&0&0\\ 1&1&-1&0&0&-1&0&0\\ 1&-1&0&1&0&0&1&0\\ 1&-1&0&1&0&0&-1&0\\ 1&-1&0&-1&0&0&0&1\\ 1&-1&0&-1&0&0&0&-1 \end{bmatrix} }_{小波基W} \begin{bmatrix}c_1\\c_1\\c_3\\c_4\\c_5\\c_6\\c_7\\c_8\end{bmatrix} \to p=Wc \to c=W^{-1}p
    很好的基能快速求逆,性质好指的是

    • 计算速度快
    • 少量基向量就能接近输入信号(即输入向量),因此足够重现图像

    WcW^{-1}p计算速度快

    W1,-1,0组成,用二进制计算相当快

    W基向量正交,但不标准,需要标准处理,向量标准正交的逆等于其转置


    基变换

    基变换:已知一个基上的向量,变换到不同的基中

    令:

    ​ 矩阵为W,W的列向量是新基的向量,然后牵扯到基变换W^{-1}​
    \underbrace{x}_{老基下的向量}\to \underbrace{c}_{新基下和向量}\\ x=Wc
    考虑矩阵变换,假设已知线性变换T

    ​ 第一组基v_1,\dots,v_8A

    ​ 第二组基w_1,\dots,w_8B

    AB的关系如何?

    ​ 首先如何得到矩阵A和B

    来自同一变换T在同一组基上计算得到一个矩阵,然后在另一组基上计算得到的那两个矩阵是相似的,相似阵得到B=M^{-1}AMM就是基变换矩阵
    A由v_1,v_2,\dots,v_8基向量组成\\ T(v_1),\dots,T(v_8)\\ 知道T作用在每个基向量的结果就知道一切了\\ x=c_1v_1+\dots+c_8v_8\\ T(x)=c_1T(v_1)+\dots+c_8T(8)\\ T(v_1)=a_{11}v_1+\dots+a_{81}v_8\\ T(v_1)=a_{12}v_1+\dots+a_{82}v_8\\ \vdots\\ T(v_1)=a_{18}v_1+\dots+a_{88}v_8\\ A表示T在这组基上的这些数 A=\begin{bmatrix}a_{11}&\dots&a_{81}\\\vdots&\ddots&\vdots\\a_{18}&\dots&a_{88}\end{bmatrix}
    假设一组特征向量基
    T(v_i)=\lambda v_i
    A将是多少?
    A=\begin{bmatrix}\lambda_1&&&\\&\ddots&&\\&&\lambda_8\end{bmatrix}
    特征向量基下,矩阵是对角阵,所以它是完美基,在图像处理中我们最想要的。但是找出像素矩阵特征向量代价太大,所以选择代价小且接近的接好的基,比如小波基

    相关文章

      网友评论

          本文标题:第32课 基变换和图像压缩

          本文链接:https://www.haomeiwen.com/subject/mrqatctx.html