采用自适应模糊系统进行图像编码
传输数字图像数据增加了会话的准确性,但是同时也需要更大的带宽。有限的信道容量更偏向于图像压缩技术。这些技术旨在将表示一幅图像所需的比特数降到最低,同时重建这幅图像时可以有较小的失真。
在自然图像中,像素灰度级之间具有很强的相关性。而图像编码是用不相关的数据来表示一幅图像。这些不相关的数据没有冗余,而且包含了原始图像的基本必要信息。
图像编码采用的形式有:预测编码和变换编码。
在预测编码中,我们直接利用数据中的冗余来预测在相似图像内容中的相似行为。预测编码是根据离散信号之间存在着一定关联性的特点,利用前面一个或多个信号预测下一个信号进行,然后对实际值和预测值的差(预测误差)进行编码。如果预测比较准确,误差就会很小。在同等精度要求的条件下,就可以用比较少的比特进行编码,达到压缩数据的目的。
在变换编码中,一个变换,比如像离散余弦变换(DCT)的能量守恒变换,将一幅图像转换成不相关的数据。我们保留有较高能量的变换系数,摒弃掉能量低的变换系数,以此来压缩图像数据。变换编码不是直接对空域图像信号进行编码,而是首先将空域图像信号映射变换到另一个正交矢量空间(变换域或频域),产生一批变换系数,然后对这些变换系数进行编码处理。变换编码是一种间接编码方法,其中关键问题是在时域或空域描述时,数据之间相关性大,数据冗余度大,经过变换在变换域中描述,数据相关性大大减少,数据冗余量减少,参数独立,数据量少,这样再进行量化,编码就能得到较大的压缩比。
Jain[1981]和Netravali[1980]总结了几种图像压缩技术。我们可以将自适应模糊方法应用到一种变换编码的简单形式上。
High-definition television system (HDTV)使图像编码领域再一次活跃起来。原则上,我们可以将模糊图像编码用于三维电视图像编码。电视图像在时域上有更强的相关性,相比于在空间域上。这种时间上相关性就允许比通常图像编码实现更高的压缩率。
自适应余弦变换编码(Adaptive cosine transform coding)产生了一种小于1bit/pixel的压缩率的高质量压缩图像。这个系统根据它们的交流能量(AC energy)等级将子图像分成四类,并且对每一类用不同的位图进行编码。如果一个子图像拥有很多细节(也就是说这个子图像的AC能量比较大),这个系统就会分给这个子图像更多的比特数,反之亦然,如果一个子图像有较少的细节(AC能量小),系统就会分配给它较少的比特数。直流能量(DC energy)是指图像中恒定的背景强度,并表现为平均值。AC能量测量DC平均能量的强度偏差,因此AC能量具有样本方差统计特性。
模糊变换图像编码用的是常识性的模糊规则来对子图像进行分类。模糊联想记忆(FAM)规则对结构知识进行编码,例如模糊关联。这个模糊关联(Ai ,Bi)代表的是一条语言规则”IF X is Ai ,THEN Y is Bi”。在模糊变换图像编码中,Ai表示的是一个子图像的AC能量分布,Bi定义了类的成员资格。
第8章讨论的积空间聚类,根据the Chen system生成的训练数据估计FAM规则。FAM系统估计非线性子图像分类函数f:E →m, E表示的是子图像的AC能量分布,m表示的是子图像类的成员资格。
图像的自适应余弦变换编码
二维离散余弦变换的定义式为:
DCT的能量压缩能力接近最优Karhunen Loeve变换(KLT)。DCT具有快速实现、有实值变换的系数和边界效应小的优点。我们将大小为256*256的原始图像划分为16*16的子图像,并且对每个子图像作两位的离散余弦变换。
Chen的自适应变换编码系统将子图像根据它们的AC能量进行分类,把它们分为1,2,3,4四类。第一类包含了具有最高活性的子图像,第四类包含了具有最低活性的子图像。每个子图像中的AC能量测量该子图像的活动水平。每一类含有64幅子图像,总共256幅子图像。
子图像的DC能量和AC能量的定义:
X(u,v)代表一副图像x(m,n)的二维DCT变换系数。X(0, 0)代表的是背景的亮度等级,DC项。另一个X(u,v)项是交流能量的一部分,它是未确知样本方差的一部分。对于具有均匀背景强度的子图像来说,大部分的能量集中在X(0,0)附近。对于子图像来说,灰度级变化的范围越大,能量扩散的范围就越大。
Chen系统用每个图片元素的方差来计算四个位图以对每个子图像进行分类。对于方差大的,给每个像素分配以较多的比特数,反之,方差小的,每个像素分配较少的比特数,并且量化前用标准差归一化变换系数。在解码中,我们将通过归一化系数得到的量化变换系数相乘。“Side information”是指在接收机处对压缩图像数据进行解码所需的信息。在Chen系统中,每一幅图像的Side information包括一个分类图,归一化系数,还有四个位图。
我们用信噪比(SNR)来评估编码后图像的质量:
σr2表示的是随机重构误差r(m,n)的样本方差:
R表示的是平均编码的bits/pixel:
自适应FAM系统用于变换编码
AFAM系统从训练数据中得到FAM规则。定义变量B表示子图像的分类(输出),有四个模糊类别,分别是:HI(high),MH(medium high),ML(medium low),LO(low)。我们编码HI子图像用更多的比特数,LO子图像用更少的比特数。定义变量T表示一个子图的总的AC总功率,被量化为四个模糊集合,分别是:BG(big),MD(medium),SL(small),VS(very small)。为了帮助做出模糊决策,再定义一个变量L来表示AC总功率的低频功率。L只有两个模糊集合:SM(small)和LG(large)。
每个子图的AC总功率T和AC总功率的低频功率L的计算公式为:
量化隶属度函数的选择
我们通过由Chen系统产生的训练数据来估计FAM规则,表示形式为(Ti,Li;Bi)。指数i的范围是从1到256,是子图像的数量。Ti和Li定义的是第i幅子图像的AC总功率和低频AC功率,Bi定义的是这第i幅子图像所属的类别(1,2,3,4)。
我们使用的是按照最大可能AC功率缩放了的Ti和Li的比例缩放值。子图像里均是0到255之间的随机数,我们根据这个子图像的DCT变换系数计算出最大的AC功率Tmax。Tmax等于16129.46。
对于每一类的AC功率的算术平均值的计算公式为:
对于Lena图像:
积空间聚类来估计FAM规则
在输入—输出的积空间Rn中,基于竞争学习的积空间聚类可以自适应地量化模式聚类。随机竞争学习系统是神经自适应矢量量化(AVQ)系统。p神经元通过随机采样的输入输出模式竞争激活。相应的突触扇入矢量mj自适应地量化模式空间Rn。p突触向量mj定义突触连接矩阵M的第p列。
这样就有32(4*2*4)个可能的FAM cells,因此有32个可能的FAM规则。我们用32个量化的突触向量来估计FAM规则。
微分竞争学习将从陈系统生成的256个输入输出数据向量中的每一个分类为32个FAM单元中的一个。如果DCL训练的突触向量落入FAM-cell中,我们就将FAM规则加入到FAM系统中。经过基于DCL的积空间聚类,我们可以估计出5条FAM规则(1,2,6,7和8),根据经验补上其中的3,4,5条使规则完整,以能够覆盖整个输入空间。
微分竞争学习
结论
FAM系统比陈系统有更好的性能,且二者输入输出行为也很近似。理论上,我们可以把这种基于规则产生的非监督技术用于图像和信号处理的问题。
文中使用Lena 图像的训练数据进行估计的FAM系统对F-16战斗机图像进行编码,结果表明其性能依然很好,其压缩达到了 0.5 bits / pixel。
文中比较了陈系统和FAM系统的性能,FAM系统拥有较好的信噪比和压缩比。
网友评论