计算机图像处理概述

计算机图像处理

姓名:李 晓 通

学号:10360217

班级:10级信管2班

联系方式:[1**********]

目录

一、图像处理的基本概念„„„„„„„„„„„„„„„„„„„ 3

二、数字图像压缩编码技术的产生及发展过程„„„„„„„„„„ 3

三、图像数据压缩原理„„„„„„„„„„„„„„„„„„„„ 4

四、几种常见的图像压缩编码技术„„„„„„„„„„„„„„„ 5

1、行程长度编码(RLE )„„„„„„„„„„„„„„„„„ 6

2、LZW 编码 „„„„„„„„„„„„„„„„„„„„„„ 6

3、霍夫曼编码 „„„„„„„„„„„„„„„„„„„„„ 6

4、预测及内插编码„„„„„„„„„„„„„„„„„„„„ 7

5、矢量量化编码„„„„„„„„„„„„„„„„„„„„„ 7

6、变换编码„„„„„„„„„„„„„„„„„„„„„„„ 7

7、模型法编码„„„„„„„„„„„„„„„„„„„„„„ 8

8、小波变换编码„„„„„„„„„„„„„„„„„„„„„ 8

五、几种重要的和常用的图像压缩算法„„„„„„„„„„„„„ 9

1、JPEG 压缩„„„„„„„„„„„„„„„„„„„„„„ 9

2、JEPG2000 压缩„„„„„„„„„„„„„„„„„„„„ 10

3、小波变换图像压缩„„„„„„„„„„„„„„„„„„„11

4、分形图像压缩„„„„„„„„„„„„„„„„„„„„„11

六、总结:„„„„„„„„„„„„„„„„„„„„„„„„„12

七、计算机图像处理上课心得„„„„„„„„„„„„„„„„„12

浅析数字图像压缩编码技术

引言:随着计算机技术和网络技术的迅速发展,图像、声音等多媒体信息的记录、存储、传输已经数字化,庞大的数据量给存储和传输带来了一定的困难,数字图像的压缩已成为解决该问题的关键技术。数字图像压缩技术对于数字图像信息在网络上实现快速传输和实时处理具有重要的意义。

一、 图像处理基本概念

图像:凡是纪录在纸上的,拍摄在照片上的,显示在屏幕上的所有具有视觉效果的画面都可以称为图像。

数字图像:用数字形式存储图像上各点的灰度信息,像素是其最小的单位。 像素:在计算机中,图像被分割成下图所示的像素(Pixel ),各像素的灰度值用整数表示。

数字图像处理(Digital Image Processing) :又称为计算机图像处理,是指将图像信息转换成数字电信号并利用计算机或其他高速、大规模集成数字硬件对其进行某些数字运算或处理,以期提高图像质量或达到人们要求的某些预期的结果。

二、 数字图像压缩编码技术的产生及发展过程

任意形状可视对象编码随着多媒体技术和通讯技术的不断发展, 多媒体娱乐、信息高速公路等不断对信息数据的存储和传输提出了更高的要求, 也给现有的有限带宽以严峻的考验, 特别是具有庞大数据量的数字图像通信, 更难以传输和存储, 极大地制约了图像通信的发展, 因此图像压缩技术受到了越来越多的关注。图像压缩的目的就是把原来较大的图像用尽量少的字节表示和传输, 并且要求复原图像有较好的质量。利用图像压缩, 可以减轻图 像存储和传输的负担, 使图像在网络上实现快速传输和实时处理。

图像压缩编码技术可以追溯到1948年提出的电视信号数字化,到今天已经有50年的历史了。五十年代和六十年代的图像压缩技术由于受到电路技术等的制约,仅仅停留在预测编码、亚采样以及内插复原等技术的研究,还很不成熟。1969年在美国召开的第一届" 图像编码会议" 标志着图像编码作为一门独立的学科诞生了。到了70年代和80年代,图像压缩技术的主要成果体现在变换编码技术上,矢量量化编码技术也有较大发展,有关于图像编码技术的科技成果和科技论文与日俱增,图像编码技术开始走向繁荣。自80年代后期以后,由于小波变换理论,分形理论,人工神经网络理论,视觉仿真理论的建立人们开始突破传统的信源编码理论,例如不再假设图像是平稳的随机场。图像压缩编码向着更高的压缩比和更好的压缩质量的道路前进,进入了一个崭新的、欣欣向荣的大发展时期。其中分形图 像压缩和小波图像压缩是当前研究的热点。

近年来,图像编码技术的进展主要表现在以下三个方面:(1)图像压缩国际标准的制定工作进展迅速。如ISO 组织制定的用于静止图像压缩的JPEG 标准,用于活动图像压缩的MPEG-1. MPEG-2和MPEG-4标准以及ITU-T 组织制定的H.261和H.263建议等。(2)由于VLSL 技术的迅猛发展,促进了高速、高性能数字图像压缩处理芯片的开发。(3)许多学者结合模式识别、计算机视觉、计算机图形学、神经网络理论、小波变换以及分形理论等,开始探索图像编码的新途径。同时,人的视觉生理特性的研究成果也开拓了人们的视野。新的图像编码技术不断涌现,如“第二代”图像编码方法、模型荃编码、小波变换编码、分形编码以及神经网络方法等,简述如下。

(1)“第二代”图像编码

“第 一 代 ”图像编码是以信息论和数字信号处理技术为理论基础,昌在去除图像数据中的线性相关性的一类编码技术. 这类技术去除客观和视觉的冗余信息的能力已经接近极限; 而“第二代”图像变码技术是指不局限于Shannon 信息论的框架,要求充分利用人的视觉生理心理特性和图像信源的各种特性,以获得较高的压缩比的编码技术。“第二代”图像编码有基于方向性的图像编码技术和基于区域分割与合并的图像编码技术两类。

(2) 模型基图像编码

模型基图像编码是一种基于景物三维模型的方法。其中通信双方有一个相同的景物三维模型. 基于这个模型,在编码器中用图像分析提取景物参数. 如形状参数、运动参数等. 这些参数被编码后通过信道传送到接收端,山后者的解码器根据收到的参数用图像合成技术再重建图像。模型基图像编码方案大致可分为两类:第一类是基于景物的模型荃图像编码,其中的景物的三维模型是己知的,称为“语义基“(Semantix-based ) 图像编码; 第二类是针对未知物体的模型基编码,称为“物体基”(Object-based)图像编码。

(3)小波变换编码技术

小波变换编码技术是在上世纪80年代发展起来的,它是以局部化函数所形成的相似函数作为基底而展开的。同付里叶变换相比,小波变换在频域的分析梢度稍差一些,但在时域的分析能力上要好一些,而且可以对时间和频城词~月时进行分解。传统 的 D CT变换主要适合压缩那些带宽较窄的图像。这类图像进行DCT 变换后,系数矩阵中非0值分布在很有限的局部区域,因此会取得较好的压缩效果。当信号带宽较宽时,经DCT 变换后的非0值分布在相当大的区域内,这时的编码效率低。而小波变换是一种频率上自由的变换,当带宽较宽时,它可以通过放大的方式使描述能够满足精度的需要。小波变换弥补了DC 丁变换不适合于带宽较宽的信号进行压缩的不足,是一种不受带宽限制的图像压缩方法。

三、 图像数据压缩原理

由于图像数据之间存在一定的相关性就好比一幅图像中各个像素之间存在一定的相关性一样。在活动的图像中,像视频中每相邻两幅图像质检单时间间隔非常短,所以两幅图像中包含大量相关信息。这些相关信息就是图像信息中的冗余。由于图像数据之间存在着一定的冗余,所以使得数据的压缩成为可能。压缩的目的就是在不影响图像视觉效果的前提下尽可能多的去除图像信息中的大量冗余。

1、图像冗余

(1)空间冗余:像素之间的相关性;

(2)时间冗余:活动图像的两个连续帧之间的冗余;

(3)信息熵冗余:单位信息量大于它的熵的值;

(4)结构冗余:图像的区域上存在非常强的纹理结构;

(5)知识冗余:由先验知识得到的规律结构,如人的头像;

(6)视觉冗余:人眼的视觉特性限制,人眼不能完全察觉到图像画面的所有细小的变化,某些图像的失真是人眼不易察觉的;

2、压缩原理

数字图像的相关性:将相邻像素点、相邻数据帧、相邻图像之间的相关性信息去除或减少图像信息中的冗余度,这样就实现了数字图像的压缩。

人的视觉心里特征:利用人的视觉对于边缘急剧变化不敏感,对颜色分辨力弱等特性可以在相应部分适当的降低编码精度从而达到不改变图像的视觉感官的情况下对图像进行了压缩。

信息论的创始人Shannon 提出把数据看作是信息和冗余度(redundancy)的组合。冗余数据有:编码冗余、像素间冗余、心理视觉冗余三种。

对数字图像进行压缩通常利用两个基本原理:

(1) 数字图像的相关性。在图像的同一行相邻像素之间、活动图像的相邻帧的对应像素之间往往存在很强的相关性,去除或减少这些相关性,也就去除或减少图像信息中的冗余度,即实现了对数字图像的压缩。

(2) 人类视觉系统也造成了某种程度的心理视觉冗余度。人的视觉对于边缘急剧变化不敏感(视觉掩盖效应) ,对颜色分辨力弱,利用这些特征可以在相应部分适当降低编码精度,而使人从视觉上并不感觉到图像质量的下降,从而达到对数字图像压缩的目的。从理论的角度来看,应针对图像数据中的冗余信息获得尽可能高的压缩度。

3、图像压缩系统

典型的图像压缩系统主要由3部分组成:变换部分(Transformer)、量化部分(Quatizer)和编码部分(Coder)。

(1) 变换部分 他体现了输入原始图像和经过变换的图像之间的一一对应关系。变换也称为去除相关,他减少了图像中的冗余信息,与输入原始图像数据相比,变换后的图像数据提供了一种更易于压缩的图像数据表示形式。

(2) 量化部分 量化部分把经过变换的图像数据作为输入进行处理后,会得到有限数目的一些符号。一般而言,这一步会带来信息的损失,而这也恰是有损压缩方法和无损压缩方法之间主要的区别。在无损压缩方法中,这一步骤并不存在,这是一个不可逆的过程,原因就在于这是多到一映射,存在有2种量化类型:标量量化与矢量量化,前者是在一个象素、一个象素的基础上量化,而后者对象素向量进行量化。

(3) 编码部分 这是压缩过程中最后一个步骤。这个部分将经过变换的系数编码为二进制位流,这个部分可以采用固定长编码,或变动长度编码,前者对所有符号赋予等长的编码,而后者则对出现频率较高的符号分,变动长度编码也叫熵编码,他能把经过变换得到的图像系数数据以较短的信息总长度来表示,因而在实际应用中,多采用此类编码方式,得到的图像系数数据可以用一个离散随机过程S 来表示。

四、 几种常见的图像压缩编码技术

数字图像压缩技术可以分为无损压缩技术和有损压缩技术。图像无损压缩技术主要有:位平面编码、无损预测编码(DPCM )以及有损编码与残差无损编码的

组合编码技术。传统的数字图像有损压缩技术主要有预测(PCM、DPCM) 、方块化、向量量化VQ 、层次化、子频带和变换等。近年来,人们又提出了神经网络法、几何模型化、分形和小波变换等编码技术。通常认为,JBIG 、JPEG 、MEPG-1、MPEG-2、MEPG-4以及酝酿中MPEG-7图像压缩的国际标准是针对不同应用的最佳压缩算法之一。在这些标准之中成功地采用了以上的一种或多种混合压缩技术。

1、行程长度编码(RLE )

行程长度编码是压缩一个文件最简单的方法之一。 它的做法就是把一系列的重复值(例如图象像素的灰度值)用一个单独的值再加上一个计数值来取代。比如有这样一个字母序列aabbbcccccccc 它的行程长度编码就是2a3b8c 。这种方法实现起来很容易,而且对于具有长重复值的串的压缩编码很有效。很多位图文件格式都用行程长度编码,例如TIFF ,PCX ,GEM 等。

2、LZW 编码

这是三个发明人名字的缩写(Lempel ,Ziv ,Welch ),其原理是将每一个字节的值都要与下一个字节的值配成一个字符对,并为每个字符对设定一个代码。当同样的一个字符对再度出现时,就用代号代替这一字符对,然后再以这个代号与下个字符配对。LZW 编码原理的一个重要特征是,代码不仅仅能取代一串同值的数据,也能够代替一串不同值的数据。在图像数据中若有某些不同值的数据经常重复出现,也能找到一个代号来取代这些数据串。在此方面,LZW 压缩原理是优于RLE 的。

LZW 编码的物理过程:LZW 的编码能有效地利用字符出现的频率冗余度,字符重复性和高使用率模式冗余度。LZW 编码只需扫描一次数据,无需有关输入数据统计量的先验信息而运算时间正比于消息的长度。LZW 算法中,首先建立一个字符串表,把每一个第一次出现的字符串放入串表中,并用一个数字来表示,这个数字与此字符串在串表中的位置有关,并将这个数字存入压缩文件中,如果这个字符串再次出现时,即可用表示它的数字来代替,并将这个数字存入文件中。压缩完成后将串表丢弃。

LZW 算法的实现主要包括编码和解码两部分。

(1)、编码部分

主要是实现对原始文件进行编码压缩,并输出压缩后的文件。根据LZW 压缩算法的原理,LZW 编码器采用了一种贪婪分析算法,每一次分析都要串行地检查来自字符流的字符串,从中分解出已经在词典中出现的最长的短语,输出其相对应的代码,用该短语加上下一个输入字符形成新的扩展字符串,加到字典中。它采用一个串表,用来实现压缩原理。实现采用9-12位的可变长编码,允许压缩算法表示0-4096的数字,所以串表最多可有4096个项。这个串表对不同数据是不一样的,但不需要保留给解压缩程序,因为解压缩过程中能自动建立和压缩过程中相同的串表。

(2)、解码部分

主要是实现对压缩后的文件进行解码还原,无损的还原出原始文件。其实就是编码的逆向过程,要从已经编译好的数据(编码流) 中找出相应的串表,然后对照字典标号集还原数据

3、霍夫曼编码

霍夫曼编码(Huffman encoding)是通过用不固定长度的编码代替原始数据来实现的。霍夫曼编码最初是为了对文本文件进行压缩而建立的,迄今已经有很多变体。它的基本思路是出现频率越高的值,其对应的编码长度越短,反之出现

频率越低的值,其对应的编码长度越长。

霍夫曼编码很少能达到8∶1的压缩比,此外它还有以下两个不足:①它必须精确地统计出原始文件中每个值的出现频率,如果没有这个精确统计,压缩的效果就会大打折扣,甚至根本达不到压缩的效果。霍夫曼编码通常要经过两遍操作,第一遍进行统计,第二遍产生编码,所以编码的过程是比较慢的。另外由于各种长度的编码的译码过程也是比较复杂的,因此解压缩的过程也比较慢。 ②它对于位的增删比较敏感。由于霍夫曼编码的所有位都是合在一起的而不考虑字节分位,因此增加一位或者减少一位都会使译码结果面目全非。

4、预测及内插编码

一般在图象中局部区域的象素是高度相关的,因此可以用先前的象素的有关灰度知识来对当前象素的灰度进行预计,这就是预测。而所谓内插就是根据先前的和后来的象素的灰度知识来推断当前象素的灰度情况。如果预测和内插是正确的,则不必对每一个象素的灰度都进行压缩,而是把预测值与实际象素值之间的差值经过熵编码后发送到接收端。在接收端通过预测值加差值信号来重建原象素。

预测编码可以获得比较高的编码质量,并且实现起来比较简单,因而被广泛地应用于图象压缩编码系统。但是它的压缩比并不高,而且精确的预测有赖于图象特性的大量的先验知识,并且必须作大量的非线性运算,因此一般不单独使用,而是与其它方法结合起来使用。如在JPEG 中,使用了预测编码技术对DCT 直流系数进行编码,而对交流系数则使用量化+游程编码+霍夫曼编码。

5、矢量量化编码

矢量量化编码利用相邻图象数据间的高度相关性,将输入图象数据序列分组,每一组m 个数据构成一个m 维矢量,一起进行编码,即一次量化多个点。根据仙农率失真理论,对于无记忆信源,矢量量化编码总是优于标量量化编码。 编码前,先通过大量样本的训练或学习或自组织特征映射神经网络方法,得到一系列的标准图象模式,每一个图象模式就称为码字或码矢,这些码字或码矢合在一起称为码书,码书实际上就是数据库。输入图象块按照一定的方式形成一个输入矢量。编码时用这个输入矢量与码书中的所有码字计算距离,找到距离最近的码字,即找到最佳匹配图象块。输出其索引(地址)作为编码结果。解码过程与之相反,根据编码结果中的索引从码书中找到索引对应的码字(该码书必须与编码时使用的码书一致),构成解码结果。由此可知,矢量量化编码是有损编码。目前使用较多的矢量量化编码方案主要是随机型矢量量化,包括变换域矢量量化,有限状态矢量量化,地址矢量量化,波形增益矢量量化,分类矢量量化及预测矢量量化等。

6、变换编码

变换编码就是将图象光强矩阵(时域信号)变换到系数空间(频域信号)上进行处理的方法。在空间上具有强相关的信号,反映在频域上是某些特定的区域内能量常常被集中在一起,或者是系数矩阵的分布具有某些规律。我们可以利用这些规律在频域上减少量化比特数,达到压缩的目的。由于正交变换的变换矩阵是可逆的且逆矩阵与转置矩阵相等,这就使解码运算是有解的且运算方便,因此运算矩阵总是选用正交变换来做。

常用的变换编码有K -L 变换编码和DCT 编码。K -L 变换编码在压缩比上优于 DCT 编码,但其运算量大且没有快速算法,因此实际应用中广泛采用DCT 编码。

7、模型法编码

预测编码、矢量量化编码以及变换编码都属于波形编码,其理论基础是信号理 论和信息论;其出发点是将图象信号看作不规则的统计信号,从象素之间的相关性 这一图象信号统计模型出发设计编码器。而模型编码则是利用计算机视觉和计算机 图形学的知识对图象信号的分析与合成。

模型编码将图象信号看作三维世界中的目标和景物投影到二维平面的产物,而 对这一产物的评价是由人类视觉系统的特性决定的。模型编码的关键是对特定的图 象建立模型,并根据这个模型确定图象中景物的特征参数,如运动参数、形状参数 等。解码时则根据参数和已知模型用图象合成技术重建图象。由于编码的对象是特 征参数,而不是原始图象,因此有可能实现比较大的压缩比。模型编码引入的误差 主要是人眼视觉不太敏感的几何失真,因此重建图象非常自然和逼真。

8、小波变换编码

为了继承Fourier 分析的优点,同时又克服它的许多缺点,人们一直在寻找新的方法。小波变换的理论是近年来兴起的新的数学分支,它是继1822年法国人傅立叶提出傅立叶变换之后又一里程碑式的发展,解决了很多傅立叶变换不能解决的困难问题。傅立叶变换虽然已经广泛地应用于信号处理领域,较好地描述了信号的频率特性,取得了很多重要的成果,但傅立叶变换却不能较好地解决突变信号与非平稳信号的问题。小波变换可以被看作是傅立叶变换的发展,即它是空间(时间)和频率的局部变换,能更加有效地提取信号和分析局部信号。 小波变换用于图像编码的基本思想就是把图像进行多分辨率分解,分解成不同空间、不同频率的子图像,然后再对子图像进行系数编码。系数编码是小波变换用于压缩的核心,压缩的实质是对系数的量化压缩。根据S.Mallat 的塔式分解算法,图像经过小波变换后被分割成四个频带:水平、垂直、对角线和低频,低频部分还可以继续分解。

小波变换用于图像数据压缩时需要考虑的几个问题:任何实正交的小波对应的滤波器组都可以实现像的分解与合成,但是并不是任何分解都能满足我们的要求,同一幅图像,用不同的小波基进行分解所得到的压缩效果是不一样的。我们希望经小波分解后,得到的三个方向上的细节分量具有高度的局部相关性,而整体相关性被大部分甚至完全解除。对小波基的选取应考虑以下因素:

(1) 小波基的正则性阶数和图像数据压缩效果的关系。小波变换要求滤波器具有正则性,正则性是函数光滑程度的一种描述,一般情况下,正则性越强,数据压缩效果越好。

(2) 待处理图像与小波基的相似性。

(3) 由于在图像处理中数据量特别大,所以不能片面考虑追求高压缩比,而应该综合考虑压缩效率和复杂程度。由于图像数据压缩中的小波变换通常是由图像信号和滤波器的离散卷积实现,所以滤波器的长度不能太长,否则计算量太大而没有使用价值。

(4) 小波变换的分解层数(变换级数)与图像数据压缩的关系。由于小波及小波包技术可以将信号或图像分层次按小波基展开,所以可以根据图像信号的性质以及事先给定的图像处理要求确定到底要展开到哪一级为止,从而不仅能有效地控制计算量,满足实时处理的需要,而且可以方便地实现通常由子频带、层次编码技术实现的累进传输编码(即采取逐步浮现的方式传送多媒体图像)。

(5) 小波函数的能量集中特性应好。

(6) 小波变换的边界问题。

小波变换继承了Fourier 分析的优点,同时又克服它的许多缺点,所以它在静态和动态图缩领域得到广泛的应用,并且已经成为某些图像压缩国际标准(如MPEG-4)的重要环节。当然像其他变换编码一样,在压缩比特别高的时候,小波变换压缩量化后的重建图像也会产生几何畸变。

小波变换实现图像压缩原理:

小波变换用于图像压缩的基本思想是:对图像进行多分辨率分解, 分解成不同空间、不同频率的子图像, 然后再对子图像系数进行编码。系数编码是小波变换用于图像压缩的核心, 压缩的实质是对系数的量化压缩。图像经过小波变换后生成的小波图像的数据总量与原图像的数据总量相等, 即小波变换本身并不具有压缩功能。之所以将它用于图像压缩, 是因为生成的小波图像具有与原图像不同的特性, 表现在图像的能量主要集中在低频部分, 而水平、垂直和对角线部分的能量则较少;水平、垂直和对角线部分表征了原图像在水平、垂直和对角线部分的边缘信息, 具有明显的方向特性。低频部分称为亮度图像, 水平、垂直和对角线部分称为细节图像。所以一个最简单的压缩方法是利用小波分解, 保留低频部分,将高频部分置0。

五、 几种重要的和常用的图像压缩算法

1、 JPEG 压缩

负责开发静止图像压缩标准的“联合图片专家组”( Joint Photographic Expert Group, 简称 JPEG) , 于 1989 年 1 月形成了 基于自适应 DCT 的 JPEG 技术规范的第一个草案, 其后多次修改, 至1991年形成 ISO10918国际标准草案, 并在一年后成为国际标准, 简称JPEG 标准。

1.1、JPEG 压缩原理及特点

JPEG 算法中首先对图像进行分块处理, 一般分成互不重 叠的大小的块, 再对每一块进行二维离散余弦变换(DCT)。变换后的系数基本不相关, 且系数矩阵的能量集中在低频区, 根据量化表进行量化, 量化的结果保留了低频部分的系数, 去掉了高频部分的系数。量化后的系数按Zigzag 扫描重新组织, 然后进行哈夫曼编码。JPEG 的特点如下:

优点: 1) 形成了国际标准; 2) 具有中端和高端比特率上的良好图像质量。 缺点: 1) 由于对图像进行分块, 在高压缩比时产生严重的方块效应; 2) 系数进行量化, 是有损压缩;3) 压缩比不高, 小于50。

JPEG 压缩图像出现方块效应的原因是: 一般情况下图像信号是高度非平稳的, 很难用Gauss 过程来刻画, 并且图像中的一些突变结构例如边缘信息远比图像平稳性重要, 用余弦基作图像信号的非线性逼近其结果不是最优的。

1.2、JPEG 压缩的研究状况及其前景

针对 JPEG 在高压缩比情况下产生方块效应, 解压图像较差, 近年提出了不少改进方法, 最有效的是下面两种:

(1) DCT 零树编码:DCT 零树编码把DCT 块中的系数组成log2N 个子带, 然后用零树编码 方案进行编码。在相同压缩比的情况下, 其PSNR 的值比 EZW 高。但在高压缩比的情况下, 方块效应仍是DCT 零树编码的致命弱点。 (2) 层式 DCT 零树编码:此算法对图像作的 DCT 变换, 将低频块集中起来, 做反 DCT 变换; 对新得到的图像做相同变换, 如此下去, 直到满足 要求为止。然后对层式 DCT 变换及零树排列过的系数进行零树编码。

JPEG 压缩的一个最大问题就是在高压缩比时产生严重的方块效应, 因此在

今后的研究中, 应重点解决DCT 变换产生的方块效应, 同时考虑与人眼视觉特性相结合进行压缩。

2、 JEPG2000 压缩

JPEG2000 是 由 ISO/IEC JTCISC29 标准化小组负责制定的全新静止图像压缩标准。一个最大改进是它采用小波变换代 替了余弦变换。2000 年 3 月的东京会议, 确定了彩色静态图像的新一代编码方式—JPEG2000 图像压缩标准的编码算法。

2.1、JPEG2000 压缩原理及特点

编码过程主要分为以下几个过程:预处理、核心处理和位流组织。预处理部分包括对图像分片、直流电平(DC )位移和分量变换。 核心处理部分由离散小波变换、量化和熵编码组成。 位流组织部分则包括区域划分、码块、层和包的组织。JPEG2000 格式的图像压缩比可在现在的 JPEG 基础上再提高10%~30%,而且压缩后的图像显得更加细腻平滑。对于目前的 JPEG标准,在同一个压缩码流中不能同时提供有损和无损压缩, 而在JPEG2000 系统中,通过选择参数,能够对图像进行有损和无损压缩 。现在网络上的 JPEG 图像下载时是按“块”传输的,而 JPEG2000 格式的图像支持渐进传输,这使用户不必接收整个图像的压缩码流。 由于 JPEG2000 采用小波技术,可随机获取某些感兴趣的图像区域(ROI )的

压缩码流,对压缩的图像数据进行传输、滤波等操作。

图 1 JPEG2000 压缩编码与解压缩的总体流程

2.2、JPEG2000 压缩的前景

JPEG2000 标准适用于各种图像的压缩编码。其应用领域将包括Internet 、遥感、移动通信、医疗、数字图书馆和电子商务等。 JPEG2000图像压缩标准将成为21世纪的主流静态图像压缩标准。

3、 小波变换图像压缩

3.1、小波变换图像压缩原理

小波变换用于图像编码的基本思想就是把图像根据 Mal- lat 塔式快速小波变换算法进行多分辨率分解。其具体过程为: 首先对图像进行多级小波分解, 然后对每层的小波系数进行量化, 再对量化后的系数进行编码。小波图像压缩是当前图像压 缩的热点之一, 已经形成了基于小波变换的国际压缩标准,

3.2、小波变换图像压缩的发展现状及前景

目前三个最高等级的小波图像编码是嵌入式小波零树图像编码(EZW),分层树中分配样本图像编码(SPIHT)和可扩展图像压缩编码(EBCOT)。

(1) EZW 编码器

1993 年, Shapiro 引入了小波“零树”的概念, 通过定义 POS、NEG 、IZ 和 ZTR 四种符号进行空间小波树递归编码, 有效地剔除了对高频系数的编码, 极大地提高了小波系数的编码效率。此算法采用渐进式量化和嵌入式编码模式, 算法复杂度低。EZW 算法打破了信息处理领域长期笃信的准则: 高效的压缩编码器必须通过高复杂度的算法才能获得, 因此EZW 编码器在数据压缩史上具有里程碑意义。

(2) SPIHT 编码器

由Said 和Pearlman 提出的分层小波树集合分割算法则利用空间树分层分割方法, 有效地减小了比特面上编码符号集的规模。同EZW 相比,SPIH 算法构造了两种不同类型的空间零树, 更好地利用了小波系数的幅值衰减规律。同 EZW编码器一样, SPIHT 编码器的算法复杂度低, 产生的 也是嵌入式比特流, 但编码器的性能较 EZW 有很大的提高。

(3) EBCOT 编码器

优化截断点的嵌入块编码方法(EBCOT) 首先将小波分解 的每个子带分成一个个相对独立的码块, 然后使用优化的分层 截断算法对这些码块进行编码, 产生压缩码流, 结果图像的压缩码流不仅具有 SNR 可扩展而且具有分辨率可扩展, 还可以支持图像的随机存储。比较而言,EBCOT 算法的复杂度较 EZW 和 SPIHT 有所提高, 其压缩性能比 SPIHT 略有提高。

小波图像压缩被认为是当前最有发展前途的图像压缩算法之一。小波图像压缩的研究集中 在对小波系数的编码问题上。在以后的工作中, 应充分考虑人眼视觉特性, 进一步提高压缩比, 改善图像质量。并且考虑将小波变换与其他压缩 方法相结合。例如与分形图像压缩相结合是当前的一个研究热点。

4、 分形图像压缩

1988 年, Barnsley 通过实验证明分形图像压缩可以得到比 经典图像编码技术高几个数量级的压缩比。1990 年, Barnsley 的学生 A.E.Jacquin 提出局部迭代函数系统理论后, 使分形用于图像压缩在计算机上自动实现成为可能。

4.1、分形图像压缩的原理

分形压缩主要利用自相似的特点, 通过迭代函数系统实现。其理论基础是迭代函数系统定理和拼贴定理。

分形图像压缩把原始图像分割成若干个子图像, 然后每一个子图像对应一个迭代函数, 子图像以迭代函数存储, 迭代函数越简单, 压缩比也就越大。同样解码时只要调出每一个子图像对应的迭代函数反复迭代, 就可以恢复出原来的子图像, 从而得到原始图像。随着分形图像压缩技术的发展, 越来越多的算法被提出, 基于分形的不同特征, 可分成以下几种主要的编码方法。

(1) 尺码编码方法

尺码编码方法是基于分形几何中利用小尺度度量不规则 曲线长度的方法, 类似于传统的亚取样和内插方法, 其主要不 同之处在于尺度编码方法中引入了分形的思想, 尺度随着图像 各个组成部分复杂性的不同而改变。

(2) 迭代函数系统方法

迭代函数系统方法是目前研究最多、应用最广泛的一种分 形压缩技术, 它是一种人机交互的拼贴技术, 它基于自然界图 像中普遍存在的整体和局部自相关的特点, 寻找这种自相关映 射关系的表达式, 即仿射变换, 并通过存储比原图像数据量小 的仿射系数, 来达到压缩的目的。如果寻得的仿射变换简单而

有效, 那么迭代函数系统就可以达到极高的压缩比。

(3) A- E- Jacquin 的分形方案

A- E- Jacquin 的分形方案是一种全自动的基于块的分形图像压缩方案, 它也是一个寻找映射关系的过程, 但寻找的对象域是将图像分割成块之后的局部与局部的关系。在此方案中 还有一部分冗余度可以去除, 而且其解码图像中存在着明显的方块效应。

4.2、分形图像压缩的前景

虽然分形图像压缩在图像压缩领域还不占主导地位, 但是分形图像压缩既考虑局部与局部, 又考虑局部与整体的相关 性, 适合于自相似或自仿射的图像压缩, 而自然界中存在大量 的自相似或自仿射的几何形状, 因此它的适用范围很广。

六、 总结:

图像压缩技术已经发展了好几十年了,技术已经得到很大的提升,虽然目前热门的几种压缩方法能够取得很好的压缩效果,帮助了目前日渐紧张的资源。但随着科技进一步的发展与人们需求的更新,压缩技术也需要进一步的跟进发展。每种算法都有它的优点和局限性,压缩技术今后的发展就是要取长补短的集中优点和突破每种算法的局限性。总之, 图像压缩是一个非常有发展前途的研究领域, 这一领域的突破对于我们的信息生活和通信事业的发展具有深远的影响。

七、 计算机图像处理上课心得

当初选这门课的时候我的初衷是想学习一些图像处理软件使用和图像处理方法,但老师所授尽是图像处理的原理和本质,刚开始心中很是后悔,后悔选这门课。前不久我打开我电脑上早就装了但一直没用的图像处理软件,突然发很多以前不懂的名词现在懂了,还发现了许多以前没有发现的功能。至此,我才平去心中悔意,知道了图像处理的原理和本质我可以去自己学习使用任何的图像处理软件。

参考文献:

[1]田青,图像压缩技术. 警察技术,2002,(1): 30- 31

[2]张海燕, 王东木, 等. 图像压缩技术. 系统仿真学报,2002,14(7):831- 835

[3]朱雪芳. 计算机图像处理导论. 科学技术文献出版社,

[4]章毓晋. 图像工程(上册)——图像处理和分析[M].清华大学出版社

[5] 杨小军.LZW 压缩算法解析及应用设计

计算机图像处理

姓名:李 晓 通

学号:10360217

班级:10级信管2班

联系方式:[1**********]

目录

一、图像处理的基本概念„„„„„„„„„„„„„„„„„„„ 3

二、数字图像压缩编码技术的产生及发展过程„„„„„„„„„„ 3

三、图像数据压缩原理„„„„„„„„„„„„„„„„„„„„ 4

四、几种常见的图像压缩编码技术„„„„„„„„„„„„„„„ 5

1、行程长度编码(RLE )„„„„„„„„„„„„„„„„„ 6

2、LZW 编码 „„„„„„„„„„„„„„„„„„„„„„ 6

3、霍夫曼编码 „„„„„„„„„„„„„„„„„„„„„ 6

4、预测及内插编码„„„„„„„„„„„„„„„„„„„„ 7

5、矢量量化编码„„„„„„„„„„„„„„„„„„„„„ 7

6、变换编码„„„„„„„„„„„„„„„„„„„„„„„ 7

7、模型法编码„„„„„„„„„„„„„„„„„„„„„„ 8

8、小波变换编码„„„„„„„„„„„„„„„„„„„„„ 8

五、几种重要的和常用的图像压缩算法„„„„„„„„„„„„„ 9

1、JPEG 压缩„„„„„„„„„„„„„„„„„„„„„„ 9

2、JEPG2000 压缩„„„„„„„„„„„„„„„„„„„„ 10

3、小波变换图像压缩„„„„„„„„„„„„„„„„„„„11

4、分形图像压缩„„„„„„„„„„„„„„„„„„„„„11

六、总结:„„„„„„„„„„„„„„„„„„„„„„„„„12

七、计算机图像处理上课心得„„„„„„„„„„„„„„„„„12

浅析数字图像压缩编码技术

引言:随着计算机技术和网络技术的迅速发展,图像、声音等多媒体信息的记录、存储、传输已经数字化,庞大的数据量给存储和传输带来了一定的困难,数字图像的压缩已成为解决该问题的关键技术。数字图像压缩技术对于数字图像信息在网络上实现快速传输和实时处理具有重要的意义。

一、 图像处理基本概念

图像:凡是纪录在纸上的,拍摄在照片上的,显示在屏幕上的所有具有视觉效果的画面都可以称为图像。

数字图像:用数字形式存储图像上各点的灰度信息,像素是其最小的单位。 像素:在计算机中,图像被分割成下图所示的像素(Pixel ),各像素的灰度值用整数表示。

数字图像处理(Digital Image Processing) :又称为计算机图像处理,是指将图像信息转换成数字电信号并利用计算机或其他高速、大规模集成数字硬件对其进行某些数字运算或处理,以期提高图像质量或达到人们要求的某些预期的结果。

二、 数字图像压缩编码技术的产生及发展过程

任意形状可视对象编码随着多媒体技术和通讯技术的不断发展, 多媒体娱乐、信息高速公路等不断对信息数据的存储和传输提出了更高的要求, 也给现有的有限带宽以严峻的考验, 特别是具有庞大数据量的数字图像通信, 更难以传输和存储, 极大地制约了图像通信的发展, 因此图像压缩技术受到了越来越多的关注。图像压缩的目的就是把原来较大的图像用尽量少的字节表示和传输, 并且要求复原图像有较好的质量。利用图像压缩, 可以减轻图 像存储和传输的负担, 使图像在网络上实现快速传输和实时处理。

图像压缩编码技术可以追溯到1948年提出的电视信号数字化,到今天已经有50年的历史了。五十年代和六十年代的图像压缩技术由于受到电路技术等的制约,仅仅停留在预测编码、亚采样以及内插复原等技术的研究,还很不成熟。1969年在美国召开的第一届" 图像编码会议" 标志着图像编码作为一门独立的学科诞生了。到了70年代和80年代,图像压缩技术的主要成果体现在变换编码技术上,矢量量化编码技术也有较大发展,有关于图像编码技术的科技成果和科技论文与日俱增,图像编码技术开始走向繁荣。自80年代后期以后,由于小波变换理论,分形理论,人工神经网络理论,视觉仿真理论的建立人们开始突破传统的信源编码理论,例如不再假设图像是平稳的随机场。图像压缩编码向着更高的压缩比和更好的压缩质量的道路前进,进入了一个崭新的、欣欣向荣的大发展时期。其中分形图 像压缩和小波图像压缩是当前研究的热点。

近年来,图像编码技术的进展主要表现在以下三个方面:(1)图像压缩国际标准的制定工作进展迅速。如ISO 组织制定的用于静止图像压缩的JPEG 标准,用于活动图像压缩的MPEG-1. MPEG-2和MPEG-4标准以及ITU-T 组织制定的H.261和H.263建议等。(2)由于VLSL 技术的迅猛发展,促进了高速、高性能数字图像压缩处理芯片的开发。(3)许多学者结合模式识别、计算机视觉、计算机图形学、神经网络理论、小波变换以及分形理论等,开始探索图像编码的新途径。同时,人的视觉生理特性的研究成果也开拓了人们的视野。新的图像编码技术不断涌现,如“第二代”图像编码方法、模型荃编码、小波变换编码、分形编码以及神经网络方法等,简述如下。

(1)“第二代”图像编码

“第 一 代 ”图像编码是以信息论和数字信号处理技术为理论基础,昌在去除图像数据中的线性相关性的一类编码技术. 这类技术去除客观和视觉的冗余信息的能力已经接近极限; 而“第二代”图像变码技术是指不局限于Shannon 信息论的框架,要求充分利用人的视觉生理心理特性和图像信源的各种特性,以获得较高的压缩比的编码技术。“第二代”图像编码有基于方向性的图像编码技术和基于区域分割与合并的图像编码技术两类。

(2) 模型基图像编码

模型基图像编码是一种基于景物三维模型的方法。其中通信双方有一个相同的景物三维模型. 基于这个模型,在编码器中用图像分析提取景物参数. 如形状参数、运动参数等. 这些参数被编码后通过信道传送到接收端,山后者的解码器根据收到的参数用图像合成技术再重建图像。模型基图像编码方案大致可分为两类:第一类是基于景物的模型荃图像编码,其中的景物的三维模型是己知的,称为“语义基“(Semantix-based ) 图像编码; 第二类是针对未知物体的模型基编码,称为“物体基”(Object-based)图像编码。

(3)小波变换编码技术

小波变换编码技术是在上世纪80年代发展起来的,它是以局部化函数所形成的相似函数作为基底而展开的。同付里叶变换相比,小波变换在频域的分析梢度稍差一些,但在时域的分析能力上要好一些,而且可以对时间和频城词~月时进行分解。传统 的 D CT变换主要适合压缩那些带宽较窄的图像。这类图像进行DCT 变换后,系数矩阵中非0值分布在很有限的局部区域,因此会取得较好的压缩效果。当信号带宽较宽时,经DCT 变换后的非0值分布在相当大的区域内,这时的编码效率低。而小波变换是一种频率上自由的变换,当带宽较宽时,它可以通过放大的方式使描述能够满足精度的需要。小波变换弥补了DC 丁变换不适合于带宽较宽的信号进行压缩的不足,是一种不受带宽限制的图像压缩方法。

三、 图像数据压缩原理

由于图像数据之间存在一定的相关性就好比一幅图像中各个像素之间存在一定的相关性一样。在活动的图像中,像视频中每相邻两幅图像质检单时间间隔非常短,所以两幅图像中包含大量相关信息。这些相关信息就是图像信息中的冗余。由于图像数据之间存在着一定的冗余,所以使得数据的压缩成为可能。压缩的目的就是在不影响图像视觉效果的前提下尽可能多的去除图像信息中的大量冗余。

1、图像冗余

(1)空间冗余:像素之间的相关性;

(2)时间冗余:活动图像的两个连续帧之间的冗余;

(3)信息熵冗余:单位信息量大于它的熵的值;

(4)结构冗余:图像的区域上存在非常强的纹理结构;

(5)知识冗余:由先验知识得到的规律结构,如人的头像;

(6)视觉冗余:人眼的视觉特性限制,人眼不能完全察觉到图像画面的所有细小的变化,某些图像的失真是人眼不易察觉的;

2、压缩原理

数字图像的相关性:将相邻像素点、相邻数据帧、相邻图像之间的相关性信息去除或减少图像信息中的冗余度,这样就实现了数字图像的压缩。

人的视觉心里特征:利用人的视觉对于边缘急剧变化不敏感,对颜色分辨力弱等特性可以在相应部分适当的降低编码精度从而达到不改变图像的视觉感官的情况下对图像进行了压缩。

信息论的创始人Shannon 提出把数据看作是信息和冗余度(redundancy)的组合。冗余数据有:编码冗余、像素间冗余、心理视觉冗余三种。

对数字图像进行压缩通常利用两个基本原理:

(1) 数字图像的相关性。在图像的同一行相邻像素之间、活动图像的相邻帧的对应像素之间往往存在很强的相关性,去除或减少这些相关性,也就去除或减少图像信息中的冗余度,即实现了对数字图像的压缩。

(2) 人类视觉系统也造成了某种程度的心理视觉冗余度。人的视觉对于边缘急剧变化不敏感(视觉掩盖效应) ,对颜色分辨力弱,利用这些特征可以在相应部分适当降低编码精度,而使人从视觉上并不感觉到图像质量的下降,从而达到对数字图像压缩的目的。从理论的角度来看,应针对图像数据中的冗余信息获得尽可能高的压缩度。

3、图像压缩系统

典型的图像压缩系统主要由3部分组成:变换部分(Transformer)、量化部分(Quatizer)和编码部分(Coder)。

(1) 变换部分 他体现了输入原始图像和经过变换的图像之间的一一对应关系。变换也称为去除相关,他减少了图像中的冗余信息,与输入原始图像数据相比,变换后的图像数据提供了一种更易于压缩的图像数据表示形式。

(2) 量化部分 量化部分把经过变换的图像数据作为输入进行处理后,会得到有限数目的一些符号。一般而言,这一步会带来信息的损失,而这也恰是有损压缩方法和无损压缩方法之间主要的区别。在无损压缩方法中,这一步骤并不存在,这是一个不可逆的过程,原因就在于这是多到一映射,存在有2种量化类型:标量量化与矢量量化,前者是在一个象素、一个象素的基础上量化,而后者对象素向量进行量化。

(3) 编码部分 这是压缩过程中最后一个步骤。这个部分将经过变换的系数编码为二进制位流,这个部分可以采用固定长编码,或变动长度编码,前者对所有符号赋予等长的编码,而后者则对出现频率较高的符号分,变动长度编码也叫熵编码,他能把经过变换得到的图像系数数据以较短的信息总长度来表示,因而在实际应用中,多采用此类编码方式,得到的图像系数数据可以用一个离散随机过程S 来表示。

四、 几种常见的图像压缩编码技术

数字图像压缩技术可以分为无损压缩技术和有损压缩技术。图像无损压缩技术主要有:位平面编码、无损预测编码(DPCM )以及有损编码与残差无损编码的

组合编码技术。传统的数字图像有损压缩技术主要有预测(PCM、DPCM) 、方块化、向量量化VQ 、层次化、子频带和变换等。近年来,人们又提出了神经网络法、几何模型化、分形和小波变换等编码技术。通常认为,JBIG 、JPEG 、MEPG-1、MPEG-2、MEPG-4以及酝酿中MPEG-7图像压缩的国际标准是针对不同应用的最佳压缩算法之一。在这些标准之中成功地采用了以上的一种或多种混合压缩技术。

1、行程长度编码(RLE )

行程长度编码是压缩一个文件最简单的方法之一。 它的做法就是把一系列的重复值(例如图象像素的灰度值)用一个单独的值再加上一个计数值来取代。比如有这样一个字母序列aabbbcccccccc 它的行程长度编码就是2a3b8c 。这种方法实现起来很容易,而且对于具有长重复值的串的压缩编码很有效。很多位图文件格式都用行程长度编码,例如TIFF ,PCX ,GEM 等。

2、LZW 编码

这是三个发明人名字的缩写(Lempel ,Ziv ,Welch ),其原理是将每一个字节的值都要与下一个字节的值配成一个字符对,并为每个字符对设定一个代码。当同样的一个字符对再度出现时,就用代号代替这一字符对,然后再以这个代号与下个字符配对。LZW 编码原理的一个重要特征是,代码不仅仅能取代一串同值的数据,也能够代替一串不同值的数据。在图像数据中若有某些不同值的数据经常重复出现,也能找到一个代号来取代这些数据串。在此方面,LZW 压缩原理是优于RLE 的。

LZW 编码的物理过程:LZW 的编码能有效地利用字符出现的频率冗余度,字符重复性和高使用率模式冗余度。LZW 编码只需扫描一次数据,无需有关输入数据统计量的先验信息而运算时间正比于消息的长度。LZW 算法中,首先建立一个字符串表,把每一个第一次出现的字符串放入串表中,并用一个数字来表示,这个数字与此字符串在串表中的位置有关,并将这个数字存入压缩文件中,如果这个字符串再次出现时,即可用表示它的数字来代替,并将这个数字存入文件中。压缩完成后将串表丢弃。

LZW 算法的实现主要包括编码和解码两部分。

(1)、编码部分

主要是实现对原始文件进行编码压缩,并输出压缩后的文件。根据LZW 压缩算法的原理,LZW 编码器采用了一种贪婪分析算法,每一次分析都要串行地检查来自字符流的字符串,从中分解出已经在词典中出现的最长的短语,输出其相对应的代码,用该短语加上下一个输入字符形成新的扩展字符串,加到字典中。它采用一个串表,用来实现压缩原理。实现采用9-12位的可变长编码,允许压缩算法表示0-4096的数字,所以串表最多可有4096个项。这个串表对不同数据是不一样的,但不需要保留给解压缩程序,因为解压缩过程中能自动建立和压缩过程中相同的串表。

(2)、解码部分

主要是实现对压缩后的文件进行解码还原,无损的还原出原始文件。其实就是编码的逆向过程,要从已经编译好的数据(编码流) 中找出相应的串表,然后对照字典标号集还原数据

3、霍夫曼编码

霍夫曼编码(Huffman encoding)是通过用不固定长度的编码代替原始数据来实现的。霍夫曼编码最初是为了对文本文件进行压缩而建立的,迄今已经有很多变体。它的基本思路是出现频率越高的值,其对应的编码长度越短,反之出现

频率越低的值,其对应的编码长度越长。

霍夫曼编码很少能达到8∶1的压缩比,此外它还有以下两个不足:①它必须精确地统计出原始文件中每个值的出现频率,如果没有这个精确统计,压缩的效果就会大打折扣,甚至根本达不到压缩的效果。霍夫曼编码通常要经过两遍操作,第一遍进行统计,第二遍产生编码,所以编码的过程是比较慢的。另外由于各种长度的编码的译码过程也是比较复杂的,因此解压缩的过程也比较慢。 ②它对于位的增删比较敏感。由于霍夫曼编码的所有位都是合在一起的而不考虑字节分位,因此增加一位或者减少一位都会使译码结果面目全非。

4、预测及内插编码

一般在图象中局部区域的象素是高度相关的,因此可以用先前的象素的有关灰度知识来对当前象素的灰度进行预计,这就是预测。而所谓内插就是根据先前的和后来的象素的灰度知识来推断当前象素的灰度情况。如果预测和内插是正确的,则不必对每一个象素的灰度都进行压缩,而是把预测值与实际象素值之间的差值经过熵编码后发送到接收端。在接收端通过预测值加差值信号来重建原象素。

预测编码可以获得比较高的编码质量,并且实现起来比较简单,因而被广泛地应用于图象压缩编码系统。但是它的压缩比并不高,而且精确的预测有赖于图象特性的大量的先验知识,并且必须作大量的非线性运算,因此一般不单独使用,而是与其它方法结合起来使用。如在JPEG 中,使用了预测编码技术对DCT 直流系数进行编码,而对交流系数则使用量化+游程编码+霍夫曼编码。

5、矢量量化编码

矢量量化编码利用相邻图象数据间的高度相关性,将输入图象数据序列分组,每一组m 个数据构成一个m 维矢量,一起进行编码,即一次量化多个点。根据仙农率失真理论,对于无记忆信源,矢量量化编码总是优于标量量化编码。 编码前,先通过大量样本的训练或学习或自组织特征映射神经网络方法,得到一系列的标准图象模式,每一个图象模式就称为码字或码矢,这些码字或码矢合在一起称为码书,码书实际上就是数据库。输入图象块按照一定的方式形成一个输入矢量。编码时用这个输入矢量与码书中的所有码字计算距离,找到距离最近的码字,即找到最佳匹配图象块。输出其索引(地址)作为编码结果。解码过程与之相反,根据编码结果中的索引从码书中找到索引对应的码字(该码书必须与编码时使用的码书一致),构成解码结果。由此可知,矢量量化编码是有损编码。目前使用较多的矢量量化编码方案主要是随机型矢量量化,包括变换域矢量量化,有限状态矢量量化,地址矢量量化,波形增益矢量量化,分类矢量量化及预测矢量量化等。

6、变换编码

变换编码就是将图象光强矩阵(时域信号)变换到系数空间(频域信号)上进行处理的方法。在空间上具有强相关的信号,反映在频域上是某些特定的区域内能量常常被集中在一起,或者是系数矩阵的分布具有某些规律。我们可以利用这些规律在频域上减少量化比特数,达到压缩的目的。由于正交变换的变换矩阵是可逆的且逆矩阵与转置矩阵相等,这就使解码运算是有解的且运算方便,因此运算矩阵总是选用正交变换来做。

常用的变换编码有K -L 变换编码和DCT 编码。K -L 变换编码在压缩比上优于 DCT 编码,但其运算量大且没有快速算法,因此实际应用中广泛采用DCT 编码。

7、模型法编码

预测编码、矢量量化编码以及变换编码都属于波形编码,其理论基础是信号理 论和信息论;其出发点是将图象信号看作不规则的统计信号,从象素之间的相关性 这一图象信号统计模型出发设计编码器。而模型编码则是利用计算机视觉和计算机 图形学的知识对图象信号的分析与合成。

模型编码将图象信号看作三维世界中的目标和景物投影到二维平面的产物,而 对这一产物的评价是由人类视觉系统的特性决定的。模型编码的关键是对特定的图 象建立模型,并根据这个模型确定图象中景物的特征参数,如运动参数、形状参数 等。解码时则根据参数和已知模型用图象合成技术重建图象。由于编码的对象是特 征参数,而不是原始图象,因此有可能实现比较大的压缩比。模型编码引入的误差 主要是人眼视觉不太敏感的几何失真,因此重建图象非常自然和逼真。

8、小波变换编码

为了继承Fourier 分析的优点,同时又克服它的许多缺点,人们一直在寻找新的方法。小波变换的理论是近年来兴起的新的数学分支,它是继1822年法国人傅立叶提出傅立叶变换之后又一里程碑式的发展,解决了很多傅立叶变换不能解决的困难问题。傅立叶变换虽然已经广泛地应用于信号处理领域,较好地描述了信号的频率特性,取得了很多重要的成果,但傅立叶变换却不能较好地解决突变信号与非平稳信号的问题。小波变换可以被看作是傅立叶变换的发展,即它是空间(时间)和频率的局部变换,能更加有效地提取信号和分析局部信号。 小波变换用于图像编码的基本思想就是把图像进行多分辨率分解,分解成不同空间、不同频率的子图像,然后再对子图像进行系数编码。系数编码是小波变换用于压缩的核心,压缩的实质是对系数的量化压缩。根据S.Mallat 的塔式分解算法,图像经过小波变换后被分割成四个频带:水平、垂直、对角线和低频,低频部分还可以继续分解。

小波变换用于图像数据压缩时需要考虑的几个问题:任何实正交的小波对应的滤波器组都可以实现像的分解与合成,但是并不是任何分解都能满足我们的要求,同一幅图像,用不同的小波基进行分解所得到的压缩效果是不一样的。我们希望经小波分解后,得到的三个方向上的细节分量具有高度的局部相关性,而整体相关性被大部分甚至完全解除。对小波基的选取应考虑以下因素:

(1) 小波基的正则性阶数和图像数据压缩效果的关系。小波变换要求滤波器具有正则性,正则性是函数光滑程度的一种描述,一般情况下,正则性越强,数据压缩效果越好。

(2) 待处理图像与小波基的相似性。

(3) 由于在图像处理中数据量特别大,所以不能片面考虑追求高压缩比,而应该综合考虑压缩效率和复杂程度。由于图像数据压缩中的小波变换通常是由图像信号和滤波器的离散卷积实现,所以滤波器的长度不能太长,否则计算量太大而没有使用价值。

(4) 小波变换的分解层数(变换级数)与图像数据压缩的关系。由于小波及小波包技术可以将信号或图像分层次按小波基展开,所以可以根据图像信号的性质以及事先给定的图像处理要求确定到底要展开到哪一级为止,从而不仅能有效地控制计算量,满足实时处理的需要,而且可以方便地实现通常由子频带、层次编码技术实现的累进传输编码(即采取逐步浮现的方式传送多媒体图像)。

(5) 小波函数的能量集中特性应好。

(6) 小波变换的边界问题。

小波变换继承了Fourier 分析的优点,同时又克服它的许多缺点,所以它在静态和动态图缩领域得到广泛的应用,并且已经成为某些图像压缩国际标准(如MPEG-4)的重要环节。当然像其他变换编码一样,在压缩比特别高的时候,小波变换压缩量化后的重建图像也会产生几何畸变。

小波变换实现图像压缩原理:

小波变换用于图像压缩的基本思想是:对图像进行多分辨率分解, 分解成不同空间、不同频率的子图像, 然后再对子图像系数进行编码。系数编码是小波变换用于图像压缩的核心, 压缩的实质是对系数的量化压缩。图像经过小波变换后生成的小波图像的数据总量与原图像的数据总量相等, 即小波变换本身并不具有压缩功能。之所以将它用于图像压缩, 是因为生成的小波图像具有与原图像不同的特性, 表现在图像的能量主要集中在低频部分, 而水平、垂直和对角线部分的能量则较少;水平、垂直和对角线部分表征了原图像在水平、垂直和对角线部分的边缘信息, 具有明显的方向特性。低频部分称为亮度图像, 水平、垂直和对角线部分称为细节图像。所以一个最简单的压缩方法是利用小波分解, 保留低频部分,将高频部分置0。

五、 几种重要的和常用的图像压缩算法

1、 JPEG 压缩

负责开发静止图像压缩标准的“联合图片专家组”( Joint Photographic Expert Group, 简称 JPEG) , 于 1989 年 1 月形成了 基于自适应 DCT 的 JPEG 技术规范的第一个草案, 其后多次修改, 至1991年形成 ISO10918国际标准草案, 并在一年后成为国际标准, 简称JPEG 标准。

1.1、JPEG 压缩原理及特点

JPEG 算法中首先对图像进行分块处理, 一般分成互不重 叠的大小的块, 再对每一块进行二维离散余弦变换(DCT)。变换后的系数基本不相关, 且系数矩阵的能量集中在低频区, 根据量化表进行量化, 量化的结果保留了低频部分的系数, 去掉了高频部分的系数。量化后的系数按Zigzag 扫描重新组织, 然后进行哈夫曼编码。JPEG 的特点如下:

优点: 1) 形成了国际标准; 2) 具有中端和高端比特率上的良好图像质量。 缺点: 1) 由于对图像进行分块, 在高压缩比时产生严重的方块效应; 2) 系数进行量化, 是有损压缩;3) 压缩比不高, 小于50。

JPEG 压缩图像出现方块效应的原因是: 一般情况下图像信号是高度非平稳的, 很难用Gauss 过程来刻画, 并且图像中的一些突变结构例如边缘信息远比图像平稳性重要, 用余弦基作图像信号的非线性逼近其结果不是最优的。

1.2、JPEG 压缩的研究状况及其前景

针对 JPEG 在高压缩比情况下产生方块效应, 解压图像较差, 近年提出了不少改进方法, 最有效的是下面两种:

(1) DCT 零树编码:DCT 零树编码把DCT 块中的系数组成log2N 个子带, 然后用零树编码 方案进行编码。在相同压缩比的情况下, 其PSNR 的值比 EZW 高。但在高压缩比的情况下, 方块效应仍是DCT 零树编码的致命弱点。 (2) 层式 DCT 零树编码:此算法对图像作的 DCT 变换, 将低频块集中起来, 做反 DCT 变换; 对新得到的图像做相同变换, 如此下去, 直到满足 要求为止。然后对层式 DCT 变换及零树排列过的系数进行零树编码。

JPEG 压缩的一个最大问题就是在高压缩比时产生严重的方块效应, 因此在

今后的研究中, 应重点解决DCT 变换产生的方块效应, 同时考虑与人眼视觉特性相结合进行压缩。

2、 JEPG2000 压缩

JPEG2000 是 由 ISO/IEC JTCISC29 标准化小组负责制定的全新静止图像压缩标准。一个最大改进是它采用小波变换代 替了余弦变换。2000 年 3 月的东京会议, 确定了彩色静态图像的新一代编码方式—JPEG2000 图像压缩标准的编码算法。

2.1、JPEG2000 压缩原理及特点

编码过程主要分为以下几个过程:预处理、核心处理和位流组织。预处理部分包括对图像分片、直流电平(DC )位移和分量变换。 核心处理部分由离散小波变换、量化和熵编码组成。 位流组织部分则包括区域划分、码块、层和包的组织。JPEG2000 格式的图像压缩比可在现在的 JPEG 基础上再提高10%~30%,而且压缩后的图像显得更加细腻平滑。对于目前的 JPEG标准,在同一个压缩码流中不能同时提供有损和无损压缩, 而在JPEG2000 系统中,通过选择参数,能够对图像进行有损和无损压缩 。现在网络上的 JPEG 图像下载时是按“块”传输的,而 JPEG2000 格式的图像支持渐进传输,这使用户不必接收整个图像的压缩码流。 由于 JPEG2000 采用小波技术,可随机获取某些感兴趣的图像区域(ROI )的

压缩码流,对压缩的图像数据进行传输、滤波等操作。

图 1 JPEG2000 压缩编码与解压缩的总体流程

2.2、JPEG2000 压缩的前景

JPEG2000 标准适用于各种图像的压缩编码。其应用领域将包括Internet 、遥感、移动通信、医疗、数字图书馆和电子商务等。 JPEG2000图像压缩标准将成为21世纪的主流静态图像压缩标准。

3、 小波变换图像压缩

3.1、小波变换图像压缩原理

小波变换用于图像编码的基本思想就是把图像根据 Mal- lat 塔式快速小波变换算法进行多分辨率分解。其具体过程为: 首先对图像进行多级小波分解, 然后对每层的小波系数进行量化, 再对量化后的系数进行编码。小波图像压缩是当前图像压 缩的热点之一, 已经形成了基于小波变换的国际压缩标准,

3.2、小波变换图像压缩的发展现状及前景

目前三个最高等级的小波图像编码是嵌入式小波零树图像编码(EZW),分层树中分配样本图像编码(SPIHT)和可扩展图像压缩编码(EBCOT)。

(1) EZW 编码器

1993 年, Shapiro 引入了小波“零树”的概念, 通过定义 POS、NEG 、IZ 和 ZTR 四种符号进行空间小波树递归编码, 有效地剔除了对高频系数的编码, 极大地提高了小波系数的编码效率。此算法采用渐进式量化和嵌入式编码模式, 算法复杂度低。EZW 算法打破了信息处理领域长期笃信的准则: 高效的压缩编码器必须通过高复杂度的算法才能获得, 因此EZW 编码器在数据压缩史上具有里程碑意义。

(2) SPIHT 编码器

由Said 和Pearlman 提出的分层小波树集合分割算法则利用空间树分层分割方法, 有效地减小了比特面上编码符号集的规模。同EZW 相比,SPIH 算法构造了两种不同类型的空间零树, 更好地利用了小波系数的幅值衰减规律。同 EZW编码器一样, SPIHT 编码器的算法复杂度低, 产生的 也是嵌入式比特流, 但编码器的性能较 EZW 有很大的提高。

(3) EBCOT 编码器

优化截断点的嵌入块编码方法(EBCOT) 首先将小波分解 的每个子带分成一个个相对独立的码块, 然后使用优化的分层 截断算法对这些码块进行编码, 产生压缩码流, 结果图像的压缩码流不仅具有 SNR 可扩展而且具有分辨率可扩展, 还可以支持图像的随机存储。比较而言,EBCOT 算法的复杂度较 EZW 和 SPIHT 有所提高, 其压缩性能比 SPIHT 略有提高。

小波图像压缩被认为是当前最有发展前途的图像压缩算法之一。小波图像压缩的研究集中 在对小波系数的编码问题上。在以后的工作中, 应充分考虑人眼视觉特性, 进一步提高压缩比, 改善图像质量。并且考虑将小波变换与其他压缩 方法相结合。例如与分形图像压缩相结合是当前的一个研究热点。

4、 分形图像压缩

1988 年, Barnsley 通过实验证明分形图像压缩可以得到比 经典图像编码技术高几个数量级的压缩比。1990 年, Barnsley 的学生 A.E.Jacquin 提出局部迭代函数系统理论后, 使分形用于图像压缩在计算机上自动实现成为可能。

4.1、分形图像压缩的原理

分形压缩主要利用自相似的特点, 通过迭代函数系统实现。其理论基础是迭代函数系统定理和拼贴定理。

分形图像压缩把原始图像分割成若干个子图像, 然后每一个子图像对应一个迭代函数, 子图像以迭代函数存储, 迭代函数越简单, 压缩比也就越大。同样解码时只要调出每一个子图像对应的迭代函数反复迭代, 就可以恢复出原来的子图像, 从而得到原始图像。随着分形图像压缩技术的发展, 越来越多的算法被提出, 基于分形的不同特征, 可分成以下几种主要的编码方法。

(1) 尺码编码方法

尺码编码方法是基于分形几何中利用小尺度度量不规则 曲线长度的方法, 类似于传统的亚取样和内插方法, 其主要不 同之处在于尺度编码方法中引入了分形的思想, 尺度随着图像 各个组成部分复杂性的不同而改变。

(2) 迭代函数系统方法

迭代函数系统方法是目前研究最多、应用最广泛的一种分 形压缩技术, 它是一种人机交互的拼贴技术, 它基于自然界图 像中普遍存在的整体和局部自相关的特点, 寻找这种自相关映 射关系的表达式, 即仿射变换, 并通过存储比原图像数据量小 的仿射系数, 来达到压缩的目的。如果寻得的仿射变换简单而

有效, 那么迭代函数系统就可以达到极高的压缩比。

(3) A- E- Jacquin 的分形方案

A- E- Jacquin 的分形方案是一种全自动的基于块的分形图像压缩方案, 它也是一个寻找映射关系的过程, 但寻找的对象域是将图像分割成块之后的局部与局部的关系。在此方案中 还有一部分冗余度可以去除, 而且其解码图像中存在着明显的方块效应。

4.2、分形图像压缩的前景

虽然分形图像压缩在图像压缩领域还不占主导地位, 但是分形图像压缩既考虑局部与局部, 又考虑局部与整体的相关 性, 适合于自相似或自仿射的图像压缩, 而自然界中存在大量 的自相似或自仿射的几何形状, 因此它的适用范围很广。

六、 总结:

图像压缩技术已经发展了好几十年了,技术已经得到很大的提升,虽然目前热门的几种压缩方法能够取得很好的压缩效果,帮助了目前日渐紧张的资源。但随着科技进一步的发展与人们需求的更新,压缩技术也需要进一步的跟进发展。每种算法都有它的优点和局限性,压缩技术今后的发展就是要取长补短的集中优点和突破每种算法的局限性。总之, 图像压缩是一个非常有发展前途的研究领域, 这一领域的突破对于我们的信息生活和通信事业的发展具有深远的影响。

七、 计算机图像处理上课心得

当初选这门课的时候我的初衷是想学习一些图像处理软件使用和图像处理方法,但老师所授尽是图像处理的原理和本质,刚开始心中很是后悔,后悔选这门课。前不久我打开我电脑上早就装了但一直没用的图像处理软件,突然发很多以前不懂的名词现在懂了,还发现了许多以前没有发现的功能。至此,我才平去心中悔意,知道了图像处理的原理和本质我可以去自己学习使用任何的图像处理软件。

参考文献:

[1]田青,图像压缩技术. 警察技术,2002,(1): 30- 31

[2]张海燕, 王东木, 等. 图像压缩技术. 系统仿真学报,2002,14(7):831- 835

[3]朱雪芳. 计算机图像处理导论. 科学技术文献出版社,

[4]章毓晋. 图像工程(上册)——图像处理和分析[M].清华大学出版社

[5] 杨小军.LZW 压缩算法解析及应用设计


相关内容

  • 办公自动化设备与应用
  • <办公自动化设备与应用>教学大纲 一.教学目的和要求 通过本课程的教学使学生了解办公自动化在公安业务中的地位和作用:掌握办公自动化软硬件的基本知识.基本原理及典型应用:学会典型办公自动化软硬件的操作使用,加强基本技能训练,培养公安院校学生和基层一线民警对现代办公信息处理工具基本的使用技能 ...

  • 计算机财务管理期末考报表部分题目及答案.
  • 报表模块 单选题 1. 在UFO 报表系统中可以完成的操作不包含______. A .设计报表格式 B .插入图表 C .文档编辑 D .数据计算 答案:C 难易程度:2 章节:报表概述 2. 在U8报表系统中,格式状态与数据状态切换的快捷方式是______. A .Ctrl+G B .Ctrl+D ...

  • 遥感数字图像概述
  • 遥感数字图像概述 遥感数字图像 图像与RS数字图像概念 图像是对客观对象的一种相似性的描述或写真,它包含了被描述或写真对象的信息,是人们最主要的信息源. 可见与不可见图像:单波段图像.多波段和超波段图像:数字图像和模拟图像. RS数字图像指以数字形式表述的RS图像. RS图像的获取 根据RS传感器基 ...

  • 分析化学教材(系列一)
  • 分析化学教材(系列一) 目 录 第一章 绪论 第二章 误差和分析数据处理 第三章 滴定分析法概论 第四章 酸碱滴定法 第五章 配位滴定法 第六章 氧化还原滴定法 第七章 沉淀滴定法和重量分析法 第八章 电位法和永停滴定法 第九章 光谱分析法概论 第十章 紫外可见分光光度法 第十一章 荧光分析法 第十 ...

  • 酒店网络系统设计方案
  • 机房(综合) 酒店 工程系统解决方案 2012年3月12日 目 录 第一章机房工程设计方案概述--------------------------------------------5 1.电视监控及防盗报警系统-----------------------------------------6 2 ...

  • 中级财务会计考试大纲[2]
  • <中级财务会计>课程考试大纲 会计学专业<中级财务会计>课程考试大纲 第一部分 有关说明 (一)考核对象.本课程的考核对象是会计学专业(专升本科)的学生. (二)考核形式.本课程期末考试的形式为闭卷笔试. (三)考核依据.本课程期末考试命题以本考试大纲和东北财经大学出版社出版 ...

  • 注册税务师考试大纲(五个科目全)
  • 2013年注册税务师<税法一>考试大纲 第一章 税法基本原理 一.税法概述 (一)了解税法的概念 (二)了解税法的特点 (三)熟悉税法的原则:税法基本原则.税法适用原则 (四)熟悉税法的效力 (五)掌握税法的解释:立法解释.司法解释.行政解释.字面解释.限制解释与扩充解释 (六)了解税法 ...

  • 3.1信息加工概述
  • 3.1信息加工概述 一. 教材分析 本节内容包含信息加工的过程和方式与计算机信息加工的过程和类型两部分知识.信息加工是整个信息活动的重要环节之一,本节首先从整体上介绍了信息加工的一般过程和方式,再进一步介绍信息技术环境下利用计算机进行信息加工的一般过程和自动化,人性化,智能化的三种形态.计算机信息加 ...

  • 3.1信息加工概述--学案
  • 3.1信息加工概述--学案 一.学习目标 1.了解什么是信息加工及其重要性: 2.知道信息加工的一般过程并能举例说明: 3.掌握信息加工方式的变化并能举例分析: 4.掌握用计算机进行信息加工的一般过程并能举例分析: 5.理解用计算机进行信息加工的类型并能举例说明. 二.重点.难点 教学重点:信息加工 ...

  • 学生宿舍管理系统_需求分析
  • 计算机学院 学生宿舍管理系统 需求规格说明书 目 录 1引言 ....................................................................................................................... ...