文档视界 最新最全的文档下载
当前位置:文档视界 › 图像压缩技术的综述

图像压缩技术的综述

图像压缩技术的综述
图像压缩技术的综述

题目:图像压缩技术的综述

学生姓名:徐欢学号:070110117

系别:计算机与信息学院专业:计算机科学与技术

入学年份:2010年9月

导师姓名:陈蕴谷职称/学位:讲师/硕士研究生

导师所在单位:中国科学院合肥物质研究院

完成时间:2014年4月

1.引言

随着多媒体技术和通讯技术的不断发展,多媒体娱乐、信息高速公路等不断对信息数据的存储和传输提出了更高的要求,也给现有的有限带宽以严峻的考验,特别是具有庞大数据量的数字图像通信,更难以传输和存储,极大地制约了图像通信的发展,因此图像压缩技术受到了越来越多的关注。图像压缩的目的就是把原来较大的图像用尽量少的字节表示和传输,并且要求复原图像有较好的质量。利用图像压缩,可以减轻图像存储和传输的负担,使图像在网络上实现快速传输和实时处理。

图像数据是用来表示图像信息的,如果不同的方法为表示相同的信息使用了不同的数据量,那么使用较多数据量的方法中,有些数据必然代表了无用的信息,或者是重复的表示了其他数据表示的信息,前者成为数据冗余,后者成为不相干信息。图像压缩编码的主要目的,就是通过删除冗余的或者是不相干的信息,以尽可能地的数码率来存储和传输数字图像数据。

图像压缩编码技术可以追溯到1948年提出的电视信号数字化,到今天已经有50多年的历史了。在此期间出现了很多种图像压缩编码方法,特别是到了80年代后期以后,由于小波变换理论,分形理论,人工神经网络理论,视觉仿真理论的建立,图像压缩技术得到了前所未有的发展,其中分形图像压缩和小波图像压缩是当前研究的热点。本文对当前最为广泛使用的图像压缩算法进行综述,讨论了它们的优缺点以及发展前景。

图像编码基础

图像编码压缩是指在满足一定图像质量的条件下,用尽可能少的数据量来表示图像。编码技术比较系统的研究始于Shannon信息论,从此理论出发可以得到数据压缩的两种基本途径。一种是联合信源的冗余度也寓于信源间的相关性之

中,去除他们之间的相关性,使之成为或基本成为不相干信源,如预测编码,变换域编码,混合编码等,但也都受信息熵的约束。总体上可以概括为熵编码,预测编码,变换编码,也成为三大经典编码方法。另一种是设法改变信源的概率分布,使其尽可能地非均匀,再用最佳编码方法使码长逼近信源熵。使用此途径的压缩方法其效率一般以其熵为上界,压缩比饱和于10:1,如Huffman编码,算术编码,行程编码等。

随着人们对传统压缩编码方法的深入研究和应用,逐渐发现了这些传统方法的许多缺点。如高压缩比时回复图像会出现方块效应,人眼视觉系统(HVS)的特性不易被引入到算法中等。为了克服这些缺点,1985年M.Kunl等人提出了第二代图像压缩编码的概念。经过近20年的发展,在这一框架下,人们踢出了鸡枞新的编码方法:分形编码,小波变换编码和基于模型的编码方法等。于是,对数据压缩技术的研究就突破了传统Shannon理论的框架,使得压缩效率得以极大提高。

图像编码基本原理

数字图像的冗余主要表现为以下几种形式:空间冗余,时间冗余,信息熵冗余,结构冗余和知识冗余。图像数据的这些冗余信息为图像压缩编码提供了依据。图像编码的目的就是充分利用图像中存在的各种冗余信息,特别是空间冗余,时间冗余以及视觉冗余,以尽量少的比特数来表示图像。利用各种冗余信息,压缩编码技术能够很好地解决在将模拟信号转换为数字信号后所产生的带宽需求增加的问题,它是使数字信号走上实用化的关键技术之一,虽然表示图像需要大量的数据,但是图像数据是高度相关的,或者说存在冗余信息,去掉这些信息后可以有效压缩图像,同时不会损害图像的有效信息。

2.常用的编码方法及其分类

图像压缩分为无损压缩和有损压缩,有损压缩分为预测编码,变换编码,混合编码,有损编码分为:JPEG,MPEG,P*64,无损编码分为:Lempd Zew,Huffman 编码,行程编码,算数编码。

目前常用的数字图像压缩编码方法可分为两大类:一是冗余压缩发,也称为无损压缩发;另一无损压缩的算法删除的仅仅是冗余的信息,因此可以在解压缩时精确的恢复原图像。有损压缩的算法把不相干的信息也删除了,解压缩时只能对图像进行类似的重构,而不能精确的复原,所i有损压缩算法可以达到更高的压缩比。

对于多数图像来说,为了达到更高的压缩比,保真度的轻微损失是可以接受的;有些图像不允许进行任何修改,只能对他们进行无损压缩。无损压缩利用数据的统计特性进行数据压缩,其压缩率一般为2:1至5:1。有损压缩不能完全恢复数据,而是利用人的视觉特性(人的眼睛好比是一个“积分器”)使解压缩后的图像看起来与原始图像一样。压缩比随编码方法的不同差别较大。

2.1 预测编码

在图像中,相邻像素通常在灰度上存在较大的相关性,因此,图像中某一像素的灰度可以用邻近的若干个像素灰度来估计。只对实际值和预测值的差进行编码和传输。因为预测编码是根据信号的一些已知情况,预测信号可能发生的情况,所以预测时有误差,如果预测比较准确,误差就较小,预测编码就能达到压缩数据的目的。典型预测编码的压缩算法有:DPM(差分脉冲调制)和ADPCM(自适应差分脉冲调制)。

2.2 Huffman 编码

无失真编码方法中,Huffman 编码是一种较有效的编码方法。Huffman 编码是一种长度不均匀的,平均码率可以接近信息熵值的一种编码。他的编码思想是:对于出现概率较大的信息,采用字短的码,对于出现概率低的信息采用字长的码,以达到缩短平均码长,从而实现数据的压缩。Huffman 编码小变字长编码方法是最佳的,其码字平均长度很接近信息符号的熵值。Huffman 编码的最高压缩效率可达到8:1.

2.3 行程编码

在一个逐行存储的图像中,具有相同灰度值的一些像素组成的序列称为一个行列。在编码时,对于每个行程只存储一个灰度值的码,再紧跟着存储这个行程码的长度。这种按照形成进行的编码被称为行程编码。

行程编码是相对简单的一种编码,是指一行扫描的像素中,比较相邻像素的幅度(如:亮度),当幅度有一显著变化时,就说有一行程存在。随终点位置标记方法不同,行程编码可分为“行程终点编码”和“行程长度编码”。行程编码对于仅包含很少几个灰度级的图像,特别像二值图像,比较有效。 2.4 变换编码

变换编码的原理框图如图所示,在发送端,原始图像被分成若干个相同大小的子图像,对每个子图像做变换,采用“区域采样”的方法,只取变换系数中幅度较大的元素,即变换结果阵列中的一些主要阵元进行编码,然后进行传输,而把其他幅度较小的大部分变化系数当作零,不予编码。在接收端,解码器将收到的信号进行解码,以零补足所有未被传输的阵元,然后对每个子阵进行相应的反变换,将每个反变换阵列拼起来便得到重建图像。

只取变换阵列中的一些主要阵元进行编码和传输,本身就已经达到了一定程度的数据压缩效果,在辅以非线性量化,可以进一步压缩数据率。DCT 变换,傅里叶变换和HARR 变换等。

2.5 矢量量化压缩方法

前面说的预测编码,变换编码等都属于标量量化,即先将图像经某种映射变换变成一个数的序列,然后一个数一个数地进行量化编码。矢量量化(简称VQ )在近几年发展很快,它与标量量化方法不同,他把图像数据分成很多组,每组看成为一个矢量,然后逐个矢量进行量化编码。在VQ 算法中,图像中的各种相关信息(如:各像素点见,各块之间以及相邻编码地址间等)可通过有效的码书设计得以充分地去除,矢量量化是限失真压缩编码方法,压缩比可达到40:1。

2.6 统计编码

统计编码是根据消息出现的概率分布特性而进行的压缩编码。其宗旨在于:在消息和编码之间找到明确的一一对应关系,以便在回复是能准确无误地再现出f (m,n )

变换 F(u,v) 样本选择 量化编码器 增值 解

F (u,v ) 迭变 f(m,n)

来,使平均码长或码率压低到最低限度。其中常用的有:Huaffman码,ShannonFano码,算数编码等,。行程编码就是其中一种典型的统计编码,他首先计算信源符号出现的行程长度,然后将行程长度转换成代码。这种方法0,1成片出现的数据压缩。

2.7 混合编码

混合编码对信源数据同时使用两种或者两种以上的编码方法,能大大提高数据压缩的效率。静态图像压缩标准JPEG就是一种典型的混和编码的压缩标准。

2.8 JPEG编码

JPEG是联合图像专家组的缩写名称。JPEG致力于研制彩色的和单色的,夺回度连续色调的静态图像的数字图像压缩的通用国际标准。JPEG算法中首先对图像进行分块处理,一般分成互不重叠的大小的块,再对每一块进行二维离散余弦变换(DCT)。变换后的系数基本不相关,且系数矩阵的能量集中在低频区,根据量化表进行量化,量化的结果保留了低频部分的系数,去掉了高频部分的系数。量化后的系数按zigzag扫描重新组织,然后进行哈夫曼编码。JPEG的特点优点:(1)形成了国际标准;

(2)具有中端和高端比特率上的良好图像质量。

缺点:(1)由于对图像进行分块,在高压缩比时产生严重的方块效应;

(2)系数进行量化,是有损压缩;

(3)压缩比不高,小于50。

JPEG压缩图像出现方块效应的原因是:一般情况下图像信号是高度非平稳的,很难用Gauss过程来刻画,并且图像中的一些突变结构例如边缘信息远比图像平稳性重要,用余弦基作图像信号的非线性逼近其结果不是最优的。

(1)DCT零树编码

DCT零树编码把 DCT块中的系数组成log2N个子带,然后用零树编码方案进行编码。在相同压缩比的情况下,其PSNR的值比 EZW高。但在高压缩比的情况下,方块效应仍是DCT零树编码的致命弱点。

(2)层式DCT零树编码

此算法对图像作的DCT变换,将低频块集中起来,做反DCT变换;对新得到的图像做相同变换,如此下去,直到满足要求为止。然后对层式DCT变换及零树排列过的系数进行零树编码。

JPEG压缩的一个最大问题就是在高压缩比时产生严重的方块效应,因此在今后的研究中,应重点解决 DCT变换产生的方块效应,同时考虑与人眼视觉特性相结合进行压缩。

基于DCT的JPEG标准的压缩是有失真的,DCT变换后系数的量化是引起失真的主要原因。压缩效果与图像内容本身有较大的关系。

2.9 JEPG2000压缩

JPEG2000是由ISO/IEC JTCISC29标准化小组负责制定的全新静止图像压缩标准。一个最大改进是它采用小波变换代替了余弦变换。2000年3月的东京会议,确定了彩色静态图像的新一代编码方式—JPEG2000图像压缩标准的编码算法。

JPEG2000压缩编码过程主要分为以下几个过程:预处理、核心处理和位流组织。预处理部分包括对图像分片、直流电平(DC)位移和分量变换。核心处理部分由离散小波变换、量化和熵编码组成。位流组织部分则包括区域划分、码块、层和包的组织。

JPEG2000格式的图像压缩比,可在现在的JPEG基础上再提高10%~30%,而且压缩后的图像显得更加细腻平滑。对于目前的JPEG标准,在同一个压缩码流中不能同时提供有损和无损压缩,而在JPEG2000系统中,通过选择参数,能够对图像进行有损和无损压缩。现在网络上的JPEG图像下载时是按“块”传输的,而JPEG2000格式的图像支持渐进传输,这使用户不必接收整个图像的压缩码流。由于JPEG2000采用小波技术,可随机获取某些感兴趣的图像区域(ROI)的压缩码流,对压缩的图像数据进行传输、滤波等操作。

3 数据压缩新技术

分形图像编码是在分形几何理论的基础上发展起来的一种编码方法,分形几何是欧氏几何理论的扩展,他描述了自然界物体的自相似性,这种自相似性可以引入迭代函数来刻画,并将其用于图像编码。

基于分型的压缩方法分形(fractal)的应用十分广泛,与多媒体领域相关的应用的不规则几何造型,图像处理等方面。

小波变换在图像压缩中的应用也取得了很大的进展,小波(wevelet)分解编码本质上是一种变换编码技术。简单地说,小波变换就是将原图像信号分解成不同的频率区域,对不同的频率区域采用不同的压缩编码手段,从而使数据量减少。这种犯法非常适合满足视觉要求的图像压缩编码方法,并且压缩比可以达到100左右。目前3个最高等级的小波图像编码分别是嵌入式小波零树图像编码(EZW),分层树中分配样本图像编码(SPIHT)和可扩展图像压缩编码(EBCOT)。(1)EZW编码器

1993年,Shapiro引入了小波“零树”的概念,通过定义POS、NEG、IZ 和ZTR四种符号进行空间小波树递归编码,有效地剔除了对高频系数的编码,极大地提高了小波系数的编码效率。此算法采用渐进式量化和嵌入式编码模式,算法复杂度低。EZW算法打破了信息处理领域长期笃信的准则:高效的压缩编码器必须通过高复杂度的算法才能获得,因此EZW编码器在数据压缩史上具有里程碑意义。

(2)SPIHT编码器

由Said和Pearlman提出的分层小波树集合分割算法(SPIHT)则利用空间树分层分割方法,有效地减小了比特面上编码符号集的规模。同EZW相比,SPIHT 算法构造了两种不同类型的空间零树,更好地利用了小波系数的幅值衰减规律。同EZW编码器一样,SPIHT编码器的算法复杂度低,产生的也是嵌入式比特流,但编码器的性能较EZW有很大的提高。

(3)EBCOT编码器

优化截断点的嵌入块编码方法(EBCOT)首先将小波分解的每个子带分成一个个相对独立的码块,然后使用优化的分层截断算法对这些码块进行编码,产生压缩码流,结果图像的压缩码流不仅具有SNR可扩展而且具有分辨率可扩展,还可以支持图像的随机存储。比较而言,EBCOT算法的复杂度较EZW和SPIHT有所提高,其压缩性能比SPIHT略有提高。

小波图像压缩被认为是当前最有发展前途的图像压缩算法之一。小波图像压缩的研究集中在对小波系数的编码问题上。在以后的工作中,应充分考虑人眼视觉特性,进一步提高压缩比,改善图像质量。并且考虑将小波变换与其他压缩方法相结合。例如与分形图像压缩相结合是当前的一个研究热点。

同傅里叶变换相比,小波变换在频率的精度上差一些,在时间的分析能力上好一些,而且对时间和频率可以同时分解,这就是傅里叶变换无法做到的。

4、其它压缩算法

除了以上几种常用的图像压缩方法以外,还有:NNT(数论变换)压缩、基于神经网络的压缩方法、Hibert扫描图像压缩方法、自适应多相子带压缩方法等,在此不作赘述。下面简单介绍近年来任意形状纹理编码的几种算法[10]~ [13]。

(1)形状自适应DCT(SA-DCT)算法

SA-DCT把一个任意形状可视对象分成的图像块,对每块进行DCT变换,它实现了一个类似于形状自适应Gilge DCT[10][11]变换的有效变换,但它比Gilge DCT变换的复杂度要低。可是,SA-DCT也有缺点,它把像素推到与矩形边框的一个侧边相平齐,因此一些空域相关性可能丢失,这样再进行列DCT变换,就有较大的失真了[11][14][15]。

(2)Egger方法

Egger等人[16][17]提出了一个应用于任意形状对象的小波变换方案。在此方案中,首先将可视对象的行像素推到与边界框的右边界相平齐的位置,然后对每行的有用像素进行小波变换,接下来再进行另一方向的小波变换。此方案,充分利用了小波变换的局域特性。然而这一方案也有它的问题,例如可能引起重要的高频部分同边界部分合并,不能保证分布系数彼此之间有正确的相同相位,以及可能引起第二个方向小波分解的不连续等。

(3)形状自适应离散小波变换(SA-DWT)

Li等人提出了一种新颖的任意形状对象编码,SA-DWT编码[18]~[22]。这项技术包括SA-DWT和零树熵编码的扩展(ZTE),以及嵌入式小波编码(EZW)。SA-DWT 的特点是:经过SA-DWT之后的系数个数,同原任意形状可视对象的像素个数相同;小波变换的空域相关性、区域属性以及子带之间的自相似性,在SA-DWT中都能很好表现出来;对于矩形区域,SA-DWT与传统的小波变换一样。SA-DWT编码技术的实现已经被新的多媒体编码标准MPEG-4的对于任意形状静态纹理的编码所采用。

5、结束语

在进行图像压缩编码的时候,人们总是希望选择压缩比大,恢复效果好且速度快的算法。实际研究表明,图像数据实际被压缩多少,不但取决于所采用的方法,而且与给定图像的结构,分布,相关性和特征匹配等因素有关。为了使压缩方法更为有效,应首先了解原始图像的性质,然后选择合适的方法。

从图像和视频压缩的发展可以看到:图像压缩的操作对象由像素到块再走向对象;压缩的分辨率逐渐提高,可扩展性逐渐增强;压缩的目的由单纯的减少数据量走向功能的多元化:交互性、可分级性、灵活性;压缩的方法由单一化走向自适应的使用多种压缩工具。随着新理论、新技术的不断发展,必然全有更有效的功能更全面的压缩编码方法出现。总之,图像压缩是一个非常有发展前途的研究领域,这一领域的突破对于我们的信息生活和通信事业的发展具有深远的影响。

6.致谢

经过很久的构思准备与反复的修正,论文撰写工作终于划上句号。使我对图像压缩技术有了更深一步的理解。感谢我的论文指导教师陈蕴谷给予我的悉心指导和帮助。陈老师严谨的教学态度让我终生难忘,无论是在论文资料的搜集还是在内容的修改方面都给予了我很多的指导和帮助,经过陈老师的多次教导,我才能够完成这篇论文。感谢计算机与信息学院的各位老师对我的谆谆教诲和关心,使我学识增长、受益匪浅。感谢全体同学对我的帮助和关心,这份真挚友谊是我人生的一份宝贵财富。

图像压缩编码方法

图像压缩编码方法综述 概述: 近年来, 随着数字化信息时代的到来和多媒体计算机技术的发展, 使得人 们所面对的各种数据量剧增, 数据压缩技术的研究受到人们越来越多的重视。 图像压缩编码就是在满足一定保真度和图像质量的前提下,对图像数据进行变换、编码和压缩,去除多余的数据以减少表示数字图像时需要的数据量,便于 图像的存储和传输。即以较少的数据量有损或无损地表示原来的像素矩阵的技术,也称图像编码。 图像压缩编码原理: 图像数据的压缩机理来自两个方面:一是利用图像中存在大量冗余度可供压缩;二是利用人眼的视觉特性。 图像数据的冗余度又可以分为空间冗余、时间冗余、结构冗余、知识冗余 和视觉冗余几个方面。 空间冗余:在一幅图像中规则的物体和规则的背景具有很强的相关性。 时间冗余:电视图像序列中相邻两幅图像之间有较大的相关性。 结构冗余和知识冗余:图像从大面积上看常存在有纹理结构,称之为结构 冗余。 视觉冗余:人眼的视觉系统对于图像的感知是非均匀和非线性的,对图像 的变化并不都能察觉出来。 人眼的视觉特性: 亮度辨别阈值:当景物的亮度在背景亮度基础上增加很少时,人眼是辨别 不出的,只有当亮度增加到某一数值时,人眼才能感觉其亮度有变化。人眼刚 刚能察觉的亮度变化值称为亮度辨别阈值。 视觉阈值:视觉阈值是指干扰或失真刚好可以被察觉的门限值,低于它就 察觉不出来,高于它才看得出来,这是一个统计值。 空间分辨力:空间分辨力是指对一幅图像相邻像素的灰度和细节的分辨力,视觉对于不同图像内容的分辨力不同。 掩盖效应:“掩盖效应”是指人眼对图像中量化误差的敏感程度,与图像 信号变化的剧烈程度有关。 图像压缩编码的分类: 根据编码过程中是否存在信息损耗可将图像编码分为: 无损压缩:又称为可逆编码(Reversible Coding),解压缩时可完全回复原始数据而不引起任何失真; 有损压缩:又称不可逆压缩(Non-Reversible Coding),不能完全恢复原始数据,一定的失真换来可观的压缩比。 根据编码原理可以将图像编码分为: 熵编码:熵编码是编码过程中按熵原理不丢失任何信息的编码。熵编码基

数字图像压缩技术

数字图像压缩技术 二、JPEG压缩 负责开发静止图像压缩标准的“联合图片专家组”(JointPhotographicExpertGroup,简称JPEG),于1989年1月形成 了基于自适合DCT的JPEG技术规范的第一个草案,其后多次修改,至1991年形成ISO10918国际标准草案,并在一年后成为国际标准,简称JPEG标准。 1.JPEG压缩原理及特点 JPEG算法中首先对图像实行分块处理,一般分成互不重叠的大小的块,再对每一块实行二维离散余弦变换(DCT)。变换后的系数基本不相关,且系数矩阵的能量集中在低频区,根据量化表实行量化,量化的结果 保留了低频部分的系数,去掉了高频部分的系数。量化后的系数按zigzag扫描重新组织,然后实行哈夫曼编码。JPEG的特点如下: 优点:(1)形成了国际标准;(2)具有中端和高端比特率上的良好 图像质量。 缺点:(1)因为对图像实行分块,在高压缩比时产生严重的方块效应;(2)系数实行量化,是有损压缩;(3)压缩比不高,小于502。 JPEG压缩图像出现方块效应的原因是:一般情况下图像信号是高度非平稳的,很难用Gauss过程来刻画,并且图像中的一些突变结构例如 边缘信息远比图像平稳性重要,用余弦基作图像信号的非线性逼近其 结果不是最优的3。 2.JPEG压缩的研究状况及其前景2 针对JPEG在高压缩比情况下,产生方块效应,解压图像较差,近年 来提出了很多改进方法,最有效的是下面的两种方法: (1)DCT零树编码

DCT零树编码把DCT块中的系数组成log2N个子带,然后用零树编码方案实行编码。在相同压缩比的情况下,其PSNR的值比EZW高。但在高压缩比的情况下,方块效应仍是DCT零树编码的致命弱点。 (2)层式DCT零树编码 此算法对图像作的DCT变换,将低频块集中起来,做反DCT变换;对新得到的图像做相同变换,如此下去,直到满足要求为止。然后对层式DCT变换及零树排列过的系数实行零树编码。 JPEG压缩的一个最大问题就是在高压缩比时产生严重的方块效应,所以在今后的研究中,应重点解决DCT变换产生的方块效应,同时考虑与人眼视觉特性相结合实行压缩。 三、JEPG2000压缩 JPEG2000是由ISO/IECJTCISC29标准化小组负责制定的全新静止图像压缩标准。一个最大改进是它采用小波变换代替了余弦变换。2000年3月的东京会议,确定了彩色静态图像的新一代编码方式—JPEG2000图像压缩标准的编码算法。 1.JPEG2000压缩原理及特点 JPEG2000编解码系统的编码器和解码器的框图如图1所示4。 编码过程主要分为以下几个过程:预处理、核心处理和位流组织。预处理部分包括对图像分片、直流电平(DC)位移和分量变换。核心处理部分由离散小波变换、量化和熵编码组成。位流组织部分则包括区域划分、码块、层和包的组织。 JPEG2000格式的图像压缩比,可在现在的JPEG基础上再提升 10%~30%,而且压缩后的图像显得更加细腻平滑。对于当前的JPEG标准,在同一个压缩码流中不能同时提供有损和无损压缩,而在 JPEG2000系统中,通过选择参数,能够对图像实行有损和无损压缩。现在网络上的JPEG图像下载时是按“块”传输的,而JPEG2000格式

jpeg编码原理

一、JPEG算法概要 JPEG(Joint Photographic Experts Group)是一个由ISO和IEC两个组织机构联合组成的一个专家组,负责制定静态的数字图像数据压缩编码标准,这个专家组开发的算法称为JPEG算法,并且成为国际上通用的标准,因此又称为JPEG标准。JPEG是一个适用范围很广的静态图像数据压缩标准,既可用于灰度图像又可用于彩色图像。 JPEG专家组开发了两种基本的压缩算法,一种是采用以离散余弦变换(Discrete Cosine Transform,DCT)为基础的有损压缩算法,另一种是采用以预测技术为基础的无损压缩算法。使用有损压缩算法时,在压缩比为25:1的情况下,压缩后还原得到的图像与原始图像相比较,非图像专家难于找出它们之间的区别,因此得到了广泛的应用。例如,在VCD 和DVD-Video电视图像压缩技术中,就使用JPEG的有损压缩算法来取消空间方向上的冗余数据。为了在保证图像质量的前提下进一步提高压缩比,近年来JPEG专家组正在制定JPEG2000标准,这个标准中将采用小波变换(Wavelet)算法。 JPEG压缩是有损压缩,它利用了人的视角系统的特性,使用量化和无损压缩编码相结合来去掉视角的冗余信息和数据本身的冗余信息。 压缩编码大致分成三个步骤: 1、使用正向离散余弦变换(Forward Discrete Cosine Transform,FDCT)把空间域表示的图变换成频率域表示的图。 2、使用加权函数对DCT系数进行量化,这个加权函数对于人的视觉系统是最佳的。 3、使用霍夫曼可变字长编码器对量化系数进行编码。 译码或者叫做解压缩的过程与压缩编码过程正好相反。 JPEG算法与彩色空间无关,因此“RGB到YUV变换”和“YUV到RGB变换”不包含在

图像压缩编码实验报告

图像压缩编码实验报告 一、实验目的 1.了解有关数字图像压缩的基本概念,了解几种常用的图像压缩编码方式; 2.进一步熟悉JPEG编码与离散余弦变换(DCT)变换的原理及含义; 3.掌握编程实现离散余弦变换(DCT)变换及JPEG编码的方法; 4.对重建图像的质量进行评价。 二、实验原理 1、图像压缩基本概念及原理 图像压缩主要目的是为了节省存储空间,增加传输速度。图像压缩的理想标准是信息丢失最少,压缩比例最大。不损失图像质量的压缩称为无损压缩,无损压缩不可能达到很高的压缩比;损失图像质量的压缩称为有损压缩,高的压缩比是以牺牲图像质量为代价的。压缩的实现方法是对图像重新进行编码,希望用更少的数据表示图像。应用在多媒体中的图像压缩编码方法,从压缩编码算法原理上可以分为以下3类: (1)无损压缩编码种类 哈夫曼(Huffman)编码,算术编码,行程(RLE)编码,Lempel zev编码。(2)有损压缩编码种类 预测编码,DPCM,运动补偿; 频率域方法:正交变换编码(如DCT),子带编码; 空间域方法:统计分块编码; 模型方法:分形编码,模型基编码; 基于重要性:滤波,子采样,比特分配,向量量化; (3)混合编码 JBIG,H.261,JPEG,MPEG等技术标准。 2、JPEG 压缩编码原理 JPEG是一个应用广泛的静态图像数据压缩标准,其中包含两种压缩算法(DCT和DPCM),并考虑了人眼的视觉特性,在量化和无损压缩编码方面综合权衡,达到较大的压缩比(25:1以上)。JPEG既适用于灰度图像也适用于彩色图像。其中最常用的是基于DCT变换的顺序式模式,又称为基本系统。JPEG 的压缩编码大致分

图像压缩技术介绍.

图像压缩技术介绍 由于图像和视频本身的数据量非常大,给存储和传输带来了很多不便,所以图 像压缩和视频压缩得到了非常广泛的应用。比如数码相机、USB摄像头、可视电话 、视频点播、视频会议系统、数字监控系统等等,都使用到了图像或视频的压缩技术。 常用的图像的压缩方法有以下几种: 1、行程长度编码(RLE) 行程长度编码(run-length encoding)是压缩一个文件最简单的方法之一。 它的做法就是把一系列的重复值(例如图象像素的灰度值)用一个单独的值再加上 一个计数值来取代。比如有这样一个字母序列aabbbccccccccdddddd它的行程长度编码就是2a3b8c6d。这种方法实现起来很容易,而且对于具有长重复值的串的压缩编码很有效。例如对于有大面积的连续阴影或者颜色相同的图象,使用这种方法压 缩效果很好。很多位图文件格式都用行程长度编码,例如TIFF,PCX,GEM等。 2、LZW编码 这是三个发明人名字的缩写(Lempel,Ziv,Welch),其原理是将每一个字节的值都要与下一个字节的值配成一个字符对,并为每个字符对设定一个代码。当同 样的一个字符对再度出现时,就用代号代替这一字符对,然后再以这个代号与下个 字符配对。 LZW编码原理的一个重要特征是,代码不仅仅能取代一串同值的数据,也能够代替一串不同值的数据。在图像数据中若有某些不同值的数据经常重复出现,也能找到 一个代号来取代这些数据串。在此方面,LZW压缩原理是优于RLE的。 3、霍夫曼编码 霍夫曼编码(Huffman encoding)是通过用不固定长度的编码代替原始数据来实现的。霍夫曼编码最初是为了对文本文件进行压缩而建立的,迄今已经有很多变体。它的基本思路是出现频率越高的值,其对应的编码长度越短,反之出现频率越 低的值,其对应的编码长度越长。 霍夫曼编码很少能达到8∶1的压缩比,此外它还有以下两个不足:①它必须精确地统计出原始文件中每个值的出现频率,如果没有这个精确统计,压缩的效果就 会大打折扣,甚至根本达不到压缩的效果。霍夫曼编码通常要经过两遍操作,第一 遍进行统计,第二遍产生编码,所以编码的过程是比较慢的。另外由于各种长度的 编码的译码过程也是比较复杂的,因此解压缩的过程也比较慢。②它对于位的增 删比较敏感。由于霍夫曼编码的所有位都是合在一起的而不考虑字节分位,因此增 加一位或者减少一位都会使译码结果面目全非。 4、预测及内插编码

图像压缩原理

1、为什么要对图像数据进行压缩?其压缩原理是什么? 答:(1)数字图像如果不进行压缩,数据量是比较大的,例如一幅分辨率为1024×768的静态真彩色图像,其数据量为1024×768×24=2.25(MB)。这无疑对图像的存储、处理、传送带来很大的困难。事实上,在图像像素之间,无论在行方向还是列方向,都存在一定的相关性。也就是说,在一般图像中都存在很大的相关性,即冗余度。静态图像数据的冗余包括:空间冗余、时间冗余、结构冗余、知识冗余和视觉冗余、图像区域的相同性冗余、纹理的统计冗余等。图像压缩编码技术就是利用图像数据固有的冗余性和相干性,将一个大的图像数据文件转换为较小的同性质的文件。 (2)其压缩原理: 空间冗余、时间冗余、结构冗余、和视觉冗余。 2、图像压缩编码的目的是什么?目前有哪些编码方法? 答:(1)视频经过数字化处理后易于加密、抗干扰能力强、可再生中继等诸多优点,但是由于数字化的视频数据量十分巨大,不利于传输和存储。若不经压缩,数字视频传输所需的高传输率和数字视频存储所需的巨大容量,将成为推广数字电视视频通信的最大障碍,这就是进行视频压缩编码的目的。 (2)目前主要是预测编码,变换编码,和统计编码三种编码方法。 3、某信号源共有7个符号,概率分别为0.2,0.18,0.1,0.15,0.07,0.05,0.25,试进行霍夫曼编码,并解释是否进

行了压缩,压缩比为多少? 0000 0001 000 00 111 110 10 0.05 0.07 0.1 0.2 0.18 0.15 0.25 0.05×4+0.07×4+0.1×3+0.2×2+0.18×3+0.15×3+0.25×2=2.67

图像压缩技术文档

J P E G 标准是由国际标准化组织ISO和国际电话电报咨询委员会CCITT为静止图像所建立的第一个国际数字图像压缩标准,它是一个适用范围很广的通用标准,既可以用于灰度图像,又可以用于彩色图像,可以支持各种应用。例如在计算机技术中,基于JPEG 有损压缩的数字水印算法,和嵌入式系统中的JPEG 分层压缩等。在JPEG 各类图像压缩算法中,基于离散余弦变换的图像压缩编码过程称为基本顺序过程,它应用于绝大多数图像压缩场合,并且它能在图像的压缩操作中获得较高的压缩比,并且重构图像与源图像的视觉效果基本相同。 基本原理 基于DCT 顺序型工作模式的JPEG 压缩算法系统的编码器与解码器的结构如图1 所示,量化编码是在进行了二元D C T 的系数量化后,且熵编码部分使用Huffman 编码方法。 图1 系统结构图 1 色彩变换与部分数据取样 色彩变换将计算机屏幕显示使用的RGB 色彩数据按照(1 )式给定的关系,转换成JPEG

中使用的YCbCr 数据,其中Y 是颜色的亮度,CbCr 是色调。 Y=0.2999R+0.5870G+0.1140B Cb = -0.1687R-0.3313G+0.5000B+128 (1) Cr = 0.5000R-0.4187G-0.0813B+128 在取样部分,考虑到人眼对图像的亮度变化敏感,而对颜色的变化迟钝。因此,对反映颜色变化的色调信息只取其部分数据进行处理。本文的JPEG 格式采用的部分取样方式为Yuv411,即每取4 个Y 数据,只取一个Cb 数据和一个Cr 数据。因此,原数据在尚未编码时,已获得50% 的压缩。 2 利用DCT 对空间频率的变换 离散余弦变换(DCT)实现将一组光强数据转换成频率数据。在压缩时,将源图像数据分成8*8 像素构成的像块的集合。经过零偏置将每一取样值从0~255 转为-128~+127,再做DCT 处理。DCT 将每个数据单元的值转换为64 个DCT 系数Svu,其中S00 称为直流系数,其余63 个系数称为交流系数。解压缩是正向变换的反过程。D C T 和IDCT 分别由公式(2)和公式(3)实现。 770 01(21)(21)(,)()()(,)cos cos 41616i j i u j v F u v C u C v f i j ππ==++????=????????∑∑ (2) 7700 1(21)(21)(,)()()(,)cos cos 422u v x u y v f i j C u C v F u v N N ππ==++????=????????∑∑ (3) 上式中(),()C u C v = (当u ,v=0时) (),()1C u C v = (其他情况) 3 量化和熵编码 直流分量和各交流分量可用不同量化间隔量化,低频分量量化得细,高频分量量化得粗。Y 、U 、V 也可用不同的量化表,Y 细量化,U 、V 粗量化。JPEG 规范中,Y 数据和Cb 、Cr 数据各有一个8 × 8 的推荐量化表,根据具体要求可以构造专用的量化表,但量化过程和逆量化过程应使用同样的量化表。量化是在图像文件品质与压缩比例之间做一选择的重要过程,而这也就是JPEG 所谓的失真压缩方式。经量化处理后的数据,应用平均压缩比最高的Huffman 码进行熵编码。 经过上述过程后可得到压缩图像。

JPEG图像压缩原理

JPEG编码 JPEG是联合图象专家组(Joint Picture Expert Group)的英文缩写,是国际标准化组织(ISO)和CCITT联合制定的静态图象的压缩编码标准。和相同图象质量的其它常用文件格式(如GIF,TIFF,PCX)相比,JPEG是目前静态图象中压缩比最高的。我们给出具体的数据来对比一下。例图采用Windows95目录下的Clouds.bmp,原图大小为640*480,256色。用工具SEA(version1.3)将其分别转成24位色BMP、24位色JPEG、GIF(只能转成256色)压缩格式、24位色TIFF压缩格式、24位色TGA压缩格式。得到的文件大小(以字节为单位)分别为:921,654,17,707,177,152,923,044,768,136。可见JPEG比其它几种压缩比要高得多,而图象质量都差不多(JPEG处理的颜色只有真彩和灰度图)。 正是由于JPEG的高压缩比,使得它广泛地应用于多媒体和网络程序中,例如HTML语法中选用的图象格式之一就是JPEG(另一种是GIF)。这是显然的,因为网络的带宽非常宝贵,选用一种高压缩比的文件格式是十分必要的。 JPEG有几种模式,其中最常用的是基于DCT变换的顺序型模式,又称为基线系统(Baseline),以下将针对这种格式进行讨论。 1.JPEG的压缩原理 JPEG的压缩原理其实上面介绍的那些原理的综合,博采众家之长,这也

正是JPEG有高压缩比的原因。其编码器的流程为: 图9.3 JPEG编码器流程 解码器基本上为上述过程的逆过程: 图9.4 解码器流程 DCT 下面对正向离散余弦变换(FDCT)变换作几点说明。 (1)对每个单独的彩色图像分量,把整个分量图像分成8×8的图像块,如图所示,并作为两维离散余弦变换DCT的输入。通过DCT变换,把能量集中在少数几个系数上。 (2)DCT变换使用下式计算: 它的逆变换使用下式计算:

Matlab的图像压缩技术

Matlab的图像压缩技术 一.目的要求 掌握Matlab图像图像压缩技术原理和方法。理解有损压缩和无损压缩的概念,了解几种常用的图像压缩编码方式,利用matlab进行图像压缩算法验证。二.实验内容 1、观察颜色映像矩阵的元素 >> hot(8) ans = 0.3333 0 0 0.6667 0 0 1.0000 0 0 1.0000 0.3333 0 1.0000 0.6667 0 1.0000 1.0000 0 1.0000 1.0000 0.5000 1.0000 1.0000 1.0000 数据显示第一行是1/3红色,最后一行是白色。 2、pcolor显示颜色映像 >> n=16; >> colormap(jet(n)); >> pcolor([1:n+1;1:n+1]); >> title('Using Pcolor to Display a Color )Map'); 图2 显示颜色映像

3、colorbar显示当当前坐标轴的颜色映像>> [x,y,z]=peaks; >> mesh(x,y,z); >> colormap(hsv); >> axis([-3 3 -3 3 -6 8]); >> colorbar; 图3 显示当前坐标轴的颜色映像4、图像格式转换 g=rgb2gray(I); g=rgb2gray(I); >> imshow(g),colorbar; 图4-1 原图像saturn.png

图4-2转换后的图像 5、求解图像的二唯傅里叶频谱 I=imread('cameraman.tif'); >> imshow(I) >> J=fftshift(fft2(I)); >> figure; >> imshow(log(abs(J)),[8,10]) 图5-1 原图像cameraman.png

图像压缩与编码

实验项目3、图像压缩与编码 一、实验目的 (1)理解图像压缩编码的基本原理; (2)掌握用程序代码实现DCT变换编码; (3)掌握用程序代码实现游程编码。 二、实验原理及知识点 1、图像压缩编码 图像信号经过数字化后,数据量相当大,很难直接进行保存。为了提高信道利用率和在有限的信道容量下传输更多的图像信息,必须对图像进行压缩编码。 图像压缩技术标准一般可分为如下几种:JPEG压缩(JPEG Compression)、JPEG 2000 、H.26X标准(H.26X standards)以及MPEG标准(MPEG standards)。数字压缩技术的性能指标包括:压缩比、平均码字长度、编码效率、冗余度。 从信息论角度分,可以将图像的压缩编码方法分为无失真压缩编码和有限失真编码。前者主要包括Huffman编码、算术编码和游程编码;后者主要包括预测编码、变换编码和矢量量化编码以及运动检测和运动补偿技术。 图像数据压缩的目的是在满足一定图像质量的条件下,用尽可能少的比特数来表示原始图像,以提高图像传输的效率和减少图像存储的容量,在信息论中称为信源编码。图像压缩是通过删除图像数据中冗余的或者不必要的部分来减小图像数据量的技术,压缩过程就是编码过程,解压缩过程就是解码过程。 2、游程编码 某些图像特别是计算机生成的图像往往包含许多颜色相同的块,在这些块中,许多连续的扫描行或者同一扫描行上有许多连续的像素都具有相同的颜色值。在这些情况下就不需要存储每一个像素的颜色值,而是仅仅存储一个像素值以及具有相同颜色的像素数目,将这种编码方法称为游程(或行程)编码,连续的具有相同颜色值的所有像素构成一个行程。 在对图像数据进行编码时,沿一定方向排列的具有相同灰度值的像素可看成是连续符号,用字串代替这些连续符号,可大幅度减少数据量。游程编码记录方式有两种:①逐行记录每个游程的终点列号:②逐行记录每个游程的长度 3、DCT变换编码 变换编码是在变换域进行图像压缩的一种技术。图1显示了一个典型的变换编码系统。 压缩 图像输入图 像N×N 图1 变换编码系统 在变换编码系统中,如果正变换采用DCT变换就称为DCT变换(离散余弦变换)编码系统。DCT用于把一幅图像映射为一组变换系数,然后对系数进行量化和编码。对于大多数的正常图像来说,多数系数具有较小的数值且可以被粗略地量化(或者完全抛弃),而产生的图像失真较小。

多媒体压缩技术

多媒体压缩技术 为什么会出现多媒体压缩技术 在多媒体计算系统中,信息从单一媒体转到多种媒体;若要表示,传输和处理大量数字化了的声音/图片/影像视频信息等,数据量是非常大的。如果不进行处理,计算机系统几乎无法对它进行存取和交换。因此,在多媒体计算机系统中,为了达到令人满意的图像、视频画面质量和听觉效果,必须解决视频、图像、音频信号数据的大容量存储和实时传输问题。解决的方法,除了提高计算机本身的性能及通信信道的带宽外,更重要的是对多媒体进行有效的压缩。 为什么多媒体数据能够被压缩 多媒体数据之所以能够压缩,是因为视频、图像、声音这些媒体具有很大的压缩力。以目前常用的位图格式的图像存储方式为例,在这种形式的图像数据中,像素与像素之间无论在行方向还是在列方向都具有很大的相关性,因而整体上数据的冗余度很大;在允许一定限度失真的前提下,能对图像数据进行很大程度的压缩。 多媒体压缩数据的方法有哪些? 根据解码后数据与原始数据是否完全一致进行分类,压缩方法可被分为有失真编码和无失真编码两大类。 有失真压缩法会压缩了熵,会减少信息量,而损失的信息是不能再恢复的,因此这种压缩法是不可逆的。无失真压缩法掉或减少数据中的冗余,但这些冗余值是可以重新插入到数据中的,因此冗余压缩是可逆的过程。 无失真压缩是不会产生失真。从信息主义角度讲,无失真编码是泛指那种不考虑被压缩信息性质和压缩技术。它是基于平均信息量的技术,并把所有的数据当做比特序列,而不是根据压缩信息的类型来优化压缩。也就是说,平均信息量编码忽略被压缩信息主义内容。在多媒体技术中一般用于文本、数据的压缩,它能保证百分之百地恢复原始数据。但这种方法压缩比较低,如LZW编码、行程编码、霍夫曼(Huffman)编码的压缩比一般在2:1至5:1之间。 数据压缩技术包括图像、视频和音频信号的压缩,文件存储和利用。图像压缩一直是技术热点之一,是计算机处理同像和视频以及网络传输的重要基础,目前ISO制订了两个压缩标准即JPEG和MPEG,同时使计箅机实时处理音频、视频信息,以保证播高质量的视频、音频节目。 按照压缩方法的原理分类 根据编码原理进行分类,大致有编码、变换编码、统计编码、分析-合成编码、混合编码和其他一些编码方法。其中统计编码是无失真的编码,其他编码方法基本上都是有失真的编码。 预测编码是针对空间冗余的压缩方法,其基本思想是利用已被编码的点的数据值,预测邻近的一个像素点的数据值。预测根据某个模型进行。如果模型选取得足够好的话,则只需存储和传输起始像素和模型参数就可代表全部数据了。按照模型的不同,预测编码又可分为线性预测、帧内预测和帧间预测。 变换编码也是针对空间冗余和时间冗余的压缩方法。其基本思想是将图像的光强矩阵(时域信号)变换到系统空间(频域)上,然后对系统进行编码压缩。在空间上具有强相关性的信号,反映在频域上是某些特定区域内的能量常常被集中在一起,或者是系数矩阵的发布具有某些规律。可以利用这些规律,分配

多媒体图像压缩技术

多媒体图像压缩技术 2010级电子信息科学与技术刘小辉2010271022 摘要:随着计算机多媒体技术的不断发展,人们期望更高性能的图像压缩技术的出现。图像压缩是用最少的数据量来表示尽可能多的原图像的信息。多媒体数据压缩技术是现代网络发展的关键性技术之一。由于图像和声音信号中存在各种各样的冗余,为数据压缩提供了可能。数据压缩技术有无损压缩缩和有损压缩两大类,这些压缩技术又各有不同的标准。 Abstract:With the ever-growing multimedia technology, people are looking for ward to new image compression technologies with better performances. Image compression with the least amount of data is represented as much information of original image .Multimedia data compression technology is the modern network development of the key technology of. Because of the image and sound signal in the presence of various kinds of redundancy, compression of data is possible. Data compression technology of lossless and lossy compression two categories, these compression techniques and different standards. 关键字(Keyword):多媒体数据压缩技术(Multimedia data compression technology) 无损压缩和有损压缩(Lossless and lossy compression) 图像和声音信号(The image and sound signal) 最少的数据量(The least amount of data) 随着计算机多媒体技术和通信技术的日益发展,以及网络的迅速普及,图像数据信息以

图像压缩编码

Discussion on Wavelet B ases Selection for Digital Image Compression H AN Fang2f ang,XU Shuang,ZHENG De2zhong (College o f Electric Engineering,Yanshan Univer sity,Qinhuangdao Hebei066004,China) Abstract: This paper studies the selection of optimal wavelet bases.The merits of biorthog onal spline wavelets are dis2 cussed and dem onstrated.C ontinuity of spline derivatives assures wavelets sm ooth and symmetry of biorthog onal wavelets makes the filters have linear phase.Those features can reduce distortion and guarantee the reconstructed images quality. K ey w ords: Optimal wavelet bases;Image com pression;S pline wavelets;Biorthog onal wavelets 关于数字图像压缩中小波基选择问题的探讨① 韩芳芳,徐 爽,郑德忠 (燕山大学,电气工程学院,河北 秦皇岛 066004) 摘要:针对数字图像压缩编码中最优小波基的选择问题,论证了双正交样条小波基的优点,并对其进行了推导。样条小波的导数连续性保证了小波基的光滑性,双正交对偶小波的对称性使得滤波器具有线性相位,可减小失真,保证重构图像的质量。 关键词:最优小波基;图像压缩;样条小波;双正交小波 中图分类号:T N919 文献标识码:A 文章编号:1004-1699(2004)01-0154-04 图像是人类感知信息的重要途径之一。然而图像经过采样及量化编码后数据量巨大,给传输与存储带来很多困难,因而需要对图像数据进行有效的压缩。在F ourier分析基础上发展起来的小波分析,提供了一种自适应的时域和频域同时局部化的分析方法,通过伸缩和平移等运算功能进行多尺度细化分析,能够有效地从信号中提取信息。小波分析用于数字图像压缩,压缩比高,压缩速度快,压缩后信号与图像的特征不变,且在传递过程中可以抗干扰。因此小波分析成为数字图像处理及压缩编码的有力工具。 如何选择最优小波基是图像压缩编码中所面临的一个棘手问题。对于图像信号而言,一方面要对巨大的数据量进行有效压缩,另一方面,要保持重建图像的质量满足视觉要求。小波基的选择存在一些标准,如平滑性、逼近精度、支撑大小和滤波频率等,如何最佳的组合这些特征是一个难点所在。 1 小波基的选择问题 如何最合理、快速的选择小波基,目前这方面的研究并无定论。在小波基的选择中,一般较为看重以下几方面: 平滑性与消失矩。消失矩表明了小波变换后的能量集中程度,消失矩阶数很大时,精细尺度下的高频部分数值有许多是小得可以忽略的(奇异点除外)[1]。从重构图像质量角度而言,平滑性的影响要 2004年3月 传 感 技 术 学 报 第1期 ①收稿日期:2003211210 作者简介:韩芳芳(1978-)女,硕士研究生,主要研究方向为视频信号压缩编码; 徐 爽(1978-)女,硕士研究生,主要研究方向为信号处理与语音编码; 郑德忠(1952-)男,教授,博士生导师,河北省人工智能学会副理事长,中国电子协会高级会员,主要从事信号 处理和先进控制等方面的研究工作,已在国内外发表论文50余篇。qhdzdz@https://www.docsj.com/doc/7413693730.html,.

多媒体数据压缩技术综述

南昌大学研究生(工程硕士)2006~2007学年第二学期 期末考试试卷 课程名称:《多媒体技术》专业:软件工程 学生姓名:学号:C2007271 学院:信息工程学院得分: 任课教师签:洪春勇时间:2007.8 多媒体数据压缩技术综述 摘要:本文侧重介绍多媒体各种数据类型和数据描述,讨论数据

压缩技术在各种媒体数据上的应用及发展趋势。 关键词:多媒体数据、数据压缩、JPEG、MPEG-4、发展趋势、一、引言 多媒体在我国的定义是:能对多种载体(媒介)上的信息和多种存储体(媒介)上的信息进行处理的技术。多媒体传统关键技术主要集中在以下四类中:数据压缩技术、大规模集成电路(VLSI)制造技术、大容量的光盘存储器(CD-ROM)、实时多任务操作系统。因为这些技术取得了突破性的进展,多媒体技术才得以迅速的发展。网络技术的发展使多媒体技术的应用空间得到了快速拓展。但是网络现状的局限性也使得各种多媒体技术应用受到制约,因此对于多媒体数据的压缩技术显得非常重要和关键。 二、多媒体数据类型及其数据描述 (一)多媒体数据类型 1.文字 文字是人与计算机之间进行信息交换的主要媒体。在计算机发展的早期,比较实用的终端为一般文字终端,在屏幕上显示的都是文字信息。由于人们在现实生活中用语言进行交流,所以开始时文字终端比较流行,但是后来出现了图形、图像、声音等媒体,这样也就相应地出现了多种终端设备。在现实世界中,文字是人们进行通信的主要形式,文字包括西文与中文。在计算机中,文字用二进制编码表示,即使用不同的二进制编码来代表不同的文字。

2.音频 音频(Audio)指的是20HZ~20kHz的频率范围,但实际上“音频”常常被作为“音频信号”或“声音”的同义语,是属于听觉类媒体,主要分为波形声音、语音和音乐。 3.视觉媒体 能够利用视觉传递信息的媒体都是视觉媒体。位图图像、矢量图像、动态图像、符号等都是视觉媒体。 4.动画 动画是指运动的画面,动画在多媒体中是一种非常有用的信息交换工具。计算机动画的研究始于20世纪60年代初期。1963年Bell实验室制作了第一部计算机动画片。最初主要集中在二维动画的研制,作为示教和辅助制作传统动画片之用。三维计算机动画的研究始于20世纪70年代初,但真正进入实用化还是80年代中后期。随着具有实时处理能力的超级图形工作站的出现,以及三维造型技术、真实感图形生成技术的迅速发展,推出了一些可生成具有高逼真度视觉效果的实用化、商品化的三维动画系统。20世纪90年代初,计算机动画技术成功地应用于电影特技,取得了出色的成就,由此可见计算机动画技术的重要意义。(二)多媒体数据的描述 1.音频文件 在多媒体声音处理技术中,最常见的几种声音存储格式是:WAVE波形文件,MIDI音乐数字文件和目前非常流行的MP3

浅析图像压缩编码方法

Computer Knowledge and Technology 电脑知识 与技术第6卷第23期(2010年8月)浅析图像压缩编码方法 徐飞 (闽西职业技术学院,福建龙岩364021) 摘要:该文描述了图像压缩编码的概念,原理以及主要分类,介绍了目前常见的三种图像压缩编码方法的原理,特点以及简单讨论了其中两种方法的MATLAB 代码实现。 关键词:图像压缩编码;编码原理;编码分类;编码方法;MATLAB 中图分类号:TP301文献标识码:A 文章编号:1009-3044(2010)23-6584-03 Analysis of the Image Compression Coding Method XU Fei (Minxi Vocational &Technical College,Longyan 364021,China) Abstract:This paper is mainly about the concept,principle and classification of image compression coding,introduces the concepts and characteristic of three kinds of image compression coding methods that are common used,and discusses how to using matlab to accomplish the two common methods which mentions in the front. Key words:image compression coding;coding principle;coding classification;coding method;MATLAB 现代社会是信息社会,随着信息技术的发展,图像信息被广泛应用于多媒体通信、计算机系统和网络中。因为对图像的要求越来越高,图像信息量也越来越大,所以在传输之前需要进行信息处理,必须采用合适的方法对其进行压缩,因此有必要对图像压缩编码方法进行研究。 1图像压缩编码 1.1概述 图像压缩编码就是在满足一定保真度和图像质量的前提下,对图像数据进行变换、编码和压缩,去除多余的数据以减少表示数字图像时需要的数据量,便于图像的存储和传输。即以较少的数据量有损或无损地表示原来的像素矩阵的技术,也称图像编码。 1.2图像压缩编码原理 图像数据的压缩机理来自两个方面:一是利用图像中存在大量冗余度可供压缩;二是利用人眼的视觉特性。 1.2.1图像数据的冗余度 1)空间冗余: 在一幅图像中规则的物体和规则的背景具有很强的相关性。 2)时间冗余:电视图像序列中相邻两幅图像之间有较大的相关性。 3)结构冗余和知识冗余: 图像从大面积上看常存在有纹理结构,称之为结构冗余。 4)视觉冗余:人眼的视觉系统对于图像的感知是非均匀和非线性的,对图像的变化并不都能察觉出来。 1.2.2人眼的视觉特性 1)亮度辨别阈值:当景物的亮度在背景亮度基础上增加很少时,人眼是辨别不出的,只有当亮度增加到某一数值时,人眼才能感觉其亮度有变化。人眼刚刚能察觉的亮度变化值称为亮度辨别阈值。 2)视觉阈值:视觉阈值是指干扰或失真刚好可以被察觉的门限值,低于它就察觉不出来,高于它才看得出来,这是一个统计值。3)空间分辨力:空间分辨力是指对一幅图像相邻像素的灰度和细节的分辨力,视觉对于不同图像内容的分辨力不同。 4)掩盖效应:“掩盖效应”是指人眼对图像中量化误差的敏感程度,与图像信号变化的剧烈程度有关。 1.3图像压缩编码的分类 根据编码过程中是否存在信息损耗可将图像编码分为: 1)无损压缩:又称为可逆编码(Reversible Coding),解压缩时可完全回复原始数据而不引起任何失真; 2)有损压缩:又称不可逆压缩(Non-Reversible Coding),不能完全恢复原始数据,一定的失真换来可观的压缩比。 根据编码原理可以将图像编码分为: 1)熵编码:熵编码是编码过程中按熵原理不丢失任何信息的编码。熵编码基本原理是给出现概率大的信息符号赋予短码字,出收稿日期:2010-06-10 作者简介;徐飞(1982-),男,福建龙岩人,闽西职业技术学院,助教,理学学士,主要研究方向为数字图象,软件开发,软件测试。ISSN 1009-3044Computer Knowledge and Technology 电脑知识与技术Vol.6,No.23,August 2010,pp.6584-6586,6589E-mail:eduf@https://www.docsj.com/doc/7413693730.html, https://www.docsj.com/doc/7413693730.html, Tel:+86-551-56909635690964

图像压缩技术的发展现状与趋势

图像压缩技术的发展现状与趋势 耿玉静1 赵华2 1燕山大学信息科学与工程学院 河北秦皇岛 (066004) 2河北师范大学电子系 河北保定 (071003) E-mail: gyjlunwen@https://www.docsj.com/doc/7413693730.html, 摘要文章简要论述了图像和视频压缩技术的研究状况,就目前国际上正在研究的压缩标准和方法作了介绍,并对图像和视频压缩技术的发展趋势和前景进行了初步探讨。 关键词图像压缩,视频编码,视频对象,压缩标准 1.图像压缩的可行性 图像编码压缩的目的是对要处理的图像源数据按一定的规则进行变换和组合[1],从而达到以尽量少的比特数来表征图像,同时尽可能好的复原图像的质量,使它符合预定应用场合的要求。图像数据之所以可以进行压缩,是因为有以下几个方面的原因:组成图像的各像素之间,无论在行方向还是列方向都存在一定的相关性,即原始图像数据是高度相关的,应用某种编码方法提取或减少这些相关性,便可达到压缩数据的目的;从信息论看,描述图像信源的数据是由有效信息量和冗余量两部分组成的,去除冗余量能够节省传输和存储中的开销,同时又不损害图像信源的有效信息量;有些场合允许图像编码有一定的失真,也是图像可以压缩的一个重要原因。 2.图像压缩的分类 图像压缩编码的方法目前有很多种,出发点不同其分类亦有差异。以信息保真度为出发点,可以分为两大类:一类是冗余度压缩法。如著名的哈夫曼编码、香农编码、游程编码等,其特征是压缩比较低(一般不超过8:1),但不丢失任何数据,可以严格恢复原图像,实现编/解码的互逆,故又称可逆编码或无损压缩。另一类是熵压缩法。如预测编码、变换编码、统计编码等,由于在压缩过程中要丢失一些人眼所不敏感的图像信息,且所丢失的信息不可恢复,即图像还原后与压缩前不完全一致,故又称有损压缩。以具体编码技术为出发点,可以分为:预测编码、变换编码、统计编码、轮廓编码、模型编码等。 3.图像压缩技术的现状 20世纪80年代后,ISO、IEC和ITU陆续制定了各种数据压缩与通信的标准与建议。 3.1静止图像压缩标准:JPEG标准&JPEG 2000 标准 3.1.1 JPEG 标准 JPEG 全名为Joint Photographic Experts Group,是一个在国际标准组织(ISO)下从事静止图像压缩标准制定的委员会。JPEG标准从1986年正式开始制订,1988年决定采用以图像质量最好的ADCT(Adaptive Discrete Cosine Transform)方式为基础的算法作标准[2],于1991年3月提出10918号标准[3]“连续色调静止图像的数字压缩编码”,即JPEG标准[4,5]。它在较低的计算复杂度下,能提供较高的压缩比与保真度。 - 1 -

图像压缩编码

小波变换在图像压缩中的应用 学院精密仪器与光电子工程学院 专业光学工程 年级2014级 学号1014202009 姓名孙学斌

一、图像压缩编码 数字图像 图像是自然界景物的客观反映。自然界的图像无论在亮度、色彩,还是空间分布上都是以模拟函数的形式出现的,无法采用数字计算机进行处理、传输和存储。 在数字图像领域,将图像看成是由许多大小相同、形状一致的像素(Picture Element简称Pixel组成)用二维矩阵表示。图像的数字化包括取样和量化两个主要步骤。在空间将连续坐标离散化的过程为取样,而进一步将图像的幅度值整数化的过程称为量化。 图像编码技术 数据压缩就是以较少的数据量表示信源以原始形式所代表的信息,其目的在于节省存储空间、传输时间、信号频带或发送能量等。其组成系统如图所示。 过程应尽量保证去除冗余量而不会减少或较少减少信息量,即压缩后的数据要能够完全或在一定的容差内近似恢复。完全恢复被压缩信源信息的方法称为无损压缩或无失真压缩,近似恢复的方法称为有损压缩或有失真压缩。 图像压缩编码的必要性与可行性 1.图像压缩编码的必要性 采用数字技术会使信号处理技术性能大为提高,但其数据量的增加也是十分惊人的。图像数据更是多媒体、网络通信等技术重点研究的压缩对象。不加压缩的图像数据是计算机的处理速度、通信信道的容量等所无法承受的。 如果将上述的图像信号压缩几倍、十几倍、甚至上百倍,将十分有利于图像的存储和传输。可见,在现有硬件设施条件下,对图像信号本身进行压缩是解决上述矛盾的主要出路。 2.图像压缩编码的可能性 图像数据量大,同时冗余数据也是客观存在的。在有些图像中可压缩的可能性很大。一般图像中存在着以下数据冗余因素。 (1)编码冗余 编码冗余也称信息熵冗余。去除信源编码中的冗余量可以在对信息无损的前提下减少代表信息的数据量。对图像进行编码时,要建立表达图像信息的一系列符号码本。如果码本不能使每个像素所需的平均比特数最小,则说明存在编码冗余,就存在压缩的可能性。 (2)空间冗余

相关文档