文档视界 最新最全的文档下载
当前位置:文档视界 › 视频格式和压缩标准大全

视频格式和压缩标准大全

视频格式和压缩标准大全
视频格式和压缩标准大全

网络摄像机和视频服务器作为网络应用的新型产品,适应网络传输的要求也必然成为产品开发的重要因素,而这其中视频图像的技术又成为关键。在目前中国网络摄像机和视频服务器的产品市场上,各种压缩技术百花齐放,且各有优势,为用户提供了很大的选择空间。

JPEG 、M-JPEG

有相当一部分国内外网络摄像机和视频服务器都是采用JPEG,Motion-JPEG压缩技术,JPEG、M-JPEG采用的是帧内压缩方式,图像清晰、稳定,适于视频编辑,而且可以灵活设置每路的视频清晰度和压缩帧数。另外,因其压缩后的格式可以读取单一画面,因此可以任意剪接,特别适用与安防取证的用途。

Wavelet Transform

小波变换也属于帧内压缩技术,由于这种压缩方式移除了图像的高频成分,仅保留单帧图像信号,特别适用于画面变更频繁的场合,且压缩比也得到了一定的提高,因此也被一些网络摄像机和视频服务器所采用,例如,BOSCH推出的NetCam-4系列数字网络摄像机,深圳缔佳生产的NETCAM系列网络摄像机等。

H.263

H.263是一个较为成熟的标准,它是帧间预测和变换编码的混合算法,压缩比较高,尤其适用低带宽上传输活动视频。采用H.263技术生产的网络型产品,其成本较为适中,软/硬件丰富,适合集中监控数量较多的需求,如深圳大学通信技术研究所开发的SF-10网络摄像机和SF-20视频服务器,深圳新文鼎开发的W750视频服务器和W74GM网络摄像机等采用的都是这一压缩技术。

MPEG-4

MPEG-4的着眼点在于解决低带宽上音视频的传输问题,在164KHZ的带宽上,MPEG-4平均可传5-7帧/秒。采用MPEG-4压缩技术的网络型产品可使用带宽较低的网络,如PSTN,ISDN,ADSL等,大大节省了网络费用。另外,MPEG-4的最高分辨率可达720×576,接近DVD 画面效果,基于图像压缩的模式决定了它对运动物体可以保证有良好的清晰度。MPEG-4所有的这些优点,使它成为当前网络产品生产厂商开发的重要趋势之一。

另外,也有部分厂商采用的是MPEG-1,MPEG-2压缩格式,除此之外,有的厂商还采用多种压缩技术相结合的方式,例如,有些国外推出的网络摄像机,其压缩方式就是MPEG-4,与JPEG 相结合,在可以看到JPEG静止图像的同时,利用MPEG-4高级压缩功能,令到高质量的动态图像也能在低带宽上传输。

纵观以上这些压缩技术,虽然MPEG-4以其良好的图像压缩性能,可支持非常低的宽带上达到视频会议的质量,从而成为未来网络型产品开发的主流方向,但就现在市场的应用情况来看,MPEG-4暂时还没有占到主导地位,究其原因,主要是由于虽然MPEG-4的国际标准已经制定,但MPEG-4的算法是公开的因而厂商各自为政,良莠不齐,对后续的二次开发带来了严重的影响,另外,MPEG-4在图像质量上也有待提高,在复杂的网路环境中,数据流

过大时易导致数据流失。

另一方面,如此多种类的压缩技术,也让用户在选购网络摄像机和视频服务器时,产生了不少的困扰,有的用户要求网络传输达到实时,有的要求图像质量高,有的又要求后端存储系统容量足够大…….对于网络型产品而言,网络传输速率、图像质量和系统存储容量都与产品所用的压缩方式密切相关,三者又互相制约,因此很难做到三者同时达到最理想的状态,只能从三者中寻求一个平衡点,即用户本身真正实际的需求。很多厂商建议用户在选择网络摄像机和视频服务器时,首先应明确系统已有的资源,以及系统所要达到的实际效果,不必一味追求市场上所谓的“热门”产品或成本。

视频压缩格式的分析和对比(MJPEG、MPEG-4、H.264等)

1.H.261

H.261又称为P*64,其中P为64kb/s的取值范围,是1到30的可变参数,它最初是针对在ISDN上实现电信会议应用特别是面对面的可视电话和视频会议而设计的。实际的编码算法类似于MPEG算法,但不能与后者兼容。H.261在实时编码时比MPEG所占用的CPU运算量少得多,此算法为了优化带宽占用量,引进了在图像质量与运动幅度之间的平衡折中机制,也就是说,剧烈运动的图像比相对静止的图像质量要差。因此这种方法是属于恒定码流可变质量编码而非恒定质量可变码流编码。

2.H.263

H.263是国际电联ITU-T的一个标准草案,是为低码流通信而设计的。但实际上这个标准可用在很宽的码流范围,而非只用于低码流应用,它在许多应用中可以认为被用于取代H.261。

H.263的编码算法与H.261一样,但做了一些改善和改变,以提高性能和纠错能力。.263标准在低码率下能够提供比H.261更好的图像效果,两者的区别有:(1)H.263的运动补偿使用半象素精度,而H.261则用全象素精度和循环滤波;(2)数据流层次结构的某些部分在H.263中是可选的,使得编解码可以配置成更低的数据率或更好的纠错能力;(3)H.263包含四个可协商的选项以改善性能;(4)H.263采用无限制的运动向量以及基于语法的算术编码;(5)采用事先预测和与MPEG中的P-B帧一样的帧预测方法;(6)H.263支持5种分辨率,即除了支持H.261中所支持的QCIF和CIF外,还支持SQCIF、4CIF和16CIF,SQCIF相当于QCIF一半的分辨率,而4CIF和16CIF分别为CIF的4倍和16倍。

1998年IUT-T推出的H.263+是H.263建议的第2版,它提供了12个新的可协商模式和其他特征,进一步提高了压缩编码性能。如H.263只有5种视频源格式,H.263+允许使用更多的源格式,图像时钟频率也有多种选择,拓宽应用范围;另一重要的改进是可扩展性,它允许多显示率、多速率及多分辨率,增强了视频信息在易误码、易丢包异构网络环境下的传输。另外,H.263+对H.263中的不受限运动矢量模式进行了改进,加上12个新增的可选模式,不仅提高了编码性能,而且增强了应用的灵活性。H.263已经基本上取代了H.261。

二、M-JPEG

M-JPEG(Motion- Join Photographic Experts Group)技术即运动静止图像(或逐帧)压缩技术,广泛应用于非线性编辑领域可精确到帧编辑和多层图像处理,把运动的视频序列作为连续的静止图像来处理,这种压缩方式单独完整地压缩每一帧,在编辑过程中可随机存储每一帧,可进行精确到帧的编辑,此外M-JPEG的压缩和解压缩是对称的,可由相同的硬件和软件实现。但M-JPEG只对帧内的空间冗余进行压缩。不对帧间的时间冗余进行压缩,故压缩效率不高。采用M-JPEG数字压缩格式,当压缩比7:1时,可提供相当于Betecam SP质量图像的节目。

JPEG标准所根据的算法是基于DCT(离散余弦变换)和可变长编码。JPEG的关键技术有变换编码、量化、差分编码、运动补偿、霍夫曼编码和游程编码等

M-JPEG的优点是:可以很容易做到精确到帧的编辑、设备比较成熟。缺点是压缩效率不高。

此外,M-JPEG这种压缩方式并不是一个完全统一的压缩标准,不同厂家的编解码器和存储方式并没有统一的规定格式。这也就是说,每个型号的视频服务器或编码板有自己的M-JPEG 版本,所以在服务器之间的数据传输、非线性制作网络向服务器的数据传输都根本是不可能的。

三、MPEG系列标准

MPEG是活动图像专家组(Moving Picture Exports Group)的缩写,于1988年成立,是为数字视/音频制定压缩标准的专家组,目前已拥有300多名成员,包括IBM、SUN、BBC、NEC、INTEL、AT&T等世界知名公司。MPEG组织最初得到的授权是制定用于“活动图像”编码的各种标准,随后扩充为“及其伴随的音频”及其组合编码。后来针对不同的应用需求,解除了“用于数字存储媒体”的限制,成为现在制定“活动图像和音频编码”标准的组织。MPEG组织制定的各个标准都有不同的目标和应用,目前已提出MPEG-1、MPEG-2、MPEG-4、MPEG-7和MPEG-21标准。

1.MPEG-1标准

MPEG-1标准于1993年8月公布,用于传输1.5Mbps数据传输率的数字存储媒体运动图像及其伴音的编码。该标准包括五个部分:

第一部分说明了如何根据第二部分(视频)以及第三部分(音频)的规定,对音频和视频进行复合编码。第四部分说明了检验解码器或编码器的输出比特流符合前三部分规定的过程。第五部分是一个用完整的C语言实现的编码和解码器。

该标准从颁布的那一刻起,MPEG-1取得一连串的成功,如VCD和MP3的大量使用,Windows95以后的版本都带有一个MPEG-1软件解码器,可携式MPEG-1摄像机等等。

2.MPEG-2标准

MPEG组织于1994年推出MPEG-2压缩标准,以实现视/音频服务与应用互操作的可能性。MPEG-2标准是针对标准数字电视和高清晰度电视在各种应用下的压缩方案和系统层的详细规定,编码码率从每秒3兆比特~100兆比特,标准的正式规范在ISO/IEC13818中。MPEG-2不是MPEG-1的简单升级,MPEG-2在系统和传送方面作了更加详细的规定和进一步的完善。MPEG-2特别适用于广播级的数字电视的编码和传送,被认定为SDTV和HDTV的编码标准。

MPEG-2图像压缩的原理是利用了图像中的两种特性:空间相关性和时间相关性。这两种相关性使得图像中存在大量的冗余信息。如果我们能将这些冗余信息去除,只保留少量非相关信息进行传输,就可以大大节省传输频带。而接收机利用这些非相关信息,按照一定的解码算法,可以在保证一定的图像质量的前提下恢复原始图像。一个好的压缩编码方案就是能够最大限度地去除图像中的冗余信息。

MPEG-2的编码图像被分为三类,分别称为I帧,P帧和B帧。

I帧图像采用帧内编码方式,即只利用了单帧图像内的空间相关性,而没有利用时间相关性。P帧和B帧图像采用帧间编码方式,即同时利用了空间和时间上的相关性。P帧图像只采用前向时间预测,可以提高压缩效率和图像质量。P帧图像中可以包含帧内编码的部分,即P 帧中的每一个宏块可以是前向预测,也可以是帧内编码。B帧图像采用双向时间预测,可以大大提高压缩倍数。

MPEG-2的编码码流分为六个层次。为更好地表示编码数据,MPEG-2用句法规定了一个层次性结构。它分为六层,自上到下分别是:图像序列层、图像组(GOP)、图像、宏块条、宏块、块。

MPEG-2标准在广播电视领域中的主要应用如下:

(1)视音频资料的保存

一直以来,电视节目、音像资料等都是用磁带保存的。这种方式有很多弊端:易损,占地大,成本高,难于重新使用。更重要的是难以长期保存,难以查找、难以共享。随着计算机技术和视频压缩技术的发展,高速宽带计算机网络以及大容量数据存储系统给电视台节目的网络化存储、查询、共享、交流提供了可能。

采用MPEG-2压缩编码的DVD视盘,给资料保存带来了新的希望。电视节目、音像资料等可通过MPEG-2编码系统编码,保存到低成本的CD-R光盘或高容量的可擦写DVD-RAM上,也可利用DVD编著软件(如Daikin Scenarist NT、Spruce DVDMaestro等)制作成标准的DVD视盘,既可节约开支,也可节省存放空间。

(2)电视节目的非线性编辑系统及其网络

在非线性编辑系统中,节目素材是以数字压缩方式存储、制作和播出的, 视频压缩技术是非线性编辑系统的技术基础。目前主要有M-JPEG和MPEG-2两种数字压缩格式。

M-JPEG技术即运动静止图像(或逐帧)压缩技术,可进行精确到帧的编辑,但压缩效率不高。

MPEG-2采用帧间压缩的方式,只需进行I帧的帧内压缩处理,B帧和P帧通过侦测获得,因此,传输和运算的数据大多由帧之间的时间相关性得到,相对来说,数据量小,可以实现较高的压缩比。随着逐帧编辑问题的解决,MPEG-2将广泛应用于非线性编辑系统,并大大地降低编辑成本,同时MPEG-2的解压缩是标准的,不同厂家设计的压缩器件压缩的数据可由其他厂家设计解压缩器来解压缩,这一点保证了各厂家的设备之间能完全兼容。

由于采用MPEG-2 IBP视频压缩技术,数据量成倍减少,降低了存储成本,提高了数据传输速度,减少了对计算机总线和网络带宽的压力,可采用纯以太网组建非线性编辑网络系统已成为可能,而在目前以太网是最为成熟的网络,系统管理比较完善,价格也比较低廉。

基于MPEG-2的非线性编辑系统及非线性编辑网络将成为未来的发展方向。

(3)卫星传输

MPEG-2已经通过ISO认可,并在广播领域获得广泛的应用,如数字卫星视频广播(DVB-S)、DVD视盘和视频会议等。目前,全球有数以千万计的DVB-S用户,DVB-S信号采用MPEG-2压缩格式编码,通过卫星或微波进行传输,在用户端经MPEG-2卫星接收解码器解码,以供用户观看。此外,采用MPEG-2压缩编码技术,还可以进行远程电视新闻或节目的传输和交流。

(4)电视节目的播出

在整个电视技术中播出是一个承上启下的环节,对播出系统进行数字化改造是非常必要的,其中最关键一步就是构建硬盘播出系统。MPEG-2硬盘自动播出系统因编播简便、储存容量大、视频指标高等优点,而为人们所青睐。但以往MPEG-2播出设备因非常昂贵,而只有少量使用。随着MPEG-2技术的发展和相关产品成本的下降,MPEG-2硬盘自动系统播出可望得到普及。

3.MPEG-4标准

运动图像专家组MPEG 于1999年2月正式公布了MPEG-4(ISO/IEC14496)标准第一版本。同年年底MPEG-4第二版亦告底定,且于2000年年初正式成为国际标准。

MPEG-4与MPEG-1和MPEG-2有很大的不同。MPEG-4不只是具体压缩算法,它是针对数字电视、交互式绘图应用(影音合成内容)、交互式多媒体(WWW、资料撷取与分散)等整合及压缩技术的需求而制定的国际标准。MPEG-4标准将众多的多媒体应用集成于一个完整的框架内,旨在为多媒体通信及应用环境提供标准的算法及工具,从而建立起一种能被多媒体传输、存储、检索等应用领域普遍采用的统一数据格式。

MPEG-4的编码理念是:MPEG-4标准同以前标准的最显著的差别在于它是采用基于对象的编码理念,即在编码时将一幅景物分成若干在时间和空间上相互联系的视频音频对象,分

别编码后,再经过复用传输到接收端,然后再对不同的对象分别解码,从而组合成所需要的视频和音频。这样既方便我们对不同的对象采用不同的编码方法和表示方法,又有利于不同数据类型间的融合,并且这样也可以方便的实现对于各种对象的操作及编辑。例如,我们可以将一个卡通人物放在真实的场景中,或者将真人置于一个虚拟的演播室里,还可以在互联网上方便的实现交互,根据自己的需要有选择的组合各种视频音频以及图形文本对象。

MPEG-4系统的一般框架是:对自然或合成的视听内容的表示;对视听内容数据流的管理,如多点、同步、缓冲管理等;对灵活性的支持和对系统不同部分的配置。

与MPEG-1、MPEG-2相比,MPEG-4具有如下独特的优点:

(1)基于内容的交互性

MPEG-4提供了基于内容的多媒体数据访问工具,如索引、超级链接、上下载、删除等。利用这些工具,用户可以方便地从多媒体数据库中有选择地获取自己所需的与对象有关的内容,并提供了内容的操作和位流编辑功能,可应用于交互式家庭购物,淡入淡出的数字化效果等。MPEG-4提供了高效的自然或合成的多媒体数据编码方法。它可以把自然场景或对象组合起来成为合成的多媒体数据。

(2)高效的压缩性

MPEG-4基于更高的编码效率。同已有的或即将形成的其它标准相比,在相同的比特率下,它基于更高的视觉听觉质量,这就使得在低带宽的信道上传送视频、音频成为可能。同时MPEG-4还能对同时发生的数据流进行编码。一个场景的多视角或多声道数据流可以高效、同步地合成为最终数据流。这可用于虚拟三维游戏、三维电影、飞行仿真练习等

(3)通用的访问性

MPEG-4提供了易出错环境的鲁棒性,来保证其在许多无线和有线网络以及存储介质中的应用,此外,MPEG-4还支持基于内容的的可分级性,即把内容、质量、复杂性分成许多小块来满足不同用户的不同需求,支持具有不同带宽,不同存储容量的传输信道和接收端。

这些特点无疑会加速多媒体应用的发展,从中受益的应用领域有:因特网多媒体应用;广播电视;交互式视频游戏;实时可视通信;交互式存储媒体应用;演播室技术及电视后期制作;采用面部动画技术的虚拟会议;多媒体邮件;移动通信条件下的多媒体应用;远程视频监控;通过ATM网络等进行的远程数据库业务等。MPEG-4主要应用如下:

(1)应用于因特网视音频广播

由于上网人数与日俱增,传统电视广播的观众逐渐减少,随之而来的便是广告收入的减少,所以现在的固定式电视广播最终将转向基于TCP/IP的因特网广播,观众的收看方式也由简单的遥控器选择频道转为网上视频点播。视频点播的概念不是先把节目下载到硬盘,然后再播放,而是流媒体视频(streaming video),点击即观看,边传输边播放。

现在因特网中播放视音频的有:Real Networks公司的Real Media,微软公司的Windows Media,苹果公司的QuickTime,它们定义的视音频格式互不兼容,有可能导致媒体流中难以控制的混乱,而MPEG-4为因特网视频应用提供了一系列的标准工具,使视音频码流具有规范一致性。因此在因特网播放视音频采用MPEG-4,应该说是一个安全的选择。

(2)应用于无线通信

MPEG-4高效的码率压缩,交互和分级特性尤其适合于在窄带移动网上实现多媒体通信,未来的手机将变成多媒体移动接收机,不仅可以打移动电视电话、移动上网,还可以移动接收多媒体广播和收看电视。

(3)应用于静止图像压缩

静止图像(图片)在因特网中大量使用,现在网上的图片压缩多采用JPEG技术。MPEG-4中的静止图像(纹理)压缩是基于小波变换的,在同样质量条件下,压缩后的文件大小约是JPEG压缩文件的十分之一。把因特网上使用的JPEG图片转换成MPEG-4格式,可以大幅度提高图片在网络中的传输速度。

(4)应用于电视电话

传统用于窄带电视电话业务的压缩编码标准,如H261,采用帧内压缩、帧间压缩、减少象素和抽帧等办法来降低码率,但编码效率和图像质量都难以令人满意。MPEG-4的压缩编码可以做到以极低码率传送质量可以接受的声像信号,使电视电话业务可以在窄带的公用电话网上实现。

(5)应用于计算机图形、动画与仿真

MPEG-4特殊的编码方式和强大的交互能力,使得基于MPEG-4的计算机图形和动画可以从各种来源的多媒体数据库中获取素材,并实时组合出所需要的结果。因而未来的计算机图形可以在MPEG-4语法所允许的范围内向所希望的方向无限发展,产生出今天无法想象的动画及仿真效果。

(6)应用于电子游戏

MPEG-4可以进行自然图像与声音同人工合成的图像与声音的混合编码,在编码方式上具有前所未有的灵活性,并且能及时从各种来源的多媒体数据库中调用素材。这可以在将来产生象电影一样的电子游戏,实现极高自由度的交互式操作。

4.MPEG-7标准

MPEG-7标准被称为“多媒体内容描述接口”,为各类多媒体信息提供一种标准化的描述,这种描述将与内容本身有关,允许快速和有效的查询用户感兴趣的资料。它将扩展现有内容识别专用解决方案的有限的能力,特别是它还包括了更多的数据类型。换而言之,MPEG-7规定一个用于描述各种不同类型多媒体信息的描述符的标准集合。该标准于1998年10月提出。

MPEG-7的目标是支持多种音频和视觉的描述,包括自由文本、N维时空结构、统计信息、客观属性、主观属性、生产属性和组合信息。对于视觉信息,描述将包括颜色、视觉对象、纹理、草图、形状、体积、空间关系、运动及变形等。

MPEG-7的目标是根据信息的抽象层次,提供一种描述多媒体材料的方法以便表示不同层次上的用户对信息的需求。以视觉内容为例,较低抽象层将包括形状、尺寸、纹理、颜色、运动(轨道)和位置的描述。对于音频的较低抽象层包括音调、调式、音速、音速变化、音响空间位置。最高层将给出语义信息:如“这是一个场景:一个鸭子正躲藏在树后并有一个汽车正在幕后通过。”抽象层与提取特征的方式有关:许多低层特征能以完全自动的方式提取,而高层特征需要更多人的交互作用。MPEG-7还允许依据视觉描述的查询去检索声音数据,反之也一样。

MPEG-7的目标是支持数据管理的灵活性、数据资源的全球化和互操作性。

MPEG-7标准化的范围包括:一系列的描述子(描述子是特征的表示法,一个描述子就是定义特征的语法和语义学);一系列的描述结构(详细说明成员之间的结构和语义);一种详细说明描述结构的语言、描述定义语言(DDL);一种或多种编码描述方法。

在源视频、码率一定时,目前而言,常用的粗略可以排个先后:

1.H264、RMVB、VP9,一流编码器

2.mpeg4、xvid、divx、rm......,二流

3.mpeg2......,三流

高1级的编码可在码率50%时,达到低1级的同等水平。

】流行的视频格式优缺点对比以及最好的视频格式

2011-05-14 22:04

转载自lucky_times_1

最终编辑w十m

AVI格式:它的英文全称为Audio Video Interleaved,即音频视频交错格式。

它于1992年被Microsoft公司推出,随Windows3.1一起被人们所认识和熟知。

所谓“音频视频交错”,就是可以将视频和音频交织在一起进行同步播放。

这种视频格式的优点是图像质量好,可以跨多个平台使用,其缺点是体积过于庞大,

而且更加糟糕的是压缩标准不统一

MPEG格式:它的英文全称为Moving Picture Expert Group,即运动图像专家组格式,

家里常看的VCD、SVCD、DVD就是这种格式。MPEG文件格式是运动图像压缩算法的国际标准,

它采用了有损压缩方法减少运动图像中的冗余信息,说的更加明白一点就是MPEG的压缩方法依

据是相邻两幅画面绝大多数是相同的,把后续图像中和前面图像有冗余的部分去除,

从而达到压缩的目的(其最大压缩比可达到200:1)。目前MPEG格式有三个压缩标准,

分别是MPEG-1、MPEG-2、和MPEG-4,另外,MPEG-7与MPEG-21仍处在研发阶段。

MPEG-1:制定于1992年,它是针对1.5Mbps以下数据传输率的数字存储媒体运动图像及其伴音编码而设计的国际标准。也就是我们通常所见到的VCD制作格式。

使用MPEG-1的压缩算法,可以把一部120分钟长的电影压缩到1.2GB左右大小。

这种视频格式的文件扩展名包括.mpg、.mlv、.mpe、.mpeg及VCD光盘中的.dat文件等。

MPEG-2:制定于1994年,设计目标为高级工业标准的图像质量以及更高的传输率。

这种格式主要应用在DVD/SVCD的制作(压缩)方面,同时在一些HDTV(高清晰电视广播)和一些高要求视频编辑、处理上面也有相当的应用。使用MPEG-2的压缩算法,

可以把一部120分钟长的电影压缩到4到8GB的大小。这种视频格式的文件扩展名

包括.mpg、.mpe、.mpeg、.m2v及DVD光盘上的.vob文件等。

MPEG-4:制定于1998年,MPEG-4是为了播放流式媒体的高质量视频而专门设计的,它可利用很窄的带度,通过帧重建技术,压缩和传输数据,以求使用最少的数据获得最

佳的图像质量。目前MPEG-4最有吸引力的地方在于它能够保存接近于DVD画质的小体积

视频文件。

另外,这种文件格式还包含了以前MPEG压缩标准所不具备的比特率的可伸缩性、动画精灵、交互性甚至版权保护等一些特殊功能。这种视频格式的文件扩展名包括.asf、.mov和DivX AVI 等。

DivX格式:这是由MPEG-4衍生出的另一种视频编码(压缩)标准,也即我们通常所说的DVDrip格式,

它采用了MPEG4的压缩算法同时又综合了MPEG-4与MP3各方面的技术,说白了就是

使用DivX压缩技术对DVD盘片的视频图像进行高质量压缩,同时用MP3或AC3对音频进行压缩,

然后再将视频与音频合成并加上相应的外挂字幕文件而形成的视频格式。

其画质直逼DVD并且体积只有DVD的数分之一。这种编码对机器的要求也不高,

所以DivX视频编码技术可以说是一种对DVD造成威胁最大的新生视频压缩格式,

号称DVD杀手或DVD终结者。

MOV格式:美国Apple公司开发的一种视频格式,默认的播放器是苹果的QuickTimePlayer。具有较高的压缩比率和较完美的视频清晰度等特点,但是其最大的特点还是跨平台性,

即不仅能支持MacOS,同样也能支持Windows系列。.

ASF格式:它的英文全称为Advanced Streaming format,它是微软为了和现在的Real Player 竞争

而推出的一种视频格式,用户可以直接使用Windows自带的Windows Media Player对其进行播放。

由于它使用了MPEG-4的压缩算法,所以压缩率和图像的质量都很不错(高压缩率有利于视频流

的传输,但图像质量肯定会的损失,所以有时候ASF格式的画面质量不如VCD是正常的)。

WMV格式:它的英文全称为Windows Media Video,也是微软推出的一种采用独立编码

方式并且可以直接在网上实时观看视频节目的文件压缩格式。WMV格式的主要优点包括:本地或网络回放、可扩充的媒体类型、部件下载、可伸缩的媒体类型、流的优先级化、

多语言支持、环境独立性、丰富的流间关系以及扩展性等。

RM格式:Real Networks公司所制定的音频视频压缩规范称为Real Media,

用户可以使用RealPlayer或RealOne Player对符合RealMedia技术规范的网络音频/视频资源进行实况转播并且RealMedia可以根据不同的网络传输速率制定出不同的压缩比率,

从而实现在低速率的网络上进行影像数据实时传送和播放。这种格式的另一个特点是

用户使用RealPlayer或RealOne Player播放器可以在不下载音频/视频内容的条件下实

现在线播放。另外,RM作为目前主流网络视频格式,它还可以通过其Real Server服务器

将其它格式的视频转换成RM视频并由Real Server服务器负责对外发布和播放。

RM和ASF格式可以说各有千秋,通常RM视频更柔和一些,而ASF视频则相对清晰一些。

RMVB格式:这是一种由RM视频格式升级延伸出的新视频格式,它的先进之处

在于RMVB视频格式打破了原先RM格式那种平均压缩采样的方式,在保证平均压缩比

的基础上合理利用比特率资源,就是说静止和动作场面少的画面场景采用较低的编码速率,

这样可以留出更多的带宽空间,而这些带宽会在出现快速运动的画面场景时被利用。

这样在保证了静止画面质量的前提下,大幅地提高了运动图像的画面质量,从而图像质量和文件大小之间就达到了微妙的平衡。另外,相对于DVDrip格式,RMVB视频也是有着较明显

的优势,一部大小为700MB左右的DVD影片,如果将其转录成同样视听品质的RMVB格式,其个头最多也就400MB左右。不仅如此,这种视频格式还具有内置字幕和无需外挂插件

支持等独特优点。要想播放这种视频格式,可以使用RealOne Player2.0或RealPlayer8.0加RealVideo9.0以上版本的解码器形式进行播放。

目前最好是real的rmvb格式,稍次一点的就是微软的wmv格式网上下载的电影大部分都是rm和rmvb格式

MPEG/.MPG/.DAT

MPEG是Motion Picture Experts Group 的缩写。这类格式包括了MPEG-1, MPEG-2 和MPEG-4在内的多种视频格式。MPEG-1相信是大家接触得最多的了,因为目前其正在被广泛地应用在VCD 的制作和一些视频片段下载的网络应用上面,大部分的VCD 都是用MPEG1 格式压缩的( 刻录软件自动将MPEG1转为.DAT格式) ,使用MPEG-1 的压缩算法,可以把一部120 分钟长的电影压缩到1.2 GB 左右大小。MPEG-2 则是应用在DVD 的制作,同时在一些HDTV(高清晰电视广播)和一些高要求视频编辑、处理上面也有相当多的应用。使用MPEG-2 的压缩算法压缩一部120 分钟长的电影可以压缩到5-8 GB 的大小(MPEG2的图像质量是MPEG-1 无法比拟的)。

AVI

AVI,音频视频交错(Audio Video Interleaved)的英文缩写。AVI这个由微软公司发表的视频格式在视频领域已经存在好几个年头了。AVI格式调用方便、图像质量好,但缺点就是文件体积过于庞大。

MOV

使用过Mac机的朋友应该多少接触过QuickTime。QuickTime原本是Apple公司用于Mac 计算机上的一种图像视频处理软件。Quick-Time提供了两种标准图像和数字视频格式, 即可以支持静态的*.PIC和*.JPG图像格式,动态的基于Indeo压缩法的*.MOV和基于MPEG压缩法的*.MPG视频格式。

ASF

ASF (Advanced Streaming format高级流格式)。ASF 是MICROSOFT 为了和现在的Real player 竞争而发展出来的一种可以直接在网上观看视频节目的文件压缩格式。ASF使用了MPEG4 的压缩算法,压缩率和图像的质量都很不错。因为ASF 是以一个可以在网上即时观赏的视频“流”格式存在的,所以它的图像质量比VCD 差一点点并不出奇,但比同是视频“流”格式的RAM 格式要好。

WMV

一种独立于编码方式的在Internet上实时传播多媒体的技术标准,Microsoft公司希望用其取代QuickTime之类的技术标准以及WAV、AVI之类的文件扩展名。WMV的主要优点在于:可扩充的媒体类型、本地或网络回放、可伸缩的媒体类型、流的优先级化、多语言支持、扩展性等。

n AVI

如果发现原来的播放软件突然打不开此类格式的AVI文件,那你就要考虑是不是碰到了n AVI。n AVI是New AVI 的缩写,是一个名为Shadow Realm 的地下组织发展起来的一种新视频格式。它是由Microsoft ASF 压缩算法的修改而来的(并不是想象中的AVI),视频格式追求的无非是压缩率和图像质量,所以NAVI 为了追求这个目标,改善了原始的ASF 格式的一些不足,让NAVI 可以拥有更高的帧率。可以这样说,NAVI 是一种去掉视频流特性的改良型ASF 格式。

3GP

3GP是一种3G流媒体的视频编码格式,主要是为了配合3G网络的高传输速度而开发的,也是目前手机中最为常见的一种视频格式。

简单的说,该格式是“第三代合作伙伴项目”(3GPP)制定的一种多媒体标准,使用户能使用手机享受高质量的视频、音频等多媒体内容。其核心由包括高级音频编码(AAC)、自适应多速率(AMR) 和MPEG-4 和H.263 视频编码解码器等组成,目前大部分支持视频拍摄的手机都支持3GPP格式的视频播放。

QuickTime

QuickTime(MOV)是Apple(苹果)公司创立的一种视频格式,在很长的一段时间里,它都是只在苹果公司的MAC 机上存在。后来才发展到支持WINDOWS 平台的,但平心而论,它无论是在本地播放还是作为视频流格式在网上传播,都是一种优良的视频编码格式。到目前为止,它共有4 个版本,其中以4.0 版本的压缩率最好!

REAL VIDEO

REAL VIDEO (RA、RAM)格式由一开始就是定位就是在视频流应用方面的,也可以说是视频流技术的始创者。它可以在用56K MODEM 拨号上网的条件实现不间断的视频播放,当然,其图像质量和MPEG2、DIVX 等比是不敢恭维的啦。毕竟要实现在网上传输不间断的视频是需要很大的频宽的,这方面是ASF 的有力竞争者。

MKV

一种后缀为MKV的视频文件频频出现在网络上,它可在一个文件中集成多条不同类型的音轨和字幕轨,而且其视频编码的自由度也非常大,可以是常见的DivX、XviD、3IVX,甚至可以是RealVideo、QuickTime、WMV 这类流式视频。实际上,它是一种全称为Matroska 的新型多媒体封装格式,这种先进的、开放的封装格式已经给我们展示出非常好的应用前景。

DIVX

DIVX 视频编码技术可以说是一种对DVD 造成威胁的新生视频压缩格式(有人说它是DVD 杀手),它由Microsoft mpeg4v3 修改而来,使用MPEG4 压缩算法。同时它也可以说是为了打破ASF 的种种协定而发展出来的。

FLV

FLV 是FLASH VIDEO的简称,FLV流媒体格式是一种新的视频格式。由于它形成的文件极小、加载速度极快,使得网络观看视频文件成为可能,它的出现有效地解决了视频文件导入Flash后,使导出的SWF文件体积庞大,不能在网络上很好的使用等缺点。视频编码准确的说,AVI,ASF,FLV是一种文件格式,我们可以在我的电脑上看到的*.AVI这种文件。即

使是同一种文件格式,如AVI,又分为MPEG-1,MPEG-2 ,MPEG-4几种视频格式,然后同一种视频格式,如MPEG-4又可以使用多种视频编码,例如:MP4V/XVID/DX50/DIVX/DIV5/3IVX/3IV2/RMP4。

1、Microsoft RLE

一种8位的编码方式,只能支持到256色。压缩动画或者是计算机合成的图像等具有大面积色块的素材可以使用它来编码,是一种无损压缩方案。

2、Microsoft Video 1

用于对模拟视频进行压缩,是一种有损压缩方案,最高仅达到256色,它的品质就可想而知,一般还是不要使用它来编码AVI。

3、Microsoft H.261和H.263 Video Codec

用于视频会议的Codec,其中H.261适用于ISDN、DDN线路,H.263适用于局域网,不过一般机器上这种Codec是用来播放的,不能用于编码。

4、Intel Indeo Video R3.2

所有的Windows版本都能用Indeo video 3.2播放AVI编码。它压缩率比Cinepak大,但需要回放的计算机要比Cinepak的快。

5、Intel Indeo Video 4和5

常见的有4.5和5.10两种,质量比Cinepak和R3.2要好,可以适应不同带宽的网络,但必须有相应的解码插件才能顺利地将下载作品进行播放。适合于装了Intel公司MMX以上CPU的机器,回放效果优秀。如果一定要用AVI的话,推荐使用5.10,在效果几乎一样的情况下,它有更快的编码速度和更高的压缩比。

6、Intel IYUV Codec

使用该方法所得图像质量极好,因为此方式是将普通的RGB色彩模式变为更加紧凑的YUV色彩模式。如果你想将AVI压缩成MPEG-1的话,用它得到的效果比较理想,只是它的生成的文件太大了

7、Microsoft MPEG-4 Video codec

常见的有1.0、2.0、3.0三种版本,当然是基于MPEG-4技术的,其中3.0并不能用于AVI的编码,只能用于生成支持“视频流”技术的ASF文件。

8、DivX- MPEG-4 Low-Motion/Fast-Motion

实际与Microsoft MPEG-4 Video code是相当的东西,只是Low-Motion采用的固定码率,Fast-Motion采用的是动态码率,后者压缩成的AVI几乎只是前者的一半大,但质量要差一些。Low-Motion适用于转换DVD以保证较好的画质,Fast-Motion用于转换VCD以体现MPEG-4短小精悍的优势。

9 、DivX 3.11/4.12/5.0

实际上就是DivX,原来DivX是为了打破Microsoft的ASF规格而开发的,现在开发组摇身一变成了Divxnetworks公司,所以不断推出新的版本,最大的特点就是在编码程序中加入了1-pass和2-pass的设置,2-pass相当于两次编码,以最大限度地在网络带宽与视觉效果中取得平衡。

国际主流视频编码标准优化代码的对比测试-文档资料

国际主流视频编码标准优化代码的对比测试 王中元(1972- ),男,湖北英山人,讲师,博士,主要研究方向为视频编/ 解码、多媒体通信; 朱福喜(1957- ),男,湖北新洲人,教授,博导,博士,主要研究方向为人工智能等. (武汉大学a. 计算机学院; b. 国家多媒体软件工程技术研究中心; c. 档案馆,武汉430072) 以H.263、MPEG-4、H.264 三种标准作为测试对象,在 Win/Intel 平台上测试了优化后编码器的计算效率、编码效率和码率控制精度,并对测试结果进行了比较和分析。测试数据为开发人员在一定硬件性价比的约束条件下实现视频编码器提供了参考。 Test?Band?Bcomparison?Bon?Boptimized?Bcode?Bof?Bmajor?B international?Bvideo?Bcoding?Bstandards LI Naa,c, WANG Zhong-yuanb, ZHU Fu-xia (a.School of Computer, b.National Multimedia Software Engineering Research Center, c.Archives, Wuhan University, Wuhan 430072, China) This paper selected H.263,MPEG-4 and H.264 video

coding standards as test object to measure such performance index as compression efficiency,calculation efficiency and rate control accuracy on Win/Intel platform. And illustrated the-analysis and comparison on experiment results too. These test datum could be served as a reference guide for designer who would develop video coding application with the constraint on hardware performance and price ratio. 几乎在每一种视频标准的制定过程中或者发布后,都有专家将该标准与它前期的同类标准作压缩效率和计算复杂度的客观比较测试[1] 。这些测试数据尽管有它一定的学术意义,但是对实际开发的指导价值非常有限。其原因有两点:a) 测试过程往往涵盖了编码工具的全集,而在实际应用中不太可能启用所有编码选项,因此,这样测试的压缩效率数据已经背离了实际应用条件; b) 在计算复杂度的对比测试中,一般均使用伴随标准发布的参考源码,而这些源码仅仅是用来验证算法的,它充其量也只是对算法的一种数学描述。在标准的实现过程中,免不了要对编/ 解码器(CODE)展开算法优化和代码 优化,这些优化往往又要结合

多媒体技术基础(数据压缩、标准、音频、图像)作业及答案

第二章作业 作业总体要求: 1.认真独立的完成 2.让文件名重新命名为自己的学号,然后通过http://10.66.4.241提交。 一.选择题 1.下列说法中不正确的是【B】。 A.有损压缩法会减少信息量 B.有损压缩法可以无失真地恢复原始数据 C.有损压缩法是有损压缩 D.有损压缩法的压缩比一般都比较大 2.下列属于无损压缩的是【B 】。 A.WA VE文件压缩成MP3文件 B.TXT文件压缩成RAR文件 C. BMP文件压缩成JPEG文件 D.A VI文件压缩成RM文件 3.图像序列中的两幅相邻图像,后一幅图像与前一幅图像之间有较大的相关, 这是【 D 】。 A. 空间冗余 B.时间冗余 C.信息熵冗余 D.视觉冗余 4.衡量数据压缩技术性能好坏的主要指标是【C】。 (1)压缩比(2)算法复杂度(3)恢复效果(4)标准化 A. (1)(3) B. (1)(2)(3) C. (1)(3)(4) D.全部 5.MPEG标准不包括下列哪些部分【C 】。 A.MPEG视频 B.MPEG音频 C.MPEG系统 D.MPEG编码 6.下列属于静态图像编码和压缩标准的是【B 】。 A.JPEG B.MPEG-1 C.MPEG-2 D.MPEG-4 7.声音信号是声波振幅随时间变化的【A 】信号. A.模拟 B.数字

C.无规律 D.有规律 8.在数字视频信息获取与处理过程中,下述顺序正确的是【A 】。 A.采样、A/D变换、压缩、存储、解压缩、D/A变换 B.采样、D/A变换、压缩、存储、解压缩、A/D变换 C.采样、压缩、A/D变换、存储、解压缩、D/A变换 D.采样、压缩、D/A变换、存储、解压缩、A/D变换 9.一般来说,表示声音的质量越高,则【C 】 A.量化位数越多和采样频率越低 B.量化位数越少和采样频率越低 C.量化位数越多和采样频率越高 D.量化位数越少和采样频率越高 10.5分钟双声道、16位采样位数、44.1kHZ采样频率声音的不压缩数据量是 【 B 】。 A. 48.47MB B. 50.47MB C. 105.84MB D. 25.23MB 11.下列采集的波形声音【 D 】的质量最好。 A、单声道,8位量化,22.05kHz采样频率 B、双声道,8位量化,44.1kHz采样频率 C、单声道,16位量化,22.05kHz采样频率 D、双声道,16位量化,44.1kHz采样频率 12.频率在20HZ-20KHZ的被称为【 A 】 A. 可听声波 B. 次声波 C.超声波 D.超音波 13.MIDI是音乐与【 A 】结合的产物. A.计算机 B.通信 C.高科技 D.通讯 14.Windows中使用录音机录制的声音文本的格式是【B 】 A. MIDI B.WA V C.MP3 D.MOD

视频编码标准汇总及比较

视频编码标准汇总及比较 MPEG-1 类型:Audio&Video 制定者:MPEG(Moving Picture Expert Group) 所需频宽:2Mbps 特性:对动作不激烈的视频信号可获得较好的图像质量,但当动作激烈时,图像就会产生马赛克现象。它没有定义用于额外数据流进行编对码的格式,因此这种技术不能广泛推广。它主要用于家用VCD,它需要的存储空间比较大。 优点:对动作不激烈的视频信号可获得较好的图像质量。 缺点:当动作激烈时,图像就会产生马赛克现象。它没有定义用于额外数据流进行编对码的格式,因此这种技术不能广泛推广。 应用领域:Mixer 版权方式:Free 备注:MPEG-1即俗称的VCD。MPEG是ISO/IEC JTC1 1988年成立的运动图像专家组(Moving Picture Expert Group)的简称,负责数字视频、音频和其他媒体的压缩、解压缩、处理和表示等国际技术标准的制定工作。MPEG-1制定于1992年,它是将视频数据压缩成1~2Mb/s的标准数据流。对于清晰度为352×288的彩色画面,采用25帧/秒,压缩比为50:1时,实时录像一个小时,经计算可知需存储空间为600MB左右,若是8路图像以每天录像10小时,每月30天算,则要求硬盘存储容量为1440GB,则显然是不能被接受的。 --------------------------------------------------------------------------------------------- MPEG-2

类型:Audio&Video 制定者:MPEG(Moving Picture Expert Group) 所需频宽:视频上4.3Mbps,音频上最低的采样率为16kHz 特性:编码码率从每秒3兆比特~100兆比特,是广播级质量的图像压缩标准,并具有CD 级的音质。MPEG-2的音频编码可提供左、右、中及两个环绕声道,以及一个加重低音声道,和多达7个伴音声道。作为MPEG-1的兼容性扩展,MPEG-2支持隔行扫描视频格式和其它先进功能,可广泛应用在各种速率和各种分辨率的场合。但是MPEG-2标准数据量依然很大,不便存放和传输。 优点:MPEG-2的音频编码可提供左、右、中及两个环绕声道,以及一个加重低音声道,和多达7个伴音声道,具有CD级的音质。可提供一个较广的范围改变压缩比,以适应不同画面质量、存储容量以及带宽的要求。支持隔行扫描视频格式和其它先进功能,可广泛应用在各种速率和各种分辨率的场合。 缺点:压缩比较低,数据量依然很大,不便存放和传输,如用于网络方面则需要较高的网络带宽,因此不太适合用于Internet和VOD点播方面。 应用领域:Mixer 版税方式:按个收取(最初的收费对象为解码设备和编码设备,中国DVD制造商每生产一台DVD需要交纳专利费16.5美元。向解码设备和编码设备收取的专利授权费每台2.5美元) 备注:MPEG-2是其颁布的(活动图像及声音编码)国际标准之一,制定于1994年,是为高级工业标准的图像质量以及更高的传输率而设计,为了力争获得更高的分辨率 (720×486),提供广播级视频和CD级的音频,它是高质量视频音频编码标准。在常规电视的数字化、高清晰电视HDTV、视频点播VOD,交互式电视等各个领域中都是核心的技术之一。由于MPEG-2在设计时的巧妙处理,使得大多数MPEG-2解码器也可播放MPEG-1格式的数据,如VCD。MPEG-2的音频编码可提供左、右、中及两个环绕声道,以及一个加重低音声道,和多达7个伴音声道。我们平时所说的DVD就是采用MPEG-2编码压缩,所以可有8种语言的配音。除了作为DVD的指定标准外,MPEG-2的应用前景非常的广阔,

视频压缩编码及常用格式

视频压缩编码及常用格式 数据压缩编码已经拥有很长的历史,压缩编码的理论基础是信息论。从信息的角度看,压缩就是去除数据中的消除冗余。即保留不确定的信息,去除确定的信息,用一种更接近信息本质的描述来代替原有冗余的描述压缩的目的是在尽可能保证视觉效果的前题下减少数据率。视频压缩比是指压缩后的数据量与压缩前的数据量之比。由于视频是连续的静态图像,因此其压缩编码算法与静态图像的压缩算法有某些共同的地方,但是运动的视频还有其本身的特性,因此在压缩是还要考虑其运动特性,这样才能达到高效果压缩的目的。 自从上世纪四十年代第一台电视机问世以来,视频技术的研究与应用已经有近六十年的历史。当前电视技术均为模拟视频技术,经过几十年的发展和完善,已经十分成熟。世界通行的模拟电视制式主要有:PAL(欧洲、中国)NTSC(北美、日本)和SECAM(法国)。 随着计算机技术近二十年的发展,特别是九十年代以来互联网的广泛应用,多媒体数字视频技术已经成为了当前信息科学中十分活跃的研究方向。数字化技术的引用。使得对视频信号的捕获、处理、压缩和储存都有了革命性的进步特别是在视频数据的压缩和储存上。国际电信联合会(ITC)于1990年正式提出了ITU-TH261建议,这是第一个关于使用化视频图像压缩编码的国际标准提议。九十年代中,IUT在该建议上提出了MPEG1、MPEG2、MPEG4、H.263和JPEG2000等压缩标准。这些标准的制定和颁布,极大的促进了数字视频压缩与编码技术的研究和实用化。 视频编码标准的发展 视频编码技术在近年得到了迅速的发展和广泛的应用,并在日渐成熟,起标准是多个视频编码国际化标准的制定与应用,即国际标准化组织ISO和国际电工委员会IEC关于静态图像的编码标准JPEG、国际电信联盟ITU-T关于电视、电话会议的视频编码标准H261、H.263及H.264和ISO/TEC关于活动图像的编码标准MPEG-1,MPEG-2、MPEG-4等。这些标准图像编码算法融合了各种性能优良的图像编码方法,代表了目前编码的发张水平。 MPEG-1 MPEG-1标准于1993年8月公布,用于传输1.5Mbps数据传输的数据储存媒体运动图像及其伴音的编码。该标准包括五个部分:第一:说明如何根据第二部(视频)以及第三部分(音频)的规定,对音频和视频进行复合编码。第四部分说明检验解码器或编码器的输出比流符合前三部分规定的过程。第五部分是一个用完整的C语言实现的编码和解码器。 MPEG-1取得一连串的成功,如VCD和MP3的大量使用,可携式MPEG-1摄像

常见的几种高清视频编码格式

高清视频的编码格式有五种,即H.264、MPEG-4、MPEG-2、WMA-HD以及VC-1。事实上,现在网络上流传的高清视频主要以两类文件的方式存在:一类是经过MPEG-2标准压缩,以tp和ts为后缀的视频流文件;一类是经过WMV-HD(Windows Media Video High Definition)标准压缩过的wmv文件,还有少数文件后缀为avi或mpg,其性质与wmv是一样的。真正效果好的高清视频更多地以H.264与VC-1这两种主流的编码格式流传。 H.264编码 H.264编码高清视频 H.264是由国际电信联盟(iTU-T)所制定的新一代的视频压缩格式。H.264 最具价值的部分是更高的数据压缩比,在同等的图像质量,H.264的数据压缩比能比当前DVD系统中使用的 MPEG-2高2~3倍,比MPEG-4高1.5~2倍。正因为如此,经过H.264压缩的视频数据,在网络传输过程中所需要的带宽更少,也更加经济。在 MPEG-2需要6Mbps的传输速率匹配时,H.264只需要1Mbps~2Mbps 的传输速率,目前H.264已经获得DVD Forum与Blu-ray Disc Association采纳,成为新一代HD DVD的标准,不过H.264解码算法更复杂,计算要求比WMA-HD 还要高。 从ATI的Radeon X1000系列显卡、NVIDIA的GeForce 6/7系列显卡开始,它们均加入对H.264硬解码的支持。与MPEG-4一样,经过H.264压缩的视频文件一般也是采用avi 作为其后缀名,同样不容易辨认,只能通过解码器来自己识别。 总的来说,常见的几种高清视频编码格式的特点是能够以更低的码率得到更高的画质,相同效果的MPEG2与H.264影片做比较,后者在容量上仅需前者的一半左右。这也就意味着,H.264不仅能够节省HDTV的存储空间,而且还可以

多媒体技术基础课程作业(含标准答案)

多媒体技术基础课程作业(5套) 多媒体技术基础课程作业_A 历次成绩完成时间查看详情 1.0.0 2015-12-25 08:38:45 查看 2.0.0 2015-12-25 08:38:32 查看 3.0.0 2015-12-25 08:38:06 查看 4.0.0 2015-12-25 08:37:56 查看 5.0.0 2015-12-25 08:37:48 查看 关闭多媒体技术基础课程作业_A 多媒体技术基础课程作业_A 用户名: 一单选题 1. 下面哪个不是常用的图像文件的后缀? () A. GIF B. BMP C. MID D. TIF 本题分值: 4.0

标准答案: C. MID 2. MIDI是()。 A.一种音乐编码格式 B.是乐器数字接口 C.是模拟音乐 D.是压缩格式音乐 本题分值: 4.0 标准答案: B.是乐器数字接口 3. 以下图像格式中哪个不是压缩格式?() A. TIF B. JPG C. GIF D. BMP 本题分值: 4.0 标准答案: D. BMP

4. Authorware采用()的程序设计方法,使多媒体的创作更加便捷,即使是非专业人员也可以利用它进行多媒体制作。 A.基于图层和模板 B.基于图层和时间帧 C.基于页和语言 D.基于图标和流程图 本题分值: 4.0 标准答案: D.基于图标和流程图 5. 以下软件是不是图像加工工具() A、画图 B、Photoshop C、我形我素 D、Frontpage 本题分值: 4.0 标准答案:D、Frontpage

6. 视频会议系统最著名的标准是:() A.h.261和h.263 B.h.320和h.120 C.g.723和g.728 D.g.722和t.127 本题分值: 4.0 标准答案: B.h.320和h.120 7. () A.多媒体技术是一种计算机技术 B.电视技术也属于多媒体技术的范畴 C.多媒体技术可以用来建立人、机之间的交互 D.多媒体技术面向对象进行综合处理,并建立逻辑关系。本题分值: 4.0 标准答案: B.电视技术也属于多媒体技术的范畴

视频压缩编码标准H.264详解

视频压缩编码标准H.264详解 ——新疆大学2006级工硕郭新军 JVT(Joint Video Team,视频联合工作组)于2001年12月在泰国Pattaya 成立。它由ITU-T和ISO两个国际标准化组织的有关视频编码的专家联合组成。JVT的工作目标是制定一个新的视频编码标准,以实现视频的高压缩比、高图像质量、良好的网络适应性等目标。目前JVT的工作已被ITU-T接纳,新的视频压缩编码标准称为H.264标准,该标准也被ISO接纳,称为AVC(Advanced Video Coding)标准,是MPEG-4的第10部分。 H.264标准可分为三档: 基本档次(其简单版本,应用面广); 主要档次(采用了多项提高图像质量和增加压缩比的技术措施,可用于SDTV、HDTV和DVD等); 扩展档次(可用于各种网络的视频流传输)。 H.264不仅比H.263和MPEG-4节约了50%的码率,而且对网络传输具有更好的支持功能。它引入了面向IP包的编码机制,有利于网络中的分组传输,支持网络中视频的流媒体传输。H.264具有较强的抗误码特性,可适应丢包率高、干扰严重的无线信道中的视频传输。H.264支持不同网络资源下的分级编码传输,从而获得平稳的图像质量。H.264能适应于不同网络中的视频传输,网络亲和性好。 一、H.264视频压缩系统 H.264标准压缩系统由视频编码层(VCL)和网络提取层(Network Abstraction Layer,NAL)两部分组成。VCL中包括VCL编码器与VCL解码器,主要功能是视频数据压缩编码和解码,它包括运动补偿、变换编码、熵编码等压缩单元。NAL则用于为VCL提供一个与网络无关的统一接口,它负责对视频数据

H.264视频编码标准分析和算法优化

H.264编码标准的分析和算法优化 一、研究背景: 随着社会的不断进步和多媒体信息技术的发展,人们对信息的需求越来越丰富,方便、快捷、灵活地通过语音、数据、图像与视频等方式进行多媒体通信已成不可或缺的工具。其中视觉信息给人们直观、生动的形象,因此图像与视频的传输更受到广泛的关注。然而,视频数据具有庞大的数据量,以普通的25帧每秒,CIF格式(分辨率为352×288)的视频图像为例,一秒钟的原始视频数据速率高达3.8M字节。不对视频信号进行压缩根本无法实时传输如此庞大的数据量,因此,视频压缩技术成为研究热点。 随着近几年来视频图像传输领域的不断扩展,以往的标准己经难于适应不同信道的传输特征及新兴的应用环境。为此,ISO/IEC&ITU-T共同开发了最新视频编码标准H.264/AVC。相对以前的视频编码标准,H.264集成了许多新的视频压缩技术,具有更高的压缩效率和图像质量。在同等的图像质量条件下,H.264的数据压缩比是应用于当前DVD系统MPEG-2的2~3倍,比MPEG-4高1.5~2倍,并且具有更好的网络友好性。但是H.264高压缩比的代价是编码器计算复杂度大幅度地提高。因此在保持编码效率几乎不变的同时尽可能提高编码速度是H.264/AVC视频编码标准能否得到广泛应用的关键。 在上述研究背景下,本文深入探讨了H.264/AVC标准,分析了编码器主要耗时模块的工作原理,提出三种降低H.264/AVC高计算复杂度的优化算法――快速帧内预测模式选择算法、快速帧间预测模式选择算法以及快速运动估计算法。实验结果表明:本文所提快速算法都可大幅度地降低H.264编码器的计算复杂度,并且保持基本不变的编码效率。 二、新一代视频编码标准H.264简介: 编码标准演进过程:H.261 MPEG-1 MPEG-2 H.263 MPEG-4 从视频编码标准的发展历程来看,视频编码标准都有一个不断追求的目标:在尽可能低的码率(或存储容量)下获得尽可能好的图像质量。MPEG-2、MPEG-4、H.263等标准都取得了巨大的成功,但在应用中也发现一些问题。H.263众多的选项往往令使用者无所适从;MPEG-2压缩效率己显略低;引人注目的MPEG-4的“基于对象的编码”由于尚有技术障碍,目前还难以普遍应用。在此背景下,两大国际标准化组织ITU-T和ISO共同制定了新一代视频编码标准H.264。该编码标准在混合编码的框架下引入新的编码方式,解决了目前编码标 准存在的问题,进一步贴近实际应用,其应用前景是不言而喻的。 三、H.264视频编码标准概述 JVT的工作目标是制定一个新的视频编码标准,以实现视频的高压缩比、高图像质量、良好的网络适应性等目标。JVT的工作已于2003年3月被ITU-T采纳,新的视频编码标准称为H.264标准。该标准也被ISO采纳,称为AVC(Advanced Video Coding)标准,是国际标准ISO14496-10(MPEG-4的第10部分),因此总称为H.264/AVC。 H.264着重于提高压缩效率和传输的可靠性,因而其应用面十分广泛。具体来说,H.264支持三个不同档次的应用: 1、基本档次:H.264简单版本,应用面广,主要用于视频会话,如会议电视、可视电话、远程医疗、远程教学等。 2、主要档次:采用了多项提高图像质量和增加压缩比的技术措施,主要用于消费电子应用,可用于SDTV、HDTV和DVD等。 3、扩展档次:主要用于各种网络的视频流传输,如视频点播等。

多媒体技术第一章

第一章 1.媒体是指承载信息的载体。按照ITU-T(CCTV)建议的定义。 2.媒体包括以下五种:感觉媒体(视觉,听觉,触觉)、表示媒体(图象,声音,视频,运动)、显示媒体(显示器,打印机,扬 声器,键盘,摄象机和运动平台)和传输媒体(光缆,电缆,电磁波,交换设备)存储媒体(磁盘,光盘)。 3.多媒体技术:以数字为基础,能够对多种媒体信息进行采集、编码、存储、传输、处理和表现,综合处理多种媒体信息并使之 建立有机的逻辑联系,集成为一个系统并能具有良好交互性的技术。 4.多媒体∶是在不同应用环境中文本、图象、声音和视频等各种媒体的集成。是组合两种以上媒体的人机交互式信息传播媒体。 5.用户及计算机的信息交流采用的4种方式:人—人(经由计算机)、人—计算机、机—人和计算机—计算机。 6.多媒体数据库包括3个方面∶体系结构、数据模型和用户接口。 7.多媒体的主要特性为:多样性、集成性、交互性、非线性、实时性、信息使用的方便性和信息结构的动态性。 8.简答多媒体的关键特性? 答:多媒体的关键特性主要包括信息载体的多样性、交互性、集成性3个方面 (1)信息载体的多样性是相对与计算机而言的,指的就是信息载体的多样化,有人称之为信息多维化。 (2)交互性可以增加对信息的注意力和理解力,延长信息在头脑中的保留时间 (3)多媒体的集成性主要表现在两个方面,一是多媒体信息媒体的集成,二是处理这些媒体的设备与设施的集成9.多媒体的研究一般分为两个主要的方面:(1)是多媒体技术,主要关心基本技术层面的内容; (2)是多媒体系统,主要重心在多媒体系统的构成与实现. 10.处理大批非规则数据主要有两个途径∶(1)是扩充现有的关系型数据库, (2)是建立面向对象数据系统,以存储和检索特定信息. 11.多媒体技术主要包括:媒体处理基础技术、数据压缩技术、软硬件平台技术、基础环境技术、信息管理技术、通信与网络技术。 12.多媒体技术研究的主要内容? 答:1)多媒体技术的基础2)多媒体软硬件平台技术3)多媒体操作系统技术 4)多媒体信息管理与处理技术。 第二章 1.常见的媒体元素主要有∶文本、图形、图像、声音、动画和视频图像等。 2.媒体元素:多媒体的媒体元素是指多媒体应用中可显示给用户的媒体形式。常见的媒体元素主要有文本、图形、图像、声音、动画和视频图像等。 3.文本:文本是用字符代码及字符格式表示出来的数据。(计算机在进行文字处理时,依据的就是字符代码的识别,它是文本处理程序的基础,也是多媒体应用程序的基础) 4.图形:图形一般指用计算机绘制的几何画面,如直线、圆、矩形、任意曲线和图表等。 5.图形格式:图形的格式是一组描述点、线、面等几何图形的大小、形状及其位置、维数的指令集合。6.图像处理一般考虑三个因素:分辨率、图像灰度、图像的文件大小。 7.矢量图:在图形文件中只记录生成图的算法和图上的某些特征点,因此也称矢量图。 8.图形的用途:图形主要用于表示线框型的图画、工程制图和美术字等。绝大多数CAD和3D软件使用矢量图形来做为基本图形存储格式。 9.用字节为单位表示图像文件的大小,描述方法为:高×宽×灰度位数/8 10.掩蔽:声音的响度不仅取决与自身的强度和频率,而且也依赖于同时出现的其他声音。声音的掩蔽特性常常用于声音的压缩。11.MIDI:与波形声音相比,MIDI数据不是声音而是指令,所以它的数据量要比波形声音少得多。12.电视主要有三种制式:即NTSC(525/60)PAL(625/50) 和SECAM(625/50)括号中的数字为电视显示的线行数和频率;视频文件的存储格式有:A VI、MPG MOV等。 13.在视频中有三个重要的技术参数:帧速数据量图像质量。 14.数字音频可以分为波形声音、语音和音乐。 15.计算机中音频技术主要包括声音的采集、数字化、压缩/解压缩以及声音的播放。 16.影响数字声音波形质量的主要因素有三个:采样频率、采样精度和通道数。 17.通道数一般分为单声道和立体声道,单声道产生一个波形,立体声道产生两个波形。 18.媒体的种类:可以分为视觉类媒体、听觉类媒体、触觉类媒体、嗅觉类媒体和味觉类媒体。19.媒体的性质和特点:媒体数据具有一下性质:第一,媒体是有格式的;第二,不同媒体表达信息的特点和程度各不相同;第三,媒体之间可以相互转换,但可能会丢失部分原始信息,或增加一些伪信息;第四,媒体之间的关系也具有丰富的信息。20.人的听觉频率范围是:20Hz~20KHz 21.人们对声音的感觉主要有音量、音调和音色3个指标。 22.最基本的声音数字化方法是取样—量化法,它分成3个步骤:采样、量化和编码。 第三章 1.评价一种数据压缩技术的性能好坏主要有3个关键指标:压缩比、图像质量、压缩和解压的速度。

音频、视频压缩有哪些技术标准

音频、视频压缩有哪些技术标准? 视频压缩技术有:MPEG-4、H263、H263+、H264等 MPEG-4视频编码技术介绍 MPEG是“Moving Picture Experts Group”的简称,在它之前的标准叫做JPEG,即“Joint Photographic Experts Group”。当人们用到常见的“.jpg”格式时,实际上正在使用JPEG的标准。JPEG规范了现代视频压缩的基础,而MPEG把JPEG 标准扩展到了运动图象。 MPEG-4视频编码标准支持MPEG-1、MPEG-2中的大多数功能,它包含了H.263的核心设计,并增加了优先特性和各种各样创造性的新特性。它提供不同的视频标准源格式、码率、帧频下矩形图像的有效编码,同时也支持基于内容的图像编码。采纳了基于对象(Object-Based)的编码、基于模型(Model-based)的编码等第二代编码技术是MPEG-4标准的主要特征。 MPEG4与MPEG1、MPEG2的比较 从上表可以看出,MPEG1和MPEG2主要应用于固定媒体,比如 VCD 和 DVD ,而对于网络传输,MPEG4具有无可比拟的优势。 H.263/H.263+/H.264视频编码技术介绍 1.H.263视频编码标准 1.H.263是最早用于低码率视频编码的ITU-T标准,随后出现的第二 版(H.263+)及H.263++增加了许多选项,使其具有更广泛的适用性。 H.263是ITU-T为低于64kb/s的窄带通信信道制定的视频编码标准。 它是在H.261基础上发展起来的,其标准输入图像格式可以是

S-QCIF、QCIF、CIF、4CIF或者16CIF的彩色4∶2∶0亚取样图像。 H.263与H.261相比采用了半象素的运动补偿,并增加了4种有效的 压缩编码模式。 2.H.263+视频压缩标准 1.ITU-T在H.263发布后又修订发布了H.263标准的版本2,非正式 地命名为H.263+标准。它在保证原H.263标准核心句法和语义不变 的基础上,增加了若干选项以提高压缩效率或改善某方面的功能。原 H.263标准限制了其应用的图像输入格式,仅允许5种视频源格式。 H.263+标准允许更大范围的图像输入格式,自定义图像的尺寸,从而 拓宽了标准使用的范围,使之可以处理基于视窗的计算机图像、更高 帧频的图像序列及宽屏图像。为提高压缩效率,H.263+采用先进的帧 内编码模式;增强的PB-帧模式改进了H.263的不足,增强了帧间预 测的效果;去块效应滤波器不仅提高了压缩效率,而且提供重建图像 的主观质量。为适应网络传输,H.263+增加了时间分级、信噪比和空 间分级,对在噪声信道和存在大量包丢失的网络中传送视频信号很有 意义;另外,片结构模式、参考帧选择模式增强了视频传输的抗误码 能力。 3.H.264视频压缩标准 1.H.264是由ISO/IEC与ITU-T组成的联合视频组(JVT)制定的新一 代视频压缩编码标准。对信道时延的适应性较强,既可工作于低时延 模式以满足实时业务,如会议电视等;又可工作于无时延限制的场合, 如视频存储等。 2.提高网络适应性,采用“网络友好”的结构和语法,加强对误码和 丢包的处理,提高解码器的差错恢复能力。 3.在编/解码器中采用复杂度可分级设计,在图像质量和编码处理之 间可分级,以适应不同复杂度的应用。 4.相对于先期的视频压缩标准,H.264引入了很多先进的技术,包括 4×4整数变换、空域内的帧内预测、1/4象素精度的运动估计、多参 考帧与多种大小块的帧间预测技术等。新技术带来了较高的压缩比, 同时大大提高了算法的复杂度。 G.7xx系列典型语音压缩标准介绍 G.7xx 是一组 ITU-T 标准,用于视频压缩和解压过程。它主要用于电话方面。在电话学中,有两个主要的算法,分别定义在 mu-law 算法(美国使用)和 a-law 算法(欧洲及世界其他国家使用),两者都是对数关系,但对于计算机的处理来说,后者的设计更为简单。 国际电信联盟G系列典型语音压缩标准的参数比较:

多媒体数据压缩技术综述

南昌大学研究生(工程硕士)2006~2007学年第二学期 期末考试试卷 课程名称:《多媒体技术》专业:软件工程 学生姓名:学号:C2007271 学院:信息工程学院得分: 任课教师签:洪春勇时间:2007.8 多媒体数据压缩技术综述 摘要:本文侧重介绍多媒体各种数据类型和数据描述,讨论数据

压缩技术在各种媒体数据上的应用及发展趋势。 关键词:多媒体数据、数据压缩、JPEG、MPEG-4、发展趋势、一、引言 多媒体在我国的定义是:能对多种载体(媒介)上的信息和多种存储体(媒介)上的信息进行处理的技术。多媒体传统关键技术主要集中在以下四类中:数据压缩技术、大规模集成电路(VLSI)制造技术、大容量的光盘存储器(CD-ROM)、实时多任务操作系统。因为这些技术取得了突破性的进展,多媒体技术才得以迅速的发展。网络技术的发展使多媒体技术的应用空间得到了快速拓展。但是网络现状的局限性也使得各种多媒体技术应用受到制约,因此对于多媒体数据的压缩技术显得非常重要和关键。 二、多媒体数据类型及其数据描述 (一)多媒体数据类型 1.文字 文字是人与计算机之间进行信息交换的主要媒体。在计算机发展的早期,比较实用的终端为一般文字终端,在屏幕上显示的都是文字信息。由于人们在现实生活中用语言进行交流,所以开始时文字终端比较流行,但是后来出现了图形、图像、声音等媒体,这样也就相应地出现了多种终端设备。在现实世界中,文字是人们进行通信的主要形式,文字包括西文与中文。在计算机中,文字用二进制编码表示,即使用不同的二进制编码来代表不同的文字。

2.音频 音频(Audio)指的是20HZ~20kHz的频率范围,但实际上“音频”常常被作为“音频信号”或“声音”的同义语,是属于听觉类媒体,主要分为波形声音、语音和音乐。 3.视觉媒体 能够利用视觉传递信息的媒体都是视觉媒体。位图图像、矢量图像、动态图像、符号等都是视觉媒体。 4.动画 动画是指运动的画面,动画在多媒体中是一种非常有用的信息交换工具。计算机动画的研究始于20世纪60年代初期。1963年Bell实验室制作了第一部计算机动画片。最初主要集中在二维动画的研制,作为示教和辅助制作传统动画片之用。三维计算机动画的研究始于20世纪70年代初,但真正进入实用化还是80年代中后期。随着具有实时处理能力的超级图形工作站的出现,以及三维造型技术、真实感图形生成技术的迅速发展,推出了一些可生成具有高逼真度视觉效果的实用化、商品化的三维动画系统。20世纪90年代初,计算机动画技术成功地应用于电影特技,取得了出色的成就,由此可见计算机动画技术的重要意义。(二)多媒体数据的描述 1.音频文件 在多媒体声音处理技术中,最常见的几种声音存储格式是:WAVE波形文件,MIDI音乐数字文件和目前非常流行的MP3

视频压缩格式的分析和对比(MJPEG、MPEG-4、H.264等)

视频压缩格式的分析和对比(MJPEG、MPEG-4、H.264等) 时间:2011-08-06 点击数:1977 视频压缩格式的分析和对比(MJPEG、MPEG-4、H.264等) 1.H.261 H.261又称为P*64,其中P为64kb/s的取值范围,是1到30的可变参数,它最初是针对在ISDN上实现电信会议应用特别是面对面的可视电话和视频会议而设计的。实际的编码算法类似于MPEG算法,但不能与后者兼容。H.261在实时编码时比MPEG所占用的CPU运算量少得多,此算法为了优化带宽占用量,引进了在图像质量与运动幅度之间的平衡折中机制,也就是说,剧烈运动的图像比相对静止的图像质量要差。因此这种方法是属于恒定码流可变质量编码而非恒定质量可变码流编码。 2.H.263 H.263是国际电联ITU-T的一个标准草案,是为低码流通信而设计的。但实际上这个标准可用在很宽的码流范围,而非只用于低码流应用,它在许多应用中可以认为被用于取代H.261。H.263的编码算法与H.261一样,但做了一些改善和改变,以提高性能和纠错能力。.263标准在低码率下能够提供比H.261更好的图像效果,两者的区别有:(1)H.263的运动补偿使用半象素精度,而H.261则用全象素精度和循环滤波;(2)数据流层次结构的某些部分在H.263中是可选的,使得编解码可以配置成更低的数据率或更好的纠错能力;(3)H.263包含四个可协商的选项以改善性能;(4)H.263采用无限制的运动向量以及基于语法的算术编码;(5)采用事先预测和与MPEG中的P-B帧一样的帧预测方法;(6)H.263支持5种分辨率,即除了支持H.261中所支持的QCIF和CIF外,还支持SQCIF、4CIF和16CIF,SQCIF相当于QCIF一半的分辨率,而4CIF和16CIF分别为CIF的4倍和16倍。 1998年IUT-T推出的H.263+是H.263建议的第2版,它提供了12个新的可协商模式和其他特征,进一步提高了压缩编码性能。如H.263只有5种视频源格式,H.263+允许使用更多的源格式,图像时钟频率也有多种选择,拓宽应用范围;另一重要的改进是可扩展性,它允许多显示率、多速率及多分辨率,增强了视频信息在易误码、易丢包异构网络环境下的传输。另外,H.263+对H.263中的不受限运动矢量模式进行了改进,加上12个新增的可选模式,不仅提高了编码性能,而且增强了应用的灵活性。H.263已经基本上取代了H.261。 二、M-JPEG M-JPEG(Motion- Join Photographic Experts Group)技术即运动静止图像(或逐帧)压缩技术,广泛应用于非线性编辑领域可精确到帧编辑和多层图像

多媒体压缩技术

多媒体压缩技术 为什么会出现多媒体压缩技术 在多媒体计算系统中,信息从单一媒体转到多种媒体;若要表示,传输和处理大量数字化了的声音/图片/影像视频信息等,数据量是非常大的。如果不进行处理,计算机系统几乎无法对它进行存取和交换。因此,在多媒体计算机系统中,为了达到令人满意的图像、视频画面质量和听觉效果,必须解决视频、图像、音频信号数据的大容量存储和实时传输问题。解决的方法,除了提高计算机本身的性能及通信信道的带宽外,更重要的是对多媒体进行有效的压缩。 为什么多媒体数据能够被压缩 多媒体数据之所以能够压缩,是因为视频、图像、声音这些媒体具有很大的压缩力。以目前常用的位图格式的图像存储方式为例,在这种形式的图像数据中,像素与像素之间无论在行方向还是在列方向都具有很大的相关性,因而整体上数据的冗余度很大;在允许一定限度失真的前提下,能对图像数据进行很大程度的压缩。 多媒体压缩数据的方法有哪些? 根据解码后数据与原始数据是否完全一致进行分类,压缩方法可被分为有失真编码和无失真编码两大类。 有失真压缩法会压缩了熵,会减少信息量,而损失的信息是不能再恢复的,因此这种压缩法是不可逆的。无失真压缩法掉或减少数据中的冗余,但这些冗余值是可以重新插入到数据中的,因此冗余压缩是可逆的过程。 无失真压缩是不会产生失真。从信息主义角度讲,无失真编码是泛指那种不考虑被压缩信息性质和压缩技术。它是基于平均信息量的技术,并把所有的数据当做比特序列,而不是根据压缩信息的类型来优化压缩。也就是说,平均信息量编码忽略被压缩信息主义内容。在多媒体技术中一般用于文本、数据的压缩,它能保证百分之百地恢复原始数据。但这种方法压缩比较低,如LZW编码、行程编码、霍夫曼(Huffman)编码的压缩比一般在2:1至5:1之间。 数据压缩技术包括图像、视频和音频信号的压缩,文件存储和利用。图像压缩一直是技术热点之一,是计算机处理同像和视频以及网络传输的重要基础,目前ISO制订了两个压缩标准即JPEG和MPEG,同时使计箅机实时处理音频、视频信息,以保证播高质量的视频、音频节目。 按照压缩方法的原理分类 根据编码原理进行分类,大致有编码、变换编码、统计编码、分析-合成编码、混合编码和其他一些编码方法。其中统计编码是无失真的编码,其他编码方法基本上都是有失真的编码。 预测编码是针对空间冗余的压缩方法,其基本思想是利用已被编码的点的数据值,预测邻近的一个像素点的数据值。预测根据某个模型进行。如果模型选取得足够好的话,则只需存储和传输起始像素和模型参数就可代表全部数据了。按照模型的不同,预测编码又可分为线性预测、帧内预测和帧间预测。 变换编码也是针对空间冗余和时间冗余的压缩方法。其基本思想是将图像的光强矩阵(时域信号)变换到系统空间(频域)上,然后对系统进行编码压缩。在空间上具有强相关性的信号,反映在频域上是某些特定区域内的能量常常被集中在一起,或者是系数矩阵的发布具有某些规律。可以利用这些规律,分配

7.多媒体技术文件压缩、文件格式,存储量的计算知识点

七、多媒体技术文件压缩、文件格式,存储量的计算知识点 1、多媒体技术的三个显著的特征: 集成性:(指文字、图形、图像、声音、动画、视频等各种媒体的整合与综合运用,如多媒体课件、网页、多媒体电子地图等) 交互性:(指人机交互功能,人可以积极参与其中的所有活动,如人机下棋,数字电视选择点播节目等) 实时性:(指声音及活动的视频图像是强实时的,如电视或网上现场直播奥运会,汽车GPS电子导航系统等) 2.多媒体作品的规划和设计

3..多媒体的创作工具 (1)以页为基础的创作工具(ToolBook、PowerPoint); (2)以图标和流程图为基础的创作工具(Authorware、IconAuthor);(3)以时间为基础的创作工具(Director、Flash); (4)以程序语言为基础的创作工具(Visual Basic、Visual\ C++、Java)。4、多媒体技术的应用: (1) 生活中的多媒体:MP3音乐、影视动画、数字电视(优点:图像质量高、节目容量大、伴 音质量好)等。[普通模拟电视显示屏幕长宽比为4:3;数字电视屏幕的长宽比为16:9] (2) 多媒体技术的现状: 音频技术(声控玩具、语音拔号功能的手机等) 视频技术(大众化的数字视频产品如VCD、DVD、可视电话、视频会议等)

网络传输技术(使可视电话、观看网络电视、电影等成为可能) 5、压缩技术 (1)压缩目的:为了使数据量更小,以便存储和传输。 (2)压缩原理:首先数据本身存在冗余;其次是在许多情况许媒体本身允少量失真。 (3)数据冗余分为:空间冗余、视觉冗余、结构冗余、时间冗余。 空间冗余:对应的对象是静态图像,例如:图像中有一片连续的区域,其像素为相同的颜色,空间冗余产生。 时间冗余: 对应的对象是序列图像,例如:房间里的两个人在聊天,在这个聊天的过程中,背景(房间和家具)一直是相同的,同时也没有移动,而且 是同样的两个人在聊天,只有动作和位置的变化。 结构冗余:图像中重复出现或相近的纹理结构。例如:方格状的地板,蜂窝,砖墙,草席等图结构上存在冗余。已知分布模式,可以通过某一过程生成图像。 视觉冗余:是指人看一幅图像时产生的感觉。例如:看到的这幅图像整体是明亮的或是发暗的。 6、数据压缩分为无损压缩和有损压缩。 (1)用“文件压缩软件”(如:winrar和winzip)压缩,往往是无损压缩,产生的文件扩展名为rar或zip。(如txt文件压缩成RAR文件)(2)常见的有损压缩,可以通过软件打开文件之后另存为其它格式。如bmp 图象转化为jpeg或gif;avi视频转化为mpeg格式或rm格式;wav 声音转化为mp3。 (3)直接修改文件扩展名则不能算压缩,只能说是修改了文件名,文件的容量也没有发生变化 7、压缩比的计算公式:压缩比=压缩前文件容量/压缩后文件容量 8、常见的多媒体压缩标准: 静态图像压缩标准JPEG,视频压缩标准MPEG(VCD采用MPEG-1压缩标准,DVD和数字电视采用MPEG-2压缩标准),音频压缩标准MP3,P*64是CCITT 专家组为可视电话和电视会议制定的标准,是关于双向传输视频和声音标准。 9、多媒体计算机系统的组成 (1)多媒体计算机(MPC)的概念:多媒体计算机是指具有多媒体信息处理功能的个人计 算机。 (2)多媒体计算机配置标准一般应包括:硬件部分至少应包括个人计算机(PC)、光盘驱 动器、声卡(必备)、音箱或耳机等。软件必须具有多媒体功能的操作系统; (3)常见多媒体硬件设备:(注:电脑只接收数字信息0和1) CD—ROM驱动器:目前一张普通CD光盘的容量一般为 650或700MB; DVD光盘为4.7GB; 光盘上的信息为数字信息

数字电视视频压缩技术原理

数字电视视频压缩技术原理 摘要:视频压缩通过减少和去除冗余视频数据的方式,达到有效发送和存储数字视频文件的目的。在压缩过程中,需要应用压缩算法对源视频进行压缩以创建压缩文件,以便进行传输和存储。要想播放压缩文件,则需要应用相反的解压缩算法对视频进行还原,还原后的视频内容与原始的源视频内容几乎完全相同。压缩、发送、解压缩和显示文件所需的时间称为延时。在相同处理能力下,压缩算法越高级,延时就越长。 传统的压缩编码是建立在香农(Shannon)信息论基础上的,它以经典的集合论为基础,用统计概率模型来描述信源,但它未考虑信息接受者的主观特性及事件本身的具体含义、重要程度和引起的后果。因此,压缩编码的发展历程实际上是以香农信息论为出发点,一个不断完善的过程。 从不同角度考虑,数据压缩编码具有不同的分类方式。 按信源的统计特性可分为预测编码、变换编码、矢量量化编码、子带-小波编码、神经网络编码方法等。 数眼的视觉特性可能基于方向滤波的图像编码、基于图像轮廓-纹理的编码方法等。 按图像传递的景物特性可分为分形编码、基于内容的编码方法等。 视频压缩技术是计算机处理视频的前提。视频信号数字化后数据带宽很高,通常在20MB/秒以上,因此计算机很难对之进行保存和处理。采用压缩技术以后通常数据带宽右以降到1-10MB/秒,这样就可以将视频信号保存在计算机中并作相应的处理。常用的算法是由ISO制订的,即JPEG和MPEG算法。JPEG是静态图像压缩标准,适用于连续色调彩色或灰度图像,它包括两部分:一是基于DPCM(空间线性预测)技术的无失真编码,一是基于DCT(离散余弦变换)和哈夫曼编码的有失真算法,前者压缩比很小,主要应用的是后一种算法。在非线性编辑中最常用的是MJPEG算法,即Motion JPEG。它是将视频信号50帧/秒(PAL制式)变为25帧/秒,然后按照25帧/秒的速度使用JPEG算法对每一帧压缩。通常压缩倍数在3.5-5倍时可以达到Betacam的图像质量。MPEG算法是适用于动态视频的压缩算法,它除了对单幅图像进行编码外还利用图像序列中的相关原则,将冗余去掉,这样可以大大提高视频的压缩比。前MPEG-I 用于VCD节目中,MPEG-II用于VOD、DVD节目中。 数据压缩的理论基础是信息论,从信息论的角度来看,压缩就是去掉数据中的冗余,即保留不确定的信息,去掉确定的信息(可推知的),也就是用一种更接近信息本质的描述来代替原有冗余的描述。数字图像和视频数据中存在着大量的数据冗余和主观视觉冗余,因此,图像和视频数据压缩不仅是必要的,而且也是可能的。

相关文档
相关文档 最新文档