文档视界 最新最全的文档下载
当前位置:文档视界 › 视频编码的基本原理及基本框架

视频编码的基本原理及基本框架

视频编码的基本原理及基本框架
视频编码的基本原理及基本框架

视频编码的基本原理及基本框架

视频图像数据有极强的相关性,也就是说有大量的冗余信息。其中冗余信息可分为空域冗余信息和时域冗余信息。压缩技术就是将数据中的冗余信息去掉(去除数据之间的相关性),压缩技术包含帧内图像数据压缩技术、帧间图像数据压缩技术和熵编码压缩技术。

去时域冗余信息

使用帧间编码技术可去除时域冗余信息,它包括以下三部分:

-运动补偿

运动补偿是通过先前的局部图像来预测、补偿当前的局部图像,它是减少帧序列冗余信息的有效方法。

-运动表示

不同区域的图像需要使用不同的运动矢量来描述运动信息。运动矢量通过熵编码进行压缩。-运动估计

运动估计是从视频序列中抽取运动信息的一整套技术。

注:通用的压缩标准都使用基于块的运动估计和运动补偿

去空域冗余信息

主要使用帧内编码技术和熵编码技术:

-变换编码

帧内图像和预测差分信号都有很高的空域冗余信息。变换编码将空域信号变换到另一正交矢量空间,使其相关性下降,数据冗余度减小。

-量化编码

经过变换编码后,产生一批变换系数,对这些系数进行量化,使编码器的输出达到一定的位率。这一过程导致精度的降低。

熵编码是无损编码。它对变换、量化后得到的系数和运动信息,进行进一步的压缩。

视频编码的基本框架

H.261

H.261标准是为ISDN设计,主要针对实时编码和解码设计,压缩和解压缩的信号延时不超过150ms,码率px64kbps(p=1~30)。

H.261标准主要采用运动补偿的帧间预测、DCT变换、自适应量化、熵编码等压缩技术。只有I帧和P帧,没有B帧,运动估计精度只精确到像素级。支持两种图像扫描格式:QCIF 和CIF。

H.263

H.263标准是甚低码率的图像编码国际标准,它一方面以H.261为基础,以混合编码为核心,其基本原理框图和H.261十分相似,原始数据和码流组织也相似;另一方面,H.263也吸收了MPEG等其它一些国际标准中有效、合理的部分,如:半像素精度的运动估计、PB帧预测等,使它性能优于H.261。

H.263使用的位率可小于64Kb/s,且传输比特率可不固定(变码率)。H.263支持多种分辨率:SQCIF(128x96)、QCIF、CIF、4CIF、16CIF。

与H.261和H.263相关的国际标准

与H.261有关的国际标准

H.320:窄带可视电话系统和终端设备;

H.221:视听电信业务中64~1 920Kb/s信道的帧结构;

H.230:视听系统的帧同步控制和指示信号;

H.242:使用直到2Mb/s数字信道的视听终端的系统。

与H.263有关的国际标准

H.324:甚低码率多媒体通信终端设备;

H.223:甚低码率多媒体通信复合协议;

H.245:多媒体通信控制协议;

G.723.1.1:传输速率为5.3Kb/s和6.3Kb/s的语音编码器。

JPEG

国际标准化组织于1986年成立了JPEG(Joint Photographic Expert Group)联合图片专家小组,主要致力于制定连续色调、多级灰度、静态图像的数字图像压缩编码标准。常用的基于离散余弦变换(DCT)的编码方法,是JPEG算法的核心内容。

MPEG-1标准用于数字存储体上活动图像及其伴音的编码,其数码率为1.5Mb/s。MPEG-1的视频原理框图和H.261的相似。

MPEG-1视频压缩技术的特点:1. 随机存取;2. 快速正向/逆向搜索;3 .逆向重播;4. 视听同步;5. 容错性;6. 编/解码延迟。MPEG-1视频压缩策略:为了提高压缩比,帧内/帧间图像数据压缩技术必须同时使用。帧内压缩算法与JPEG压缩算法大致相同,采用基于DCT的变换编码技术,用以减少空域冗余信息。帧间压缩算法,采用预测法和插补法。预测误差可在通过DCT变换编码处理,进一步压缩。帧间编码技术可减少时间轴方向的冗余信息。

MPEG-2被称为“21世纪的电视标准”,它在MPEG-1的基础上作了许多重要的扩展和改进,但基本算法和MPEG-1相同。

MPEG-4

MPEG-4标准并非是MPEG-2的替代品,它着眼于不同的应用领域。MPEG-4的制定初衷主要针对视频会议、可视电话超低比特率压缩(小于64Kb/s)的需求。在制定过程中,MPEG 组织深深感受到人们对媒体信息,特别是对视频信息的需求由播放型转向基于内容的访问、检索和操作。

MPEG-4与前面提到的JPEG、MPEG-1/2有很大的不同,它为多媒体数据压缩编码提供了更为广阔的平台,它定义的是一种格式、一种框架,而不是具体算法,它希望建立一种更自由的通信与开发环境。于是MPEG-4新的目标就是定义为:支持多种多媒体的应用,特别是多媒体信息基于内容的检索和访问,可根据不同的应用需求,现场配置解码器。编码系统也是开放的,可随时加入新的有效的算法模块。应用范围包括实时视听通信、多媒体通信、远地监测/监视、VOD、家庭购物/娱乐等。

JVT:新一代的视频压缩标准

JVT是由ISO/IEC MPEG和ITU-T VCEG成立的联合视频工作组(Joint Video Team),致力于新一代数字视频压缩标准的制定。

JVT标准在ISO/IEC中的正式名称为:MPEG-4 AVC(part10)标准;在ITU-T中的名

称:H.264(早期被称为H.26L)

H264/AVC

H264集中了以往标准的优点,并吸收了以往标准制定中积累的经验, 采用简洁设计,使它比MPEG4更容易推广。H.264创造性了多参考帧、多块类型、整数变换、帧内预测等新的压缩技术,使用了更精细的分象素运动矢量(1/4、1/8)和新一代的环路滤波器,使得压缩性

能大大提高,系统更加完善。

H.264主要有以下几大优点:

-高效压缩:与H.263+和MPEG4 SP相比,减小50%比特率

-延时约束方面有很好的柔韧性

-容错能力

-编/解码的复杂性可伸缩性

-解码全部细节:没有不匹配

-高质量应用

-网络友善

监控中的视频编码技术

目前监控中主要采用MJPEG、MPEG1/2、MPEG4(SP/ASP)、H.264/AVC等几种视频编码技术。对于最终用户来言他最为关心的主要有:清晰度、存储量(带宽)、稳定性还有价格。采用不同的压缩技术,将很大程度影响以上几大要素。

MJPEG

MJPEG(Motion JPEG)压缩技术,主要是基于静态视频压缩发展起来的技术,它的主要特点是基本不考虑视频流中不同帧之间的变化,只单独对某一帧进行压缩。

MJPEG压缩技术可以获取清晰度很高的视频图像,可以动态调整帧率、分辨率。但由于没有考虑到帧间变化,造成大量冗余信息被重复存储,因此单帧视频的占用空间较大,目前流行的MJPEG技术最好的也只能做到3K字节/帧,通常要8~20K!

MPEG-1/2

MPEG-1标准主要针对SIF标准分辨率(NTSC制为352X240;PAL制为352X288)的图像进行压缩. 压缩位率主要目标为1.5Mb/s.较MJPEG技术,MPEG1在实时压缩、每帧数据量、处理速度上有显著的提高。但MPEG1也有较多不利地方:存储容量还是过大、清晰度不够高和网络传输困难。

MPEG-2 在MPEG-1基础上进行了扩充和提升,和MPEG-1向下兼容,主要针对存储媒体、数字电视、高清晰等应用领域,分辨率为:低(352x288),中(720x480),次高(1440x1080),高(1920x1080)。MPEG-2视频相对MPEG-1提升了分辨率,满足了用户高清晰的要求,但由于压缩性能没有多少提高,使得存储容量还是太大,也不适和网络传输。

MPEG-4

MPEG-4视频压缩算法相对于MPEG-1/2在低比特率压缩上有着显著提高,在CIF

(352*288)或者更高清晰度(768*576)情况下的视频压缩,无论从清晰度还是从存储量上都比MPEG1具有更大的优势,也更适合网络传输。另外MPEG-4可以方便地动态调整

帧率、比特率,以降低存储量。

MPEG-4由于系统设计过于复杂,使得MPEG-4难以完全实现并且兼容,很难在视频会议、可视电话等领域实现,这一点有点偏离原来地初衷。另外对于中国企业来说还要面临高昂的专利费问题,目前规定:

-每台解码设备需要交给MPEG-LA 0.25美元

-编码/解码设备还需要按时间交费(4美分/天=1.2美元/月=14.4美元/年)

H.264/AVC

H.264集中了以往标准的优点,在许多领域都得到突破性进展,使得它获得比以往标准好得多整体性能:

-和H.263+和MPEG-4 SP相比最多可节省50%的码率,使存储容量大大降低;

-H.264在不同分辨率、不同码率下都能提供较高的视频质量;

-采用“网络友善”的结构和语法,使其更有利于网络传输。

H.264采用简洁设计,使它比MPEG4更容易推广,更容易在视频会议、视频电话中实现,更容易实现互连互通,可以简便地和G.729等低比特率语音压缩组成一个完整的系统。MPEG LA吸收MPEG-4的高昂专利费而使它难以推广的教训,MPEG LA制定了以下低廉的H.264收费标准:H.264广播时基本不收费;产品中嵌入H.264编/解码器时,年产量10万台以下不收取费,超过10万台每台收取0.2美元,超过500万台每台收取0.1美元。低廉的专利费使得中国H.264监控产品更容易走向世界。

常见的视频编码详解

常见的视频编码详解 A VI所采用的压缩算法并无统一的标准。也就是说,同样是以A VI为后缀的视频文件,其采用的压缩算法可能不同,需要相应的解压软件才能识别和回放该A VI文件。除了Microsoft 公司之外,其他公司也推出了自己的压缩算法,只要把该算法的驱动(Codec)加到Windows 系统中,就可以播放用该算法压缩的A VI文件。最新流行的MPEG-4视频也借用A VI的名称,只要机器安装了它的编码解码,也能够实现正常的播放。这些A VI都能够在用Authorware 或PowerPiont开发的作品当中正常放映。各种编码Codec所生成的A VI文件的大小和质量是不同的,对系统和硬件要求也不同。 因此在压缩A VI时,必须根据计算机的软硬件情况,来考虑采用什么Codec算法,否则你的作品中视频放映是难以令人满意的。下面就是对各种常见编码解码Codec的说明。 常见的视频编码 1、Cinepak Codec by Radius 它最初发布的时候是用在386的电脑上看小电影,在高数据压缩率下,有很高的播放速度。利用这种压缩方案可以取得较高的压缩比和较快的回放速度,但是它的压缩时间相对较长。 2、Microsoft Video 1 用于对模拟视频进行压缩,是一种有损压缩方案,最高仅达到256色,它的品质就可想而知,一般还是不要使用它来编码A VI。 3、Microsoft RLE 一种8位的编码方式,只能支持到256色。压缩动画或者是计算机合成的图像等具有大面积色块的素材可以使用它来编码,是一种无损压缩方案。 4、Microsoft H.261和H.263 Video Codec 用于视频会议的Codec,其中H.261适用于ISDN、DDN线路,H.263适用于局域网,不过一般机器上这种Codec是用来播放的,不能用于编码。 5、Intel Indeo Video R3.2 所有的Windows版本都能用Indeo video 3.2播放A VI编码。它压缩率比Cinepak大,但需要回放的计算机要比Cinepak的快。 6、Intel Indeo Video 4和5

视频压缩原理

1. 为什么要进行视频压缩 未经压缩的数字视频的数据量巨大 存储困难 一张DVD只能存储几秒钟的未压缩数字视频。 传输困难 1兆的带宽传输一秒的数字电视视频需要大约4分钟。 2. 为什么可以压缩 ? 去除冗余信息 ? 空间冗余:图像相邻像素之间有较强的相关性 时间冗余:视频序列的相邻图像之间内容相似 编码冗余:不同像素值出现的概率不同 视觉冗余:人的视觉系统对某些细节不敏感 知识冗余:规律性的结构可由先验知识和背景知识得到3. 数据压缩分类 ? 无损压缩(Lossless) ? 压缩前解压缩后图像完全一致X=X' 压缩比低(2:1~3:1) 例如:Winzip,JPEG-LS ?

有损压缩(Lossy) ? 压缩前解压缩后图像不一致X≠X' 压缩比高(10:1~20:1) 利用人的视觉系统的特性 例如:MPEG-2,AVC,AVS 4. 编解码器 ? 编码器(Encoder) ? 压缩信号的设备或程序 ? 解码器(Decoder) ? 解压缩信号的设备或程序 ? 编解码器(Codec) ? 编解码器对 5. 压缩系统的组成 (1) 编码器中的关键技术 (2) 编解码中的关键技术 6. 编解码器实现 ?

编解码器的实现平台: ? ? 超大规模集成电路VLSI ? ASIC, FPGA 数字信号处理器DSP 软件 ? 编解码器产品: ? 机顶盒 数字电视 摄像机 监控器 7. 视频编码标准 编码标准作用: ? 兼容: ? 不同厂家生产的编码器压缩的码流能够被不同厂家的解码器解码? 高效: ? 标准编解码器可以进行批量生产,节约成本。 主流的视频编码标准: MPEG-2 MPEG-4 Simple Profile AVC

视频文件格式和视频编码方式区别

目前网上的各种视频格式可以说就是泛滥成灾,加上各个PMP(Portable Media Player,便携式媒体播放器)生产厂家的对自己产品在功能方面的炒作,使得很多人对视频格式的名称 都就是一头的雾水。 经常有些童鞋问我类似下面的问题。 A问我说:“我的MP4分明写着能播放AVI不?为什么这一个AVI文件就播放不了?” B问:“我的MP4支持Mpeg-4啊,为什么Mp4文件不能播放呢?” 好的,下面我从最基本的概念给大家解释一下,顺便回答这两个问题 首先大家要清楚两个概念,视频文件格式与视频编码方式。 视频文件格式一般情况下从视频文件的后缀名就能瞧出来,比如AVI,Mp4,3gp,mov,rmvb 等等。这些格式又叫做容器格式(container format),顾名思义就就是用来装东西的,您可以把它想象成为一个便当盒,或者野餐篮(兄弟,您没吃早饭吧)。 通常我们从网上下载的电影都就是有声音的(废话,难道您只瞧默片!众人扔香蕉皮),所以容器格式中一般至少包含有两个数据流(stream),一个视频流,一个音频流,就好比就是一个便当盒里装着的配菜与米饭。 视频编码方式则就是指容器格式中视频流数据的压缩编码方式,例如Mpeg-4,H、264,H、263,等等。而视频数据采用了何种编码方式就是无法单单从文件格式的后缀上瞧出来的。就就是说您无法从一个盖着盖子的便当盒外面瞧出里面装了什么配菜。 如果您想播放一个视频文件,第一步您的播放器(不论就是软件的还就是硬件的)要能够 解析相应的容器格式,这一步也叫做解复用(demux),第二步您的播放器要能够解码其中所包 含视频流与音频流。这样影片才能播放出来。 打个不太恰当的比方,播放器好比您雇用的一个试菜员,由她来品尝便当(视频文件),然 后告诉您便当里装了什么东西。(没天理阿!我想自己吃,好的当然可以,0x00 00 01 B6 05 FF 36 1A 50 …… ……, 俄~) 所以试菜员首先要懂得如何打开便当盒,还要知道吃的出来便当盒里装了什么配菜,这样您才能获得您想要的信息。 回过头来瞧前面的两个问题,用以上的比喻翻译一下。 问题A,我的试菜员能打开AVI这种便当的,为什么我不能知道里面装了什么? 回答很简单,虽然她能够打开便当,但就是吃不出里面的东西就是什么。理论上没有一个播放器能够播放所有的AVI格式的电影,因为您不知道我会往里面放什么配菜。 问题B,我的试菜员吃过Mpeg-4这种牛排阿,为什么不能打开Mp4这种便当盒呢? 这个问题通过翻译之后瞧起来已经不就是问题了,Mpeg-4就是视频编码方式,而Mp4就是容器格式,两者本来就不就是一个范畴里的东西。 好了下面简单介绍一下流行的视频格式。

视频压缩原理

第1章介绍 1. 为什么要进行视频压缩? ?未经压缩的数字视频的数据量巨大 ? 存储困难 ? ?一DVD只能存储几秒钟的未压缩数字视频。 ? 传输困难 ? ?1兆的带宽传输一秒的数字电视视频需要大约4分钟。 2. 为什么可以压缩 ? 去除冗余信息

? ?空间冗余:图像相邻像素之间有较强的相关性 ?时间冗余:视频序列的相邻图像之间容相似 ?编码冗余:不同像素值出现的概率不同 ?视觉冗余:人的视觉系统对某些细节不敏感 ?知识冗余:规律性的结构可由先验知识和背景知识得到3. 数据压缩分类 ? 无损压缩(Lossless) ? ?压缩前解压缩后图像完全一致X=X' ?压缩比低(2:1~3:1) ?例如:Winzip,JPEG-LS ? 有损压缩(Lossy) ? ?压缩前解压缩后图像不一致X≠X' ?压缩比高(10:1~20:1) ?利用人的视觉系统的特性 ?例如:MPEG-2,H.264/AVC,AVS

4. 编解码器 ? 编码器(Encoder) ? ?压缩信号的设备或程序 ? 解码器(Decoder) ? ?解压缩信号的设备或程序 ? 编解码器(Codec) ? ?编解码器对 5. 压缩系统的组成

(1) 编码器中的关键技术 (2) 编解码中的关键技术 6. 编解码器实现 ? 编解码器的实现平台: ? ?

超大规模集成电路VLSI ? ?ASIC,FPGA ?数字信号处理器DSP ?软件 ? 编解码器产品: ? ?机顶盒 ?数字电视 ?摄像机 ?监控器 7. 视频编码标准 编码标准作用: ? 兼容: ? ?不同厂家生产的编码器压缩的码流能够被不同厂家的解码器解码 ? 高效: ?

视频监控常见编码格式

视频监控常见的视频编码格式: CIF、QCIF、4CIF、D1、MPEG-4、H.264、M-JPEG等。 备注: 1.NTSC和PAL属于全球两大主要的电视广播制式,但是由于系统投射颜色影像的频率不一样而有所不同。 NTSC是National Television Standards Committee的缩写,意思是“(美国)国家电视标准委员会”。NTSC负责开发一套美国标准电视广播传输和接收协议。此外还有两套标准:逐行倒相(PAL)和顺序与存色彩电视系统(SECAM),用于世界上其他的国家。NTSC标准从他们产生以来除了增加了色彩信号的新参数之外没有太大的变化。NTSC信号是不能直接兼容于计算机系统的。其标准主要应用于日本、美国,加拿大、墨西哥等等。 PAL是Phase Alternating Line (逐行倒相)的缩写。它是西德在1962年制定的彩色电视广播标准,它采用逐行倒相正交平衡调幅的技术方法,克服了NTSC制相位敏感造成色彩失真的缺点。西德、英国等一些西欧国家,新加坡、中国大陆及香港,澳大利亚、新西兰等国家采用这种制式。

NTSC电视标准:每秒29.97帧(简化为30帧),电视扫描线为525线,偶场在前,奇场在后,标准的数字化NTSC电视标准分辨率为720*480像素, 24比特的色彩位深,画面的宽高比为4:3。NTSC电视标准用于美、日等国家和地区。场频为每秒60场,帧频为每秒30帧,扫描线为525行。 PAL电视标准:PAL电视标准,每秒25帧,电视扫描线为625线,奇场在前,偶场在后,标准的数字化PAL电视标准分辨率为720*576, 24比特的色彩位深,画面的宽高比为4:3, PAL 电视标准用于中国、欧洲等国家和地区,PAL制电视的供电频率为50Hz,场频为每秒50场,帧频为每秒25帧,扫描线为625行,图像信号带宽分别为4.2MHz、5.5MHz、5.6MHz等。 2.目前监控行业中主要适用QCIF(176 x 144)、CIF(352 x 288)、HALF D1(704 x 288)、D1(704 x 576)等几种分辨率。针对安防行业的网络摄像机主要生产厂家,采用最多的编码方案是MPEG-4和M-JPEG,采用H.264的也越来越多。标清监控中用得最多的是D1路式。 3.H.264和MPEG-4由于能够在低带宽下传送高质量的图像,目前在电信全球眼业务和网通宽世界业务的视频码流格式被采用,尤其是H.264。 4.所谓标清,是物理分辨率在720p(1280*720)以下的一种视频格式。而物理分辨率达到720p以上则称作为高清(High Definition),简称HD。所谓全高清(FULL HD),是指物理分辨率高达1920 x 1080显示(包括1080i和1080P),其中i(interlace)是指隔行扫描;P (Progressive)代表逐行扫描,这两者在画面的精细度上有着很大的差别,1080P的画质要胜过1080i。对应地把720称为准高清。很显然,由于在传输的过程中数据信息更加丰富,所以1080在分辨率上更有优势,尤其在大屏幕电视方面,1080能确保更清晰的画质。

视频封装格式详解

视频封装格式详解 所谓封装格式就是将已经编码压缩好的视频轨和音频轨按照一定的格式放到一个文件中,也 就是说仅仅是一个外壳,或者大家把它当成一个放视频轨和音频轨的文件夹也可以。说得通 俗点,视频轨相当于饭,而音频轨相当于菜,封装格式就是一个碗,或者一个锅,用来盛放 饭菜的容器。 比较常用的有以下封装格式 1 AVI AVI 容器-成熟的老技术 AVI是微软1992年推出用于对抗苹果Quicktime的技术,尽管国际学术界公认AVI已经属于 被淘汰的技术,但是由于windows的通用性,和简单易懂的开发API,还在被广泛使用。 AVI的文件结构、分为头部, 主体和索引三部分. 主体中图像数据和声音数据是交互存 放的。从尾部的索引可以索引跳到自己想放的位置。 AVI本身只是提供了这么一个框架,内部的图像数据和声音顺据格式可以是任意的编 码形式。因为索引放在了文件尾部,所以在播internet流媒体时已属力不从心。很简单的例 子,从网络上下载的片子,如果没有下载完成,是很难正常播放出来。另外一个问题是AVI 对高码率VBR音频文件支持不好。

VBR全称是Variable BitRate,就是动态比特率,可以根据当前的需要定义不同的比 特率,避免了浪费,并且提高了利用率。随之问题也就来了,因为容器里的图像和声音是分 开的,所以播放时需要一个图像和声音的同步过程,如果CBR音轨的话因为码率是定值,同 步不成为问题,可是VBR音轨是不断的在变换,而AVI没有时间戳去让VBR音轨和图像同 步,这样就会产生图像声音不同步的问题。后来VirtualDub提出了一种新的方法扩充了AVI 对VBR音频的兼容,但是在高码率时会产生丢失数据的问题,从而导致有损音效,这一点问 题到现在都没有比较完美的解决方法。并且更加令人遗憾的是,对TrueHD, DTS-HD等音 效更是完全不能支持。 2 ts和ps封装 因为HDDVD以及BD之争,尽管两家在编码上都统一采用MPEG2/VC-1/H.264,可在封装 格式上又有所分岐。DVD论坛官方所认可的HDDVD 使用的是PS封装,即Program Stream(程序流),这和之前DVD所采用的MPEG2 Program Stream封装是一样的,PS流 的后缀名是VOB以及EVO等。而BD在没有DVD论坛官方认证的情况下,自然不是PS封装, 而是使用了MPEG2的另一封装TS封装,即Transport Stream(传输流),TS流的后缀名为 TS。它们都是MPEG2系统部分的两个不同的语法结构,而在现在仅仅在作为封装使用。 TS流对于PS流来说更易传输,不过由于其性质,也更易出错,所以在以前一般存储方面都

视频文件格式和视频编码方式区别

目前网上的各种视频格式可以说是泛滥成灾,加上各个PMP(Portable Media Player,便携式媒体播放器)生产厂家的对自己产品在功能方面的炒作,使得很多人对视频格式的名称都是一头的雾水。 经常有些童鞋问我类似下面的问题。 A问我说:“我的MP4分明写着能播放AVI吗?为什么这一个AVI文件就播放不了?” B问:“我的MP4支持Mpeg-4啊,为什么Mp4文件不能播放呢?” 好的,下面我从最基本的概念给大家解释一下,顺便回答这两个问题 首先大家要清楚两个概念,视频文件格式和视频编码方式。 视频文件格式一般情况下从视频文件的后缀名就能看出来,比如AVI,Mp4,3gp,mov,rmvb等等。这些格式又叫做容器格式(container format),顾名思义就是用来装东西的,你可以把它想象成为一个便当盒,或者野餐篮(兄弟,你没吃早饭吧)。 通常我们从网上下载的电影都是有声音的(废话,难道你只看默片!众人扔香蕉皮),所以容器格式中一般至少包含有两个数据流(stream),一个视频流,一个音频流,就好比是一个便当盒里装着的配菜和米饭。 视频编码方式则是指容器格式中视频流数据的压缩编码方式,例如Mpeg-4,,,等等。而视频数据采用了何种编码方式是无法单单从文件格式的后缀上看出来的。就是说你无法从一个盖着盖子的便当盒外面看出里面装了什么配菜。 如果你想播放一个视频文件,第一步你的播放器(不论是软件的还是硬件的)要能够解析相应的容器格式,这一步也叫做解复用(demux),第二步你的播放器要能够解码其中所包含视频流和音频流。这样影片才能播放出来。 打个不太恰当的比方,播放器好比你雇用的一个试菜员,由他来品尝便当(视频文件),然后告诉你便当里装了什么东西。(没天理阿!我想自己吃,好的当然可以,0x00 00 01 B6 05 FF 36 1A 50 …… ……,俄~) 所以试菜员首先要懂得如何打开便当盒,还要知道吃的出来便当盒里装了什么配菜,这样你才能获得你想要的信息。 回过头来看前面的两个问题,用以上的比喻翻译一下。 问题A,我的试菜员能打开AVI这种便当的,为什么我不能知道里面装了什么? 回答很简单,虽然他能够打开便当,但是吃不出里面的东西是什么。理论上没有一个播放器能够播放所有的AVI格式的电影,因为你不知道我会往里面放什么配菜。 问题B,我的试菜员吃过Mpeg-4这种牛排阿,为什么不能打开Mp4这种便当盒呢? 这个问题通过翻译之后看起来已经不是问题了,Mpeg-4是视频编码方式,而Mp4是容器格式,两者本来就不是一个范畴里的东西。 好了下面简单介绍一下流行的视频格式。 AVI是音频视频交错(Audio Video Interleaved)的英文缩写,它是Microsoft公司开发的一种数字音频与视频文件格式,允许视频和音频交错在一起同步播放。 AVI文件的格式是公开并且免费的,大量的视频爱好者在使用这种文件格式。很多PMP 唯一能支持的格式就是AVI格式,一般的PMP都带有可以转换其他格式视频成为AVI格式的软件。 AVI文件采用的是RIFF(Resource Interchange File Format,资源互换文件格式)文件结构,RIFF是Microsoft公司定义的一种用于管理windows环境中多媒体数据的文件格

各种主流视频格式介绍

3GP: 3GP是一种3G流媒体的视频编码格式,主要是为了配合3G网络的高传输速度而开发的,也是目前手机中最为常见的一种视频格式。 3GP是新的移动设备标准格式,应用在手机、PSP等移动设备上,优点是文件体积小,移动性强,适合移动设备使用,缺点是在PC机上兼容性差,支持软件少,且播放质量差,帧数低,较AVI等传统格式相差很多。诺基亚提供的PC套件可以很好的支持3GP文件,暴风影音也可播放。 : (MPEG的全名为[Moving Pictures Experts Group],中文译名是动态图像专家组。 MPEG标准 MPEG标准主要有以下五个,MPEG-1、MPEG-2、MPEG-4、MPEG-7及MPEG-21等。(注意,没有MPEG-3,大家熟悉的MP3 只是MPEG Layeur 3)该专家组建于1988年,专门负责为CD建立视和音频标准,而成员都是为视频、音频及系统领域的技术专家。及后,他们成功将声音和影像的记录脱离了传统的模拟方式,建立了ISO IEC1172压缩编码标准,并制定出MPEG-格式,令视听传播方面进入了数码化时代。因此,大家现时泛指的MPEG-X版本,就是由 ISO(International Organization for Standardization)所制定而发布的视频、音频、数据的压缩标准。 MPEG标准的视频压缩编码技术主要利用了具有运动补偿的帧间压缩 编码技术以减小时间冗余度,利用DCT技术以减小图像的空间冗余度,利用熵编码则在信息表示方面减小了统计冗余度。这几种技术的综合运用,大大增强了压缩性能。 MPEG-1 MPEG-1标准于1992年正式出版,标准的编号为ISO/IEC11172,其标题为“码率约为1.5Mb/s用于数字存贮媒体活动图像及其伴音的编码”。 MPEG-2标准于1994年公布,包括编号为13818-1系统部分、编号为13818-2的视频部分、编号为13818-3的音频部分及编号为13818-4的符合性测试部分。 MPEG-2 MPEG-2编码标准希望囊括数字电视、图像通信各领域的编码标准,MPEG-2

视频压缩编码及常用格式

视频压缩编码及常用格式 数据压缩编码已经拥有很长的历史,压缩编码的理论基础是信息论。从信息的角度看,压缩就是去除数据中的消除冗余。即保留不确定的信息,去除确定的信息,用一种更接近信息本质的描述来代替原有冗余的描述压缩的目的是在尽可能保证视觉效果的前题下减少数据率。视频压缩比是指压缩后的数据量与压缩前的数据量之比。由于视频是连续的静态图像,因此其压缩编码算法与静态图像的压缩算法有某些共同的地方,但是运动的视频还有其本身的特性,因此在压缩是还要考虑其运动特性,这样才能达到高效果压缩的目的。 自从上世纪四十年代第一台电视机问世以来,视频技术的研究与应用已经有近六十年的历史。当前电视技术均为模拟视频技术,经过几十年的发展和完善,已经十分成熟。世界通行的模拟电视制式主要有:PAL(欧洲、中国)NTSC(北美、日本)和SECAM(法国)。 随着计算机技术近二十年的发展,特别是九十年代以来互联网的广泛应用,多媒体数字视频技术已经成为了当前信息科学中十分活跃的研究方向。数字化技术的引用。使得对视频信号的捕获、处理、压缩和储存都有了革命性的进步特别是在视频数据的压缩和储存上。国际电信联合会(ITC)于1990年正式提出了ITU-TH261建议,这是第一个关于使用化视频图像压缩编码的国际标准提议。九十年代中,IUT在该建议上提出了MPEG1、MPEG2、MPEG4、H.263和JPEG2000等压缩标准。这些标准的制定和颁布,极大的促进了数字视频压缩与编码技术的研究和实用化。 视频编码标准的发展 视频编码技术在近年得到了迅速的发展和广泛的应用,并在日渐成熟,起标准是多个视频编码国际化标准的制定与应用,即国际标准化组织ISO和国际电工委员会IEC关于静态图像的编码标准JPEG、国际电信联盟ITU-T关于电视、电话会议的视频编码标准H261、H.263及H.264和ISO/TEC关于活动图像的编码标准MPEG-1,MPEG-2、MPEG-4等。这些标准图像编码算法融合了各种性能优良的图像编码方法,代表了目前编码的发张水平。 MPEG-1 MPEG-1标准于1993年8月公布,用于传输1.5Mbps数据传输的数据储存媒体运动图像及其伴音的编码。该标准包括五个部分:第一:说明如何根据第二部(视频)以及第三部分(音频)的规定,对音频和视频进行复合编码。第四部分说明检验解码器或编码器的输出比流符合前三部分规定的过程。第五部分是一个用完整的C语言实现的编码和解码器。 MPEG-1取得一连串的成功,如VCD和MP3的大量使用,可携式MPEG-1摄像

常见的几种高清视频编码格式

高清视频的编码格式有五种,即H.264、MPEG-4、MPEG-2、WMA-HD以及VC-1。事实上,现在网络上流传的高清视频主要以两类文件的方式存在:一类是经过MPEG-2标准压缩,以tp和ts为后缀的视频流文件;一类是经过WMV-HD(Windows Media Video High Definition)标准压缩过的wmv文件,还有少数文件后缀为avi或mpg,其性质与wmv是一样的。真正效果好的高清视频更多地以H.264与VC-1这两种主流的编码格式流传。 H.264编码 H.264编码高清视频 H.264是由国际电信联盟(iTU-T)所制定的新一代的视频压缩格式。H.264 最具价值的部分是更高的数据压缩比,在同等的图像质量,H.264的数据压缩比能比当前DVD系统中使用的 MPEG-2高2~3倍,比MPEG-4高1.5~2倍。正因为如此,经过H.264压缩的视频数据,在网络传输过程中所需要的带宽更少,也更加经济。在 MPEG-2需要6Mbps的传输速率匹配时,H.264只需要1Mbps~2Mbps 的传输速率,目前H.264已经获得DVD Forum与Blu-ray Disc Association采纳,成为新一代HD DVD的标准,不过H.264解码算法更复杂,计算要求比WMA-HD 还要高。 从ATI的Radeon X1000系列显卡、NVIDIA的GeForce 6/7系列显卡开始,它们均加入对H.264硬解码的支持。与MPEG-4一样,经过H.264压缩的视频文件一般也是采用avi 作为其后缀名,同样不容易辨认,只能通过解码器来自己识别。 总的来说,常见的几种高清视频编码格式的特点是能够以更低的码率得到更高的画质,相同效果的MPEG2与H.264影片做比较,后者在容量上仅需前者的一半左右。这也就意味着,H.264不仅能够节省HDTV的存储空间,而且还可以在手机等带宽较窄的网络上传输高质量的视频,可以说应用前途一片光明。但另

常见视频格式、转换器及编码

常见视频格式 MPEG / MPG / DAT MPEG(运动图像专家组)是Motion Picture Experts Group 的缩写。这类格式包括了MPEG-1,MPEG-2和MPEG-4在内的多种视频格式。MPEG-1相信是大家接触得最多的了,因为其正在被广泛地应用在VCD 的制作和一些视频片段下载的网络应用上面,大部分的VCD 都是用MPEG1 格式压缩的( 刻录软件自动将MPEG1转换为DA T格式) ,使用MPEG-1 的压缩算法,可以把一部120 分钟长的电影压缩到1.2 GB 左右大小。MPEG-2 则是应用在DVD 的制作,同时在一些HDTV(高清晰电视广播)和一些高要求视频编辑、处理上面也有相当多的应用。使用MPEG-2 的压缩算法压缩一部120 分钟长的电影可以压缩到5-8 GB 的大小(MPEG2的图像质量是MPEG-1 无法比拟的)。MPEG系列标准已成为国际上影响最大的多媒体技术标准,其中MPEG-1和MPEG-2是采用相同原理为基础的预测编码、变换编码、熵编码及运动补偿等第一代数据压缩编码技术;MPEG-4(ISO/IEC 14496)则是基于第二代压缩编码技术制定的国际标准,它以视听媒体对象为基本单元,采用基于内容的压缩编码,以实现数字视音频、图形合成应用及交互式多媒体的集成。MPEG系列标准对VCD、DVD等视听消费电子及数字电视和高清晰度电视(DTV&&HDTV)、多媒体通信等信息产业的发展产生了巨大而深远的影响。 A VI A VI,音频视频交错(Audio Video Interleaved)的英文缩写。A VI这个由微软公司发表的视频格式,在视频领域可以说是最悠久的格式之一。A VI格式调用方便、图像质量好,压缩标准可任意选择,是应用最广泛、也是应用时间最长的格式之一。 MOV 使用过Mac机的朋友应该多少接触过QuickTime。QuickTime原本是Apple公司用于Mac计算机上的一种图像视频处理软件。Quick-Time提供了两种标准图像和数字视频格式, 即可以支持静态的*.PIC和*.JPG图像格式,动态的基于Indeo压缩法的*.MOV和基于MPEG 压缩法的*.MPG视频格式。 ASF ASF(Advanced Streaming format高级流格式)。ASF 是MICROSOFT 为了和的Real player 竞争而发展出来的一种可以直接在网上观看视频节目的文件压缩格式。ASF使用了MPEG4 的压缩算法,压缩率和图像的质量都很不错。因为ASF 是以一个可以在网上即时观赏的视频“流”格式存在的,所以它的图像质量比VCD 差一点点并不出奇,但比同是视频“流”格式的RAM 格式要好。 WMV 一种独立于编码方式的在Internet上实时传播多媒体的技术标准,Microsoft公司希望用其取代QuickTime之类的技术标准以及W A V、A VI之类的文件扩展名。WMV的主要优点在于:可扩充的媒体类型、本地或网络回放、可伸缩的媒体类型、流的优先级化、多语言支持、扩展性等。

视频编码的基本原理及基本框架

视频编码的基本原理及基本框架 视频图像数据有极强的相关性,也就是说有大量的冗余信息。其中冗余信息可分为空域冗余信息和时域冗余信息。压缩技术就是将数据中的冗余信息去掉(去除数据之间的相关性),压缩技术包含帧内图像数据压缩技术、帧间图像数据压缩技术和熵编码压缩技术。 去时域冗余信息 使用帧间编码技术可去除时域冗余信息,它包括以下三部分: -运动补偿 运动补偿是通过先前的局部图像来预测、补偿当前的局部图像,它是减少帧序列冗余信息的有效方法。 -运动表示 不同区域的图像需要使用不同的运动矢量来描述运动信息。运动矢量通过熵编码进行压缩。-运动估计 运动估计是从视频序列中抽取运动信息的一整套技术。 注:通用的压缩标准都使用基于块的运动估计和运动补偿 去空域冗余信息 主要使用帧内编码技术和熵编码技术: -变换编码 帧内图像和预测差分信号都有很高的空域冗余信息。变换编码将空域信号变换到另一正交矢量空间,使其相关性下降,数据冗余度减小。 -量化编码 经过变换编码后,产生一批变换系数,对这些系数进行量化,使编码器的输出达到一定的位率。这一过程导致精度的降低。

熵编码是无损编码。它对变换、量化后得到的系数和运动信息,进行进一步的压缩。 视频编码的基本框架 H.261 H.261标准是为ISDN设计,主要针对实时编码和解码设计,压缩和解压缩的信号延时不超过150ms,码率px64kbps(p=1~30)。 H.261标准主要采用运动补偿的帧间预测、DCT变换、自适应量化、熵编码等压缩技术。只有I帧和P帧,没有B帧,运动估计精度只精确到像素级。支持两种图像扫描格式:QCIF 和CIF。 H.263 H.263标准是甚低码率的图像编码国际标准,它一方面以H.261为基础,以混合编码为核心,其基本原理框图和H.261十分相似,原始数据和码流组织也相似;另一方面,H.263也吸收了MPEG等其它一些国际标准中有效、合理的部分,如:半像素精度的运动估计、PB帧预测等,使它性能优于H.261。 H.263使用的位率可小于64Kb/s,且传输比特率可不固定(变码率)。H.263支持多种分辨率:SQCIF(128x96)、QCIF、CIF、4CIF、16CIF。 与H.261和H.263相关的国际标准 与H.261有关的国际标准 H.320:窄带可视电话系统和终端设备; H.221:视听电信业务中64~1 920Kb/s信道的帧结构; H.230:视听系统的帧同步控制和指示信号; H.242:使用直到2Mb/s数字信道的视听终端的系统。 与H.263有关的国际标准 H.324:甚低码率多媒体通信终端设备; H.223:甚低码率多媒体通信复合协议; H.245:多媒体通信控制协议; G.723.1.1:传输速率为5.3Kb/s和6.3Kb/s的语音编码器。 JPEG 国际标准化组织于1986年成立了JPEG(Joint Photographic Expert Group)联合图片专家小组,主要致力于制定连续色调、多级灰度、静态图像的数字图像压缩编码标准。常用的基于离散余弦变换(DCT)的编码方法,是JPEG算法的核心内容。

各种音视频编解码学习详解 h264

各种音视频编解码学习详解h264 ,mpeg4 ,aac 等所有音视频格式 编解码学习笔记(一):基本概念 媒体业务是网络的主要业务之间。尤其移动互联网业务的兴起,在运营商和应用开发商中,媒体业务份量极重,其中媒体的编解码服务涉及需求分析、应用开发、释放license收费等等。最近因为项目的关系,需要理清媒体的codec,比较搞的是,在豆丁网上看运营商的规范标准,同一运营商同样的业务在不同文档中不同的要求,而且有些要求就我看来应当是历史的延续,也就是现在已经很少采用了。所以豆丁上看不出所以然,从wiki上查。中文的wiki信息量有限,很短,而wiki的英文内容内多,删减版也减肥得太过。我在网上还看到一个山寨的中文wiki,长得很像,红色的,叫―天下维客‖。wiki的中文还是很不错的,但是阅读后建议再阅读英文。 我对媒体codec做了一些整理和总结,资料来源于wiki,小部分来源于网络博客的收集。网友资料我们将给出来源。如果资料已经转手几趟就没办法,雁过留声,我们只能给出某个轨迹。 基本概念 编解码 编解码器(codec)指的是一个能够对一个信号或者一个数据流进行变换的设备或者程序。这里指的变换既包括将信号或者数据流进行编码(通常是为了传输、存储或者加密)或者提取得到一个编码流的操作,也包括为了观察或者处理从这个编码流中恢复适合观察或操作的形式的操作。编解码器经常用在视频会议和流媒体等应用中。 容器 很多多媒体数据流需要同时包含音频数据和视频数据,这时通常会加入一些用于音频和视频数据同步的元数据,例如字幕。这三种数据流可能会被不同的程序,进程或者硬件处理,但是当它们传输或者存储的时候,这三种数据通常是被封装在一起的。通常这种封装是通过视频文件格式来实现的,例如常见的*.mpg, *.avi, *.mov, *.mp4, *.rm, *.ogg or *.tta. 这些格式中有些只能使用某些编解码器,而更多可以以容器的方式使用各种编解码器。 FourCC全称Four-Character Codes,是由4个字符(4 bytes)组成,是一种独立标示视频数据流格式的四字节,在wav、a vi档案之中会有一段FourCC来描述这个AVI档案,是利用何种codec来编码的。因此wav、avi大量存在等于―IDP3‖的FourCC。 视频是现在电脑中多媒体系统中的重要一环。为了适应储存视频的需要,人们设定了不同的视频文件格式来把视频和音频放在一个文件中,以方便同时回放。视频档实际上都是一个容器里面包裹着不同的轨道,使用的容器的格式关系到视频档的可扩展性。 参数介绍 采样率 采样率(也称为采样速度或者采样频率)定义了每秒从连续信号中提取并组成离散信号的采样个数,它用赫兹(Hz)来表示。采样频率的倒数叫作采样周期或采样时间,它是采样之间的时间间隔。注意不要将采样率与比特率(bit rate,亦称―位速率‖)相混淆。

常见的几种高清视频编码格式

常见的几种高清视频编码 格式 The Standardization Office was revised on the afternoon of December 13, 2020

高清视频的编码格式有五种,即、MPEG-4、MPEG-2、WMA-HD以及VC-1。事实上,现在网络上流传的高清视频主要以两类文件的方式存在:一类是经过MPEG-2标准压缩,以tp和ts为后缀的视频流文件;一类是经过WMV- HD(Windows Media Video High Definition)标准压缩过的wmv文件,还有少数文件后缀为avi或mpg,其性质与wmv是一样的。真正效果好的高清视频更多地以与VC-1这两种主流的编码格式流传。 编码 编码高清视频 是由国际电信联盟(iTU-T)所制定的新一代的视频压缩格式。最具价值的部分是更高的数据压缩比,在同等的图像质量,的数据压缩比能比当前DVD系统中使用的 MPEG-2高2~3倍,比MPEG-4高~2倍。正因为如此,经过压缩的视频数据,在网络传输过程中所需要的带宽更少,也更加经济。在 MPEG-2需要6Mbps的传输速率匹配时,只需要1Mbps~2Mbps的传输速率,目前已经获得DVD Forum与Blu-ray Disc Association采纳,成为新一代HD DVD的标准,不过解码算法更复杂,计算要求比WMA-HD还要高。 从ATI的Radeon X1000系列显卡、NVIDIA的GeForce 6/7系列显卡开始,它们均加入对硬解码的支持。与MPEG-4一样,经过压缩的视频文件一般也是采用avi 作为其后缀名,同样不容易辨认,只能通过解码器来自己识别。 总的来说,常见的几种高清视频编码格式的特点是能够以更低的码率得到更高的画质,相同效果的MPEG2与影片做比较,后者在容量上仅需前者的一半左右。这也就意味着,不仅能够节省HDTV的存储空间,而且还可以在手机等带

关于视频容器格式和视频编码格式的问题

关于视频容器格式和视频编码格式的问题 新人刚刚学习会声会影,首先当然要搞懂这些参数设置和项目属性什么的。在以前没有接触会声会影的时候,我一直以为所谓的视频格式就是指文件后缀名而已,无非不过就是一些什么.avi .mp4 .3gp .rmvb等等之类的…就在最近做了一个视频,最后导出的时候,我选择了AVI格式,压缩为无,结果五分钟的视频直接10个G,无奈之下去网上查了下教程,然后我选择了MPEG4格式,压缩为H.264,渲染后很不错,视频很清晰(原素材的原因,看起来不是很清晰,但是我知道跟原素材比较起来能达到这种清晰程度很不错了,传上优酷是为超清作品),大小也不大,5分钟才80M,本来就这样完了…当时还有点小得意,其他新手觉得很复杂的一个问题我就这么轻松的处理了,但是我为了追求更高的质量,我就想把视频弄成avi格式,于是到网上查询了大量的资料,找到了一个让avi格式视频既清晰又大小合适的方法:就是将avi格式在自定义导出的时候将视频编码格式选择xvid mpeg4 code,方法有了,但是我又有新的疑问了,我明明是要导出avi格式的视频,但是这个视频编码格式看中间的样子却是MPEG4格式,怎么会这样呢,那这个视频到底是avi 还是mpeg4呢?于是我又查询了一上午的资料,终于搞懂了,视频编码格式和容器格式是不能混为一谈的,同一种容器格式可能是不同的视频编码格式,但是到了这里我就更糊涂了,视频编码格式和容器格式对视频的影响到底是什么呢?查询了大量的资料,依然无解,我是个不太喜欢那种别人给个操作步骤自己就按照那个步骤做的人,我通常学会了这种步骤后更希望搞懂它里面的原理——为什么要这样做。(网上的教程通常都是直接给步骤),以下表示我所面临的问题:1、容器格式和视频编码格式对视频的根本影响是什么?2、同一种容器格式采取不同的视频编码格式压缩后会有什么不同?3、不同的容器格式采取同一种视频压缩格式后有什么不同。跪求大神解答… 1不同的容器格式采取同一种视频压缩格式后有什么不同。 画质没有区别! 封装容器,只是衣服 编码,才是内涵! 比如,H.264编码的MKV/AVI/MP4/MTS/M2TS,使用相同原素材素材,使用相同分辨率、码率和编码设置都一样的情况下,不同的容器,压制出来的视频画质和文件大小没有任何区别!只不过MKV封装没有非编能够直接支持罢了! 2同一种容器格式采取不同的视频编码格式压缩后会有什么不同? 有区别 不同的视频编码的压缩效率和技术先进程度不同 比如 一个H.264编码视频文件,2500码率画质就足以胜过所有的DVD视频【DVD峰值码率9800】 而换做在国外早已被淘汰的落后编码RMVB的话,无论用多高的码率,也绝达不到DVD级别,技术的落后以及RMVB编码自身具有的模糊化特性极大地劣化了画质!RMVB或许能将视频文件压得很小,但绝不会有高画质! H.265编码已经制定,但尚未普及 如果使用,又是对电脑硬件的一次杀手级的考验! H.265编码技术比H.264更先进,画质更优秀,但是对硬件要求更是变态! 3容器格式和视频编码格式对视频的根本影响是什么?

视频格式及编码格式

一、常见的编码格式 1、无声时代的FLC FLC、FLI 是Autodesk 开发的一种视频格式,仅仅支持256 色,但支持色彩抖动技术,因 此在很多情况下很真彩视频区别不是很大,不支持音频信号,现在看来这种格式已经毫无用处,但在没有真彩显卡没有声卡的DOS 时代确实是最好的也是唯一的选择。最重要的是,Autodesk 的全系列的动画制作软件都提供了对这种格式的支持,包括著名的3D Studio X,因 此这种格式代表了一个时代的视频编码水平。直到今日,仍旧有不少视频编辑软件可以读取和生成这种格式。但毕竟廉颇老矣,这种格式已经被无情的淘汰。 2、载歌载舞的AVI AVI——Audio Video Interleave,即音频视频交叉存取格式。1992 年初Microsoft 公司推出 了AVI 技术及其应用软件VFW(Video for Windows)。在AVI 文件中,运动图像和伴音数据 是以交织的方式存储,并独立于硬件设备。这种按交替方式组织音频和视像数据的方式可使得读取视频数据流时能更有效地从存储媒介得到连续的信息。构成一个AVI 文件的主要参数 包括视像参数、伴音参数和压缩参数等。AVI 文件用的是AVI RIFF 形式,AVI RIFF 形式由字串 “AVI”标识。所有的AVI 文件都包括两个必须的LIST 块。这些块定义了流和数据流的格式。 AVI 文件可能还包括一个索引块。 只要遵循这个标准,任何视频编码方案都可以使用在AVI 文件中。这意味着AVI 有着非常好的扩充性。这个规范由于是由微软制定,因此微软全系列的软件包括编程工具VB、VC 都提供了最直接的支持,因此更加奠定了AVI 在PC 上的视频霸主地位。由于AVI 本身的开放 性,获得了众多编码技术研发商的支持,不同的编码使得AVI 不断被完善,现在几乎所有运 行在PC 上的通用视频编辑系统,都是以支持AVI 为主的。AVI 的出现宣告了PC 上哑片时代 的结束,不断完善的AVI 格式代表了多媒体在PC 上的兴起。 说到AVI 就不能不提起英特尔公司的Indeo video 系列编码,Indeo 编码技术是一款用于PC 视频的高性能的、纯软件的视频压缩/解压解决方案。Indeo 音频软件能提供高质量的压缩音

视频压缩技术

第31卷第4期哈尔滨工程大学学报V ol.31 No.4 2010年4月Journal of Harbin Engineering University Apr. 2010 文章题目 创新点自述创新点自述与摘要有一定的区别,作者应把文章具体新在哪里,好在哪里写出来,说明本文较前人工作有何创新,好的创新点自述能增加文章的可读性,也能给评审人留下好的印象。

2 哈尔滨工程大学学报第28卷 视频压缩技术 张明瑶 (哈尔滨工程大学,黑龙江省哈尔滨市 150001) 摘要:90年代以来,随着电子技术、图像通信技术的迅猛发展,视频压缩技术逐步规范与成熟。视频压缩是多媒体技术和产业发展的关键,而视频压缩标准则是多媒体产业发展的命脉。本文简单介绍与分析了现有的视频压缩技术与标准,概述了两种基本的视频压缩标准,并结合实际应用,对视频压缩技术的特点进行了较详细的阐述。 关键词:视频压缩;视频压缩技术;分析;应用 Doi:10.3969/j.issn.1006-7043. 中图分类号:(作者本人填写)文献标识码:A 文章编号:1006-7043 (2006) xx-xxxx-x Video compression technology ZHANG Mingyao ( Harbin Engineering University, Harbin, Heilongjiang, 150001,China) Abstract:Since the 90's, with the rapid development of electronic technology, image communication technology, video compression technology is gradually standardized and mature. Video compression is the key of multimedia technology and industrial development, and video compression standard is the lifeline for the development of multimedia industry. This paper introduces and analyzes the existing video compression technology and standard, this paper summarizes two kinds of basic video compression standard, and combining the practical application, the characteristics of video compression technology is discussed in detail. Keywords:Video compression; Video compression technology;Analysis; Application 人类已经步入信息时代,信息时代的重要特征是信息的数字化,而数字化的多媒体信息特别是视频信息的数据量之大是惊人的。例如,1幅64×480分辨率的彩色图像(24比特/像素),其数据量约为0.92MB,如果以每秒30帧的速度播放,则视频信号的数码率高达27.6Mbps。如果存放在650MB 的光盘中,在不考虑音频信号的情况下,每张光盘也只能播放24秒钟。因此,视频压缩技术的研究与应用是解决数字化视频存储和传输问题的关键。 近年来,视频压缩技术的进展已经进入多媒体领域的前沿。新的应用和新的产品几乎每天都会出现,所以在多媒体世界中要订立标准来保证一个制造商提供的设备和服务可以成功地与其他制造商的类似设备一起工作。现在已经妥善地确立了这方面的一些标准,包括JPEG、MPEG1、MPEG2和H. 330。现在,大多数采用ISDN的视像会议系统都符合ITU-TH. 320标准,而MPEG2则用在更高档的广播系统。除JPEG之外,这些标准确定了储存和传送视频和音频信号时压缩这些信号的规则。现在已经形成这些新标准和压缩算法来减少视频传输所需的带宽。 视频标准具有一些共有的特性,尤其是它们都采用分立余弦变换。但这些标准又是截然不同的,针对不同的用途,新的标准还会出现,以满足更多的用途。例如,H. 263是和H. 261有许多相似之处的视频标准,它可以通过普通的电话线进行优质的电视会议。MPEG4具有新功能改进的压缩比和图像质量。 1视频压缩技术概况 视频压缩技术是在数据压缩、数据编码的基础上发展起来的。国际图像专家组(motionpicture experts group),简称MPEG,是用来压缩视频的主要算法。MPEG主要有两个国际标准,一是1992年通过的MPEG-1,二是1994年通过的MPEG-2。同其它视频压缩方式相比,MPEG不仅能进行帧内数据压缩,还实现了帧间数据压缩,并采用了运动补偿技术。因此,MPEG在保证图象质量不变的情况下,提高了压缩效率,增加了压缩比,降低了数码率。MPEG-1(国际标准11172)的目标是产生比特率为1.2Mb/s的视频录像质量的输出(NTSC的352*

相关文档