文档视界 最新最全的文档下载
当前位置:文档视界 › 视频压缩基本算法与标准

视频压缩基本算法与标准

视频压缩基本算法与标准
视频压缩基本算法与标准

视频压缩

视频压缩又称视频编码,所谓视频编码方式就是指通过特定的压缩技术,将某个视频格式的文件转换成另一种视频格式文件的方式。

一般的通用数据压缩方案如下图:

压缩就是一个传播的过程,所以在压缩与解压缩之间,没有信号的丢失则称这种压缩就是无损的,相反的就是有损的,都有各自的算法,下面介绍。

无损压缩算法

一 游长编码(Run-Length Coding, RLC )

产生年代:未知。

主要人物:未知。

基本思想:如果我们压缩的信息源中的符号具有这样的连续的性质,即同一个符号常常形成连续的片段出现,那么我们可以对这个符号片段长度进行这样的的编码。

例子:输入:5555557777733322221111111

游长编码为:(5,6)(7,5)(3,3)(2,4)(l ,7)

二 变长编码:

1 香农-凡诺算法

产生年代:未知

主要人物:Shannon 和 Robert Fano

基本思想:对于每个符号出现的频率对符号进行排序,递归的将这些符号分成两部分,每一部分有相近的频率,知道只有一个符号未止。

说明:过程用一颗二叉树完成,它是一种自顶向下的过程,对于此输入5个字符则自然的分成2,3左右两子树,接着就是递归的过程。因为分法不唯一,所以下列输出是一种情况。

例子:输入:HELLO

输出:10 110 0 0 111(左子树标0)

2赫夫曼编码

产生年代:1952年

主演人物:David A.Huffman

基本思想:与香农-凡诺算法的区别在于,赫夫曼编码采用的是一种自下而存储器或网络

输出数据 解码器(解压缩) 编码器 输入数据

上的描述方式,先从符号的频率中选取最小的两个符号,合成一个新的结点,进行等效的代替,然后也是个递归过程。

说明:赫夫曼编码具有唯一的前缀性质和最优性。

例子:对于输入:HELLO 建立的一刻赫夫曼树 扩展:

扩展的赫夫曼编码,这是相对于数据中某个符号的概率较大(接近1.0)时,将几个符号组成组,然后为整个组赋予一个码字。

自适应的赫夫曼编码,这是一个边接收边编码的过程,完全的体现了适应的过程,需要对二叉树进行改变,由接收到的数据去添加进二叉树中,自动生成新的“赫夫曼树”。

三 基于字典的编码(Lempel-Ziv-Welch , LZW )

产生年代:1977年 1978年改进一,1984年改进二

主要人物:Jacob Ziv , Abraham Lempel , Terry Welch

基本思想:该算法利用了一种自适应的基于字典的压缩技术,字典就是给给不同的符号组合进行编码,生成一个个“单词”,自适应就是,单词是接收数据的时候,一个个生成的,字典会慢慢的边长。

例子:先从一个简单的字典开始 原字典单词 新生成的字典单词

我们输入: ABABBABCABABBA 输出:1 2 4 5 2 3 4 6 1

说明:只要待编码的符号序列是字符、字符串、字符、 字符串、字符、等等,编码器就会产生一个新的编码 来表示字符+字符串+字符,并且在解码器还没来得及 产生这个编码的时候马上将其投入使用。

四 算术编码

产生年代:追溯到1948年 20世纪七八十年代发展成熟

主要人物:Shannon Abramson Peter Elias

L: 2 1 O:1

0 0 1 1 H:1 E:1 code string

--------------------

1 A

2 B

3 C

S C output code string A B 1 4 AB B A 2 5 BA A B AB B 4 6 ABB B A BA B 5 7 BAB B C 2 8 BC C A 3 9 CA A B

AB A 4 10 ABA A B AB B ABB A 6 11 ABBA A EOF 1

基本思想:把整个消息看成一个单元。然后经过数字处理,计算出每个符号的频率范围,再由上限及下限产生码字……

( 我没看懂……)

有损压缩算法

一变换编码

1 离散余弦变换(DCT)

DCT 是一种广泛应用的变换编码方式,它能以数据无光的方式解除输入信号之间的相关性。例如对于JPEG和类似的图像压缩算法来说,压缩的第一步需要将图像分割为小块,同时将每个小块进行变换,使之由空域信号变换成为时域信号。这时候就会采用DCT,CT变换能够完整的保留所有8x8像素块的信息,因此反向离散余弦变换(IDCT)也就能够从8x8频域信号矩阵中完整的恢复原始8x8像素矩阵。

扩展:2D DCT, 2D IDCT。

2 Karhunen-Loeve 变换(KLT)

KLT变换是一种可逆的线性变换,它应用了向量表述的统计学原理。KLT变换主要的特征就是能够很好的解除输入的相关性。

二小波编码

这是一种信号的分解方法。它采用一组成为小波的基函数来表示信号,可以在时域和频域都得到很好的分辨率。小波变换有两种:连续小波变换(CWT)和离散小波变换(DWT)。

扩展:二维Haar变换

三小波包

紧接上文,解决小波变换值进行编码,怎样形成流。将采取一种叫做嵌入零树的数据结构。

嵌入式零树小波(EWZ)算法层次树集合划分(SPIHT)算法优化截断嵌入式编码(EBCOT)算法。

具体内容复杂,在这里不做介绍了。

JPEG图像

下面介绍JPEG图像的简单步骤:

1 把RGB转换为YIQ 或 YUV,并且二次采样。

2 对图像块进行DCT变换。(块是图像压缩的一个单位,能使DCT变换加快)。

3 进行量化。量化的目标是减少图像压缩所需要的位数。量化的过程就是将每个DCT系数向诺干预设值进行舍入得过程。这种对系数的编码方法可以通过两

步来实现:首先通过量化过程舍去次要的视频信息,然后利用统计学的方法尽可能少的对剩余的重要信息进行比特编码。

4进行Z编序和游长编码。在编码过程中,AC分量进行游长编码, DC分量采用(DPCM)差分脉冲编码调制。

5进行熵编码。熵编码(entropy encoding)是一类利用数据的统计信息进行压缩的无语义数据流的无损编码。JPEG编码允许赫夫曼编码和算术编码。

看到了基本的有损,无损算法在JPEG标准的应用。

再起视频压缩

视频是由一系列的时间上有序的图像(我们叫做帧)所组成的。解决视频压缩的一个简单的方案就是基于前面的帧的帧预测编码。视频的压缩不是对图像本身进行相减,而是按照时间顺序进行相减,并将残差进行编码。就是所说的时间冗余,而相对的图像处理主要面对的是空间冗余。

这里有两个很重要的压缩策略,形象的描述是:在足球比赛中,进行视频处理,在下一帧中寻找足球运动员的位置的策略叫做运动估计(ME),来回移动帧的位置为了最大程度上将球员从图像中减去,叫做运动补偿(MC)。

基于运动补偿的视频压缩

前面说的视频中时间冗余比较显著,可以利用这个特征,不必将每帧视频图像都作为一幅新的图像进行编码,而是用当前的帧和其他的帧的差值进行编码。一个简单的想法就是将一张图像的按照像素点值减去另一张图像,但不能达到很好的压缩率。由于帧图像的主要差别是由摄像头或者物体运动造成的,所以可以用“补偿”的概念来测量差值。这就是我们所说的视频压缩基于运动补偿的压缩算法。

该算法可以分为三个步骤:

1)运动估计(运动向量查找)。

2)基于运动补偿的预测。

3)预测误差的生成——差值。

我们知道,为提高效率,就把每张图像分为一个个宏块,运动补偿就是在图像的宏块级别起作用。把当前帧称为目标帧,很容易就知道,我们是要在目标帧中的宏块和参考帧(下面会说)中的最相似的宏块间寻找匹配。这种情况下,目标宏块由参考宏块预测生成。

参考宏块到目标宏块的位移称作运动向量(MV),两个宏块之间的差值叫做预测误差。

所以我们只要对运动向量和差值宏块进行编码。

搜索运动向量

我们应该知道运动向量的搜索就是一个匹配的问题,也就是相关性的问题。方便的原因,我们规定原点,目标帧,参考帧的像素,用平均绝对误差(MAD)来测量宏块的大小。搜索的目的是寻找一个向量使得MAD取得最小值。

一顺序搜索

寻找运动向量的最简单的方法就是顺序搜索参考帧中整个大小的窗口(也叫全搜索)。然后将窗口的每一个宏块逐个像素和目标帧中的宏块进行比较。

特点:代价高,实现编码困难。

二 2D对数搜索

2D对数搜索的方法搜索运动向量的过程中需要进行多次迭代,类似折半查找过程。

特点:相对于顺序搜索的算法,明显得到改善。

三分层搜索

运用该方法,初始的运动向量估计是从显著降低分辨率后的图像中获得的。因为图像的分辨率太低,缺少图像的细节内容,所以初始的运动向量估计值是比较粗糙的,要进行一层层的修正。

特点:速度再一次得到优化。

下面具体介绍视频压缩(编码)标准。

H.261

产生年代:1988年

提出者:国际电报电话咨询委员会(CCITT)

应用于:早期的数字电视压缩

支持的视频格式:QCIR, CIF。

H.261帧序列:有两种的类型的图像帧, I帧, P帧。

I帧:被视为独立的图像,基本上每一个I帧内应用和JPEG相似的变换编码方式。

P帧:不是对立的。它采用的是向前预测的编码方式,该方法中的当前的宏块(目标帧),是通过先前的I帧或者前面P帧(参考帧)中的

相似的宏块预测出来的,并对宏块间的差进行编码。

图像帧编码:

I帧编码:采用4:2:0的色彩二次采样,对于8x8子块进行离散余弦变换,同JPEG算法,后对DCT系数进行量化,最后通过Z字扫描并进行熵编码。

P帧预测编码:对目标帧的每一个宏块俩说,我们用前面所说的3种方法中的一种进行运动向量的分配,再用差值宏块测量预测误差,同样对于8x8的子块进行离散余弦变换、量化、Z字扫描和尚编码。

H.261的量化

标准中的量化,是对一个宏块中所有的DCT系数均采用一个常数,称为步长。

H.261编码器和解码器

在编码器中

当前帧为I帧,观察点从I帧中接收宏块,每个I经过离散余弦变换、量化、熵编码,将结果放入输出缓冲区中,准备发送。同时I量化后的DCT 系数被送到模块中进行量化逆变换和逆离散余弦变换,把这里得到的数据(I1)和从目标帧中输入的数据相加,另外在保留一份在帧内存中,用于下一帧P1的运动估计和基于运动补偿的预测。

接下来当前帧P1到达观察点,立即调用运动估计过程,在帧I1中位P1中的每一个块寻找最匹配的宏块,求得运动向量。这个运动向量的估计值被同时送到运动补偿的预测器和可变长度编码器。基于运动补偿的预测器给出P1中最匹配的宏块用P2表示。然后得到预测误差其值为D=P1-P2,接着D1进行DCT,量化,熵编码将结果输入到缓冲区中和前面的I一样得到D1然后D又与P2相加得P21,并放在下一帧的运动估计和基于运动补偿的预测。

在解码器中

输入码经过熵编码、量化逆变换和逆离散余弦变换。对于I帧,解码后的数据出现在观察点,然后同样的得到I1,I1被当做第一个输出帧,并且同时送到帧内存中进行保存。

接下来,P1作为输入码进行解码,在观察点得到预测误差D1,同样的得到P21,作为解码后的帧输出,同时存放在帧内存中。

H.261视频位流语法概述

这就是一个分层的结构,共四层,图像层、块组层、宏块层和块层。

H.263

产生年代:1995年

提出者:国际电联ITU-T

应用于:公交电话交换网络上的视频会议或其他可视化服务传输。

支持的视频格式:QCIR, CIF, sub-QCIF, 16CIF, 16CIF格式的视频

H.263的运动补偿

H.263中的运动补偿过程和H.261中的运动补偿过程相似。但是运动向(MV)不只是从当前块产生的。在H.263中并不是对MV进行编码,而是对误差向量进行编码。为了改善运动补偿的效果,减少预测的误差,H.263支持半像素精度的预测,二H.261支持完整的像素预测。

H.263的可选编码模式

除了核心的算法外H.263在附件中指定了许多可选的编码模式,以下四种常用:

1)无限制的运动向量模式

2)基于语法的算术编码模式

3)高级预测模式

4)PB帧模式

介绍B帧:B帧,他是同时由先前帧和后一帧双向预测而得到的,可以改善预测的质量,可以让我们在不牺牲画质的条件下提供压缩率。

另外,还有H.263+和H.263++标准。

MPEG-4 Part10/H.264

产生年代:2003年

提出者:国际电联ITU-T ISO/IEC的MPEG专家组共同指定

应用于:可视电话(固定或移动)、实时视频会议系统、视频监控系统、因特网视频传输以及多媒体信息存储等

H.264的特点

H.264在编码框架上还是沿用以往的MC-DCT结构,即运动补偿加变换编码的混合(hybrid)结构,因此它保留了一些先前标准的特点。然而,以下介绍的技术使得H.264比之前的视频编码标准在性能上有了很大的提高。应当指出的是,这个提高不是单靠某一项技术实现的,而是由各种不同技术带来的小的性能改进而共同产生的。

1. 帧内预测

对I帧的编码是通过利用空间相关性而非时间相关性实现的。以前的标准只利用了一个宏块内部的相关性,而忽视了宏块之间的相关性,所以一般编码后的数据量较大。为了能进一步利用空间相关性,H.264引入了帧内预测以提高压缩效率。简单地说,帧内预测编码就是用周围邻近的像素值来预测当前的像素值,然后对预测误差进行编码。

2. 帧间预测

与以往的标准一样,H.264使用运动估计和运动补偿来消除时间冗余,但是它具有以下四个不同的特点:

(1)预测时所用块的大小可变

由于基于块的运动模型假设块内的所有像素都做了相同的平移,在运动比较剧烈或者运动物体的边缘处这一假设会与实际出入较大,从而导致较大的预测误差,这时减小块的大小可以使假设在小的块中依然成立。另外小的块所造成的块效应相对也小,所以一般来说小的块可以提高预测的效果。

(2)更精细的预测精度

在H.264中,Luma分量的运动矢量(MV)使用1/4像素精度。Chroma分量的MV由luma MV导出,由于chroma分辨率是luma的一半(对4:2:0),所以其MV精度将为1/8,这也就是说1个单位的chroma MV所代表的位移仅为chroma 分量取样点间距离的1/8。如此精细的预测精度较之整数精度可以使码率节省超过20%。

(3)多参考帧

H.264支持多参考帧预测,即可以有多于一个(最多5个)的在当前帧之前解码的帧可以作为参考帧产生对当前帧的预测。这适用于视频序列中含有周期性运动的情况。采用这一技术,可以改善运动估计(ME)的性能,提高H.264解码器的错误恢复能力,但同时也增加了缓存的容量以及编解码器的复杂性。不过,H.264的提出是基于半导体技术的飞速发展,因此这两个负担在不久的将来会变得微不足道。较之只使用一个参考帧,使用5个参考帧可以节省码率5~10%。

(4)抗块效应滤波器

抗块效应滤波器,它的作用是消除经反量化和反变换后重建图像中由于预测误差产生的块效应,即块边缘处的像素值跳变,从而一来改善图像的主观质量,二来减少预测误差。需要注意的是,对于帧内预测,使用的是未经过滤波的重建图像。

3.整数变换

H.264对帧内或帧间预测的残差进行DCT变换编码。新标准对DCT的定义做了修改,使得变换仅用整数加减法和移位操作即可实现,这样在不考虑量化影响的情况下,解码端的输出可以准确地恢复编码端的输入。当然这样做的代价是压缩性能的略微下降。此外,该变换是针对4×4块进行的,这也有助于减少块效应。

4.熵编码

如果是Slice层预测残差,H.264有两种熵编码的方式:基于上下文的自适应变长码(CAVLC)和基于上下文的自适应二进制算术编码(CABAC);如果不是预测残差,H.264采用Exp-Golomb码或CABAC编码,视编码器的设置而定。

(1)CAVLC

VLC的基本思想就是对出现频率大的符号使用较短的码字,而出现频率小的符号采用较长的码字。这样可以使得平均码长最小。

在CAVLC中,H.264采用若干VLC码表,不同的码表对应不同的概率模型。编码器能够根据上下文,如周围块的非零系数或系数的绝对值大小,在这些码表中自动地选择,最大可能地与当前数据的概率模型匹配,从而实现了上下文自适应的功能。

(2)CABAC

算术编码是一种高效的熵编码方案,其每个符号所对应的码长被认为是分数。由于对每一个符号的编码都与以前编码的结果有关,所以它考虑的是信源符号序列整体的概率特性,而不是单个符号的概率特性,因而它能够更大程度地逼近信源的极限熵,降低码率。在CABAC中,每编码一个二进制符号,编码器就会自动调整对信源概率模型(用一个“状态”来表示)的估计,随后的二进制符号就在这个更新了的概率模型基础上进行编码。这样的编码器不需要信源统计特性的先验知识,而是在编码过程中自适应地估计。显然,与CAVLC编码中预先设定好若干概率模型的方法比较起来,CABAC有更大的灵活性,可以获得更好的编码性能——大约10%码率的降低。

5. SP Slice

SP Slice的主要目的是用于不同码流的切换(switch),此外也可用于码流的随机访问、快进快退和错误恢复。

6.灵活的宏块排序

灵活的宏块排序(flexible macroblock ordering,FMO),是指将一幅图像中的宏块分成几个组,分别独立编码,某一个组中的宏块不一定是在常规的扫描顺序下前后连续,而可能是随机地分散在图像中的各个不同位置。这样在传输时如果发生错误,某个组中的某些宏块不能正确解码时,解码器仍然可以根据图像的空间相关性依靠其周围正确译码的像素对其进行恢复。

总结:

视频压缩的目的是在保证质量的情况下,用更少的数据去存储,传播视频。视频压缩的一般方法中,少不了离散余弦变换、量化、熵编码,这是因为视频的压缩更多的是处理时间冗余。很重要的思想是预测,向前预测,向后预测,还有就是相关性,也就是让跟周围的关系联系起来,让自己复原的更彻底。视频可以看成是一幅幅图像以某个速度进行传播,而在压缩中跟多的是可看成把一部分看成一个图像的演化过程,然后下一部分又是一个新的演化。

视频压缩编解码标准

广州市诚讯电子有限公司培训教程之视频压缩编解码标准

目前视频流传输中最为重要的编解码标准有国际电联的H.261、H.263 、H.264 ,运动静止图像专家组的M-JPEG和国际标准化组织运动图像专家组的MPEG系列标准,此外在互联网上被广泛应用的还有Real-Networks的RealVideo、微软公司的WMV以及Apple公司的QuickTime等。 监控系统大致可分为信号采集、传输、记录三部分。应用不同的视频压缩格式会影响到图像清晰度、画面延时、稳定性,主要的视频压缩算法包括:M-JPEG、Mpeg、H.264、Wavelet(小波压缩)。

MPEG系列标准 MPEG-1标准: 广泛的应用在VCD 的制作和一些视频片段下载的网络应用上面,可以说99% 的VCD 都是用MPEG1 格式压缩的。 我们目前习惯的MP3,并不是MPEG-3,而是MPEG 1 layer 3,属于MPEG 1中的音频部分。MPEG 1的像质等同于VHS,存储媒体为CD-ROM,图像尺寸320×240,音质等同于CD,比特率为1.5Mbps。 MPEG-2标准: MPEG组织于1994年推出MPEG-2压缩标准,以实现视/音频服务与应用互操作的可能性。PEG-2标准是针对标准数字电视和高清晰度电视在各种应用下的压缩方案和系统层的详细规定,编码码率从每秒3Mbps~100Mbps。MPEG-2不是MPEG-1的简单升级,MPEG-2在系统和传送方面作了更加详细的规定和进一步的完善。MPEG-2特别适用于广播级的数字电视的编码和传送,被认定为DVD 和HDTV的编码标准。 MPEG-3标准: 是ISO/IEC最初为HDTV 开发的编码和压缩标准,要求传输速率在20Mbits/sev- 40Mbits/sec间,但这将使画面有轻度扭曲,而且由于MPEG2 的高速发展,此算法已被淘汰; MPEG-4标准: 传输速率要求较低,与MPEG-1和MPEG-2相比,更适于交互AV服务以及远程监控。 此算法也是目前在监控领域应用比较广泛、成熟的;

视频格式和压缩标准大全

网络摄像机和视频服务器作为网络应用的新型产品,适应网络传输的要求也必然成为产品开发的重要因素,而这其中视频图像的技术又成为关键。在目前中国网络摄像机和视频服务器的产品市场上,各种压缩技术百花齐放,且各有优势,为用户提供了很大的选择空间。 JPEG 、M-JPEG 有相当一部分国内外网络摄像机和视频服务器都是采用JPEG,Motion-JPEG压缩技术,JPEG、M-JPEG采用的是帧内压缩方式,图像清晰、稳定,适于视频编辑,而且可以灵活设置每路的视频清晰度和压缩帧数。另外,因其压缩后的格式可以读取单一画面,因此可以任意剪接,特别适用与安防取证的用途。 Wavelet Transform 小波变换也属于帧内压缩技术,由于这种压缩方式移除了图像的高频成分,仅保留单帧图像信号,特别适用于画面变更频繁的场合,且压缩比也得到了一定的提高,因此也被一些网络摄像机和视频服务器所采用,例如,BOSCH推出的NetCam-4系列数字网络摄像机,深圳缔佳生产的NETCAM系列网络摄像机等。 H.263 H.263是一个较为成熟的标准,它是帧间预测和变换编码的混合算法,压缩比较高,尤其适用低带宽上传输活动视频。采用H.263技术生产的网络型产品,其成本较为适中,软/硬件丰富,适合集中监控数量较多的需求,如深圳大学通信技术研究所开发的SF-10网络摄像机和SF-20视频服务器,深圳新文鼎开发的W750视频服务器和W74GM网络摄像机等采用的都是这一压缩技术。 MPEG-4 MPEG-4的着眼点在于解决低带宽上音视频的传输问题,在164KHZ的带宽上,MPEG-4平均可传5-7帧/秒。采用MPEG-4压缩技术的网络型产品可使用带宽较低的网络,如PSTN,ISDN,ADSL等,大大节省了网络费用。另外,MPEG-4的最高分辨率可达720×576,接近DVD 画面效果,基于图像压缩的模式决定了它对运动物体可以保证有良好的清晰度。MPEG-4所有的这些优点,使它成为当前网络产品生产厂商开发的重要趋势之一。 另外,也有部分厂商采用的是MPEG-1,MPEG-2压缩格式,除此之外,有的厂商还采用多种压缩技术相结合的方式,例如,有些国外推出的网络摄像机,其压缩方式就是MPEG-4,与JPEG 相结合,在可以看到JPEG静止图像的同时,利用MPEG-4高级压缩功能,令到高质量的动态图像也能在低带宽上传输。 纵观以上这些压缩技术,虽然MPEG-4以其良好的图像压缩性能,可支持非常低的宽带上达到视频会议的质量,从而成为未来网络型产品开发的主流方向,但就现在市场的应用情况来看,MPEG-4暂时还没有占到主导地位,究其原因,主要是由于虽然MPEG-4的国际标准已经制定,但MPEG-4的算法是公开的因而厂商各自为政,良莠不齐,对后续的二次开发带来了严重的影响,另外,MPEG-4在图像质量上也有待提高,在复杂的网路环境中,数据流

几种视频压缩技术概述

几种视频压缩技术概述 (返回) (一)、JPEG——静止图像压缩标准 1、 JPEG 国际标准化组织(ID)和国际电报电话咨询委员会(CCITT)联合成立的专家组织JPEG (Joint Photographic experts group经过五年艰苦细致地工作后,于是1991年3月 提出了ISO CDIO918号建议草案:多灰度静止图像的数字压缩编码(简称JPEG标准)。 这是一个适用于彩色和单多多灰度或连续色调静止数字图像的压缩标准。它包括基于 DPCM(差分脉冲编码调制)、DCT(离散余弦变换)和Huffman编码的有损压缩算法两个 部分。前者不会产生失真,但压缩比很小;后一种算法进行图像压缩住处虽有损失但压 缩比可以很大,压缩20倍左右时,人眼基本上看不出失真。JPEG标准有三个范畴: A、基本顺序过程Baseline sequential processes实现有损图像压缩。重建图像质量达 到人眼难以实现图像质量达到人眼难以观察出损失的要求。采用8*8像素自适应DCT算 法、量化及H uffman型的熵编码器。 B、基于DCT的扩展过程(Extended DCT Based Process)使用累进行工作方式,采用自 适应算术的编码过程。 C、无失真过程(Lossless Process)采用预测编码及Huffman(或算术编码),可保 证重建图像数据与原始图像数据完全相同。 基中的基本顺序过程是JPEG最基本的压缩过程:符合JPEG标准的硬软件编码/解码器都 必须支持和实现这个过程。另两个过程是可选扩展,对一些特定的应用项目有很大实用 价值。 (1)、JPEG算法 基本JPEG算法操作可分成以下三个步骤:通过离散余弦变换(DCT)去除数据冗余;使 用量化表对DCT系数进行量化,量化表是根据人类礼堂系统和压缩图像类型的特点进行 优化的量化系数矩阵;对量化后的DCT系数时行编码使其熵达到最小,熵编码采用 Huffman可变字长编码 (2)、离散余弦变换 JPEG采用8*8子块的二维离散余弦变换算法。在编者按码器的输入端,把原始图像(对

常见的几种高清视频编码格式

高清视频的编码格式有五种,即H.264、MPEG-4、MPEG-2、WMA-HD以及VC-1。事实上,现在网络上流传的高清视频主要以两类文件的方式存在:一类是经过MPEG-2标准压缩,以tp和ts为后缀的视频流文件;一类是经过WMV-HD(Windows Media Video High Definition)标准压缩过的wmv文件,还有少数文件后缀为avi或mpg,其性质与wmv是一样的。真正效果好的高清视频更多地以H.264与VC-1这两种主流的编码格式流传。 H.264编码 H.264编码高清视频 H.264是由国际电信联盟(iTU-T)所制定的新一代的视频压缩格式。H.264 最具价值的部分是更高的数据压缩比,在同等的图像质量,H.264的数据压缩比能比当前DVD系统中使用的 MPEG-2高2~3倍,比MPEG-4高1.5~2倍。正因为如此,经过H.264压缩的视频数据,在网络传输过程中所需要的带宽更少,也更加经济。在 MPEG-2需要6Mbps的传输速率匹配时,H.264只需要1Mbps~2Mbps 的传输速率,目前H.264已经获得DVD Forum与Blu-ray Disc Association采纳,成为新一代HD DVD的标准,不过H.264解码算法更复杂,计算要求比WMA-HD 还要高。 从ATI的Radeon X1000系列显卡、NVIDIA的GeForce 6/7系列显卡开始,它们均加入对H.264硬解码的支持。与MPEG-4一样,经过H.264压缩的视频文件一般也是采用avi 作为其后缀名,同样不容易辨认,只能通过解码器来自己识别。 总的来说,常见的几种高清视频编码格式的特点是能够以更低的码率得到更高的画质,相同效果的MPEG2与H.264影片做比较,后者在容量上仅需前者的一半左右。这也就意味着,H.264不仅能够节省HDTV的存储空间,而且还可以

视频编码标准汇总及比较

视频编码标准汇总及比较 MPEG-1 类型:Audio&Video 制定者:MPEG(Moving Picture Expert Group) 所需频宽:2Mbps 特性:对动作不激烈的视频信号可获得较好的图像质量,但当动作激烈时,图像就会产生马赛克现象。它没有定义用于额外数据流进行编对码的格式,因此这种技术不能广泛推广。它主要用于家用VCD,它需要的存储空间比较大。 优点:对动作不激烈的视频信号可获得较好的图像质量。 缺点:当动作激烈时,图像就会产生马赛克现象。它没有定义用于额外数据流进行编对码的格式,因此这种技术不能广泛推广。 应用领域:Mixer 版权方式:Free 备注:MPEG-1即俗称的VCD。MPEG是ISO/IEC JTC1 1988年成立的运动图像专家组(Moving Picture Expert Group)的简称,负责数字视频、音频和其他媒体的压缩、解压缩、处理和表示等国际技术标准的制定工作。MPEG-1制定于1992年,它是将视频数据压缩成1~2Mb/s的标准数据流。对于清晰度为352×288的彩色画面,采用25帧/秒,压缩比为50:1时,实时录像一个小时,经计算可知需存储空间为600MB左右,若是8路图像以每天录像10小时,每月30天算,则要求硬盘存储容量为1440GB,则显然是不能被接受的。 --------------------------------------------------------------------------------------------- MPEG-2

类型:Audio&Video 制定者:MPEG(Moving Picture Expert Group) 所需频宽:视频上4.3Mbps,音频上最低的采样率为16kHz 特性:编码码率从每秒3兆比特~100兆比特,是广播级质量的图像压缩标准,并具有CD 级的音质。MPEG-2的音频编码可提供左、右、中及两个环绕声道,以及一个加重低音声道,和多达7个伴音声道。作为MPEG-1的兼容性扩展,MPEG-2支持隔行扫描视频格式和其它先进功能,可广泛应用在各种速率和各种分辨率的场合。但是MPEG-2标准数据量依然很大,不便存放和传输。 优点:MPEG-2的音频编码可提供左、右、中及两个环绕声道,以及一个加重低音声道,和多达7个伴音声道,具有CD级的音质。可提供一个较广的范围改变压缩比,以适应不同画面质量、存储容量以及带宽的要求。支持隔行扫描视频格式和其它先进功能,可广泛应用在各种速率和各种分辨率的场合。 缺点:压缩比较低,数据量依然很大,不便存放和传输,如用于网络方面则需要较高的网络带宽,因此不太适合用于Internet和VOD点播方面。 应用领域:Mixer 版税方式:按个收取(最初的收费对象为解码设备和编码设备,中国DVD制造商每生产一台DVD需要交纳专利费16.5美元。向解码设备和编码设备收取的专利授权费每台2.5美元) 备注:MPEG-2是其颁布的(活动图像及声音编码)国际标准之一,制定于1994年,是为高级工业标准的图像质量以及更高的传输率而设计,为了力争获得更高的分辨率 (720×486),提供广播级视频和CD级的音频,它是高质量视频音频编码标准。在常规电视的数字化、高清晰电视HDTV、视频点播VOD,交互式电视等各个领域中都是核心的技术之一。由于MPEG-2在设计时的巧妙处理,使得大多数MPEG-2解码器也可播放MPEG-1格式的数据,如VCD。MPEG-2的音频编码可提供左、右、中及两个环绕声道,以及一个加重低音声道,和多达7个伴音声道。我们平时所说的DVD就是采用MPEG-2编码压缩,所以可有8种语言的配音。除了作为DVD的指定标准外,MPEG-2的应用前景非常的广阔,

怎么压缩视频,一分钟教会你压缩视频

怎么压缩视频,一分钟教会你压缩视频 视频怎么压缩,现在很多的视频文件都超出了网站的上传大小,想要将这些视频上传到网站,就需要将视频文件进行压缩,下面就是小编为大家带来的视频压缩的方法。 操作选用工具:迅捷压缩软件 迅捷压缩软件:https://https://www.docsj.com/doc/e56498089.html,/compress 具体操作步骤如下: 1:将压缩软件安装到自己的电脑中,打开软件找到视频压缩,点击视频压缩进入到压缩的页面。 2:在压缩的页面找到添加文件,将需要压缩的视频文件添加到压缩的界面,点击添加文件夹是将文件夹中的视频文件全部添加到压缩的页面中。

3:在下面找到压缩选项,分辨率以及输出格式,将输出格式设置到原格式,压缩选项和分辨率设置为自己需要的选项即可。 4:在底部找到保存至,将文件的保存路径提前设置到自己需要的位置,点击后面的文件夹图标就可以设置。也可以直接保存到原文

件夹。 5:点击开始压缩,需要压缩的视频文件就会在压缩的过程中,请耐心等待压缩的完成。压缩完成的视频文件会直接保存到设置到的文件夹中。

为大家分享一种在线压缩的方法。 1:找到这样一款在线压缩软件,进入到网站中,在网站首页找到在线视频压缩,点击在线视频压缩进入到压缩的页面中。 2:在压缩的页面中找到添加文件,点击添加文件就可以添加需要压缩的视频文件了,也可以直接将视频文件拖进压缩的页面。

3:在下面有压缩设置,将压缩设置更改到自己需要的选项,第二行为输出格式,将输出格式设置到原格式。 4:点击开始压缩,需要压缩的视频文件就会在压缩中,压缩完成的视频文件可以点击立即下载将文件下载到指定的文件夹。

音频、视频压缩有哪些技术标准

音频、视频压缩有哪些技术标准? 视频压缩技术有:MPEG-4、H263、H263+、H264等 MPEG-4视频编码技术介绍 MPEG是“Moving Picture Experts Group”的简称,在它之前的标准叫做JPEG,即“Joint Photographic Experts Group”。当人们用到常见的“.jpg”格式时,实际上正在使用JPEG的标准。JPEG规范了现代视频压缩的基础,而MPEG把JPEG 标准扩展到了运动图象。 MPEG-4视频编码标准支持MPEG-1、MPEG-2中的大多数功能,它包含了H.263的核心设计,并增加了优先特性和各种各样创造性的新特性。它提供不同的视频标准源格式、码率、帧频下矩形图像的有效编码,同时也支持基于内容的图像编码。采纳了基于对象(Object-Based)的编码、基于模型(Model-based)的编码等第二代编码技术是MPEG-4标准的主要特征。 MPEG4与MPEG1、MPEG2的比较 从上表可以看出,MPEG1和MPEG2主要应用于固定媒体,比如 VCD 和 DVD ,而对于网络传输,MPEG4具有无可比拟的优势。 H.263/H.263+/H.264视频编码技术介绍 1.H.263视频编码标准 1.H.263是最早用于低码率视频编码的ITU-T标准,随后出现的第二 版(H.263+)及H.263++增加了许多选项,使其具有更广泛的适用性。 H.263是ITU-T为低于64kb/s的窄带通信信道制定的视频编码标准。 它是在H.261基础上发展起来的,其标准输入图像格式可以是

S-QCIF、QCIF、CIF、4CIF或者16CIF的彩色4∶2∶0亚取样图像。 H.263与H.261相比采用了半象素的运动补偿,并增加了4种有效的 压缩编码模式。 2.H.263+视频压缩标准 1.ITU-T在H.263发布后又修订发布了H.263标准的版本2,非正式 地命名为H.263+标准。它在保证原H.263标准核心句法和语义不变 的基础上,增加了若干选项以提高压缩效率或改善某方面的功能。原 H.263标准限制了其应用的图像输入格式,仅允许5种视频源格式。 H.263+标准允许更大范围的图像输入格式,自定义图像的尺寸,从而 拓宽了标准使用的范围,使之可以处理基于视窗的计算机图像、更高 帧频的图像序列及宽屏图像。为提高压缩效率,H.263+采用先进的帧 内编码模式;增强的PB-帧模式改进了H.263的不足,增强了帧间预 测的效果;去块效应滤波器不仅提高了压缩效率,而且提供重建图像 的主观质量。为适应网络传输,H.263+增加了时间分级、信噪比和空 间分级,对在噪声信道和存在大量包丢失的网络中传送视频信号很有 意义;另外,片结构模式、参考帧选择模式增强了视频传输的抗误码 能力。 3.H.264视频压缩标准 1.H.264是由ISO/IEC与ITU-T组成的联合视频组(JVT)制定的新一 代视频压缩编码标准。对信道时延的适应性较强,既可工作于低时延 模式以满足实时业务,如会议电视等;又可工作于无时延限制的场合, 如视频存储等。 2.提高网络适应性,采用“网络友好”的结构和语法,加强对误码和 丢包的处理,提高解码器的差错恢复能力。 3.在编/解码器中采用复杂度可分级设计,在图像质量和编码处理之 间可分级,以适应不同复杂度的应用。 4.相对于先期的视频压缩标准,H.264引入了很多先进的技术,包括 4×4整数变换、空域内的帧内预测、1/4象素精度的运动估计、多参 考帧与多种大小块的帧间预测技术等。新技术带来了较高的压缩比, 同时大大提高了算法的复杂度。 G.7xx系列典型语音压缩标准介绍 G.7xx 是一组 ITU-T 标准,用于视频压缩和解压过程。它主要用于电话方面。在电话学中,有两个主要的算法,分别定义在 mu-law 算法(美国使用)和 a-law 算法(欧洲及世界其他国家使用),两者都是对数关系,但对于计算机的处理来说,后者的设计更为简单。 国际电信联盟G系列典型语音压缩标准的参数比较:

各种音视频编解码学习详解

各种音视频编解码学习详解 编解码学习笔记(一):基本概念 媒体业务是网络的主要业务之间。尤其移动互联网业务的兴起,在运营商和应用开发商中,媒体业务份量极重,其中媒体的编解码服务涉及需求分析、应用开发、释放license收费等等。最近因为项目的关系,需要理清媒体的codec,比较搞的是,在豆丁网上看运营商的规范标准,同一运营商同样的业务在不同文档中不同的要求,而且有些要求就我看来应当是历史的延续,也就是现在已经很少采用了。所以豆丁上看不出所以然,从wiki上查。中文的wiki信息量有限,很短,而wiki的英文内容内多,删减版也减肥得太过。我在网上还看到一个山寨的中文wiki,长得很像,红色的,叫―天下维客‖。wiki的中文还是很不错的,但是阅读后建议再阅读英文。 我对媒体codec做了一些整理和总结,资料来源于wiki,小部分来源于网络博客的收集。网友资料我们将给出来源。如果资料已经转手几趟就没办法,雁过留声,我们只能给出某个轨迹。 基本概念 编解码 编解码器(codec)指的是一个能够对一个信号或者一个数据流进行变换的设备或者程序。这里指的变换既包括将信号或者数据流进行编码(通常是为了传输、存储或者加密)或者提取得到一个编码流的操作,也包括为了观察或者处理从这个编码流中恢复适合观察或操作的形式的操作。编解码器经常用在视频会议和流媒体等应用中。 容器 很多多媒体数据流需要同时包含音频数据和视频数据,这时通常会加入一些用于音频和视频数据同步的元数据,例如字幕。这三种数据流可能会被不同的程序,进程或者硬件处理,但是当它们传输或者存储的时候,这三种数据通常是被封装在一起的。通常这种封装是通过视频文件格式来实现的,例如常见的*.mpg, *.avi, *.mov, *.mp4, *.rm, *.ogg or *.tta. 这些格式中有些只能使用某些编解码器,而更多可以以容器的方式使用各种编解码器。 FourCC全称Four-Character Codes,是由4个字符(4 bytes)组成,是一种独立标示视频数据流格式的四字节,在wav、avi档案之中会有一段FourCC来描述这个AVI档案,是利用何种codec来编码的。因此wav、avi大量存在等于―IDP3‖的FourCC。 视频是现在电脑中多媒体系统中的重要一环。为了适应储存视频的需要,人们设定了不同的视频文件格式来把视频和音频放在一个文件中,以方便同时回放。视频档实际上都是一个容器里面包裹着不同的轨道,使用的容器的格式关系到视频档的可扩展性。 参数介绍 采样率 采样率(也称为采样速度或者采样频率)定义了每秒从连续信号中提取并组成离散信号的采样个数,它用赫兹(Hz)来表示。采样频率的倒数叫作采样周期或采样时间,它是采样之间的时间间隔。注意不要将采样率与比特率(bit rate,亦称―位速率‖)相混淆。 采样定理表明采样频率必须大于被采样信号带宽的两倍,另外一种等同的说法是奈奎斯特频率必须大于被采样信号的带宽。如果信号的带宽是100Hz,那么为了避免混叠现象采样频率必须大于200Hz。换句话说就是采样频率必须至少是信号中最大频率分量频率的两倍,否则就不能从信号采样中恢复原始信号。 对于语音采样: ?8,000 Hz - 电话所用采样率, 对于人的说话已经足够 ?11,025 Hz ?22,050 Hz - 无线电广播所用采样率 ?32,000 Hz - miniDV 数码视频camcorder、DAT (LP mode)所用采样率 ?44,100 Hz - 音频CD, 也常用于MPEG-1 音频(VCD, SVCD, MP3)所用采样率

视频压缩编码标准H.264详解

视频压缩编码标准H.264详解 ——新疆大学2006级工硕郭新军 JVT(Joint Video Team,视频联合工作组)于2001年12月在泰国Pattaya 成立。它由ITU-T和ISO两个国际标准化组织的有关视频编码的专家联合组成。JVT的工作目标是制定一个新的视频编码标准,以实现视频的高压缩比、高图像质量、良好的网络适应性等目标。目前JVT的工作已被ITU-T接纳,新的视频压缩编码标准称为H.264标准,该标准也被ISO接纳,称为AVC(Advanced Video Coding)标准,是MPEG-4的第10部分。 H.264标准可分为三档: 基本档次(其简单版本,应用面广); 主要档次(采用了多项提高图像质量和增加压缩比的技术措施,可用于SDTV、HDTV和DVD等); 扩展档次(可用于各种网络的视频流传输)。 H.264不仅比H.263和MPEG-4节约了50%的码率,而且对网络传输具有更好的支持功能。它引入了面向IP包的编码机制,有利于网络中的分组传输,支持网络中视频的流媒体传输。H.264具有较强的抗误码特性,可适应丢包率高、干扰严重的无线信道中的视频传输。H.264支持不同网络资源下的分级编码传输,从而获得平稳的图像质量。H.264能适应于不同网络中的视频传输,网络亲和性好。 一、H.264视频压缩系统 H.264标准压缩系统由视频编码层(VCL)和网络提取层(Network Abstraction Layer,NAL)两部分组成。VCL中包括VCL编码器与VCL解码器,主要功能是视频数据压缩编码和解码,它包括运动补偿、变换编码、熵编码等压缩单元。NAL则用于为VCL提供一个与网络无关的统一接口,它负责对视频数据

几种视频压缩标准

几种视频压缩标准简介 3. 基于嵌入式视频服务器的网络化数字视频监控 3.1 什么是网络数字监控 简单的说,网络数字监控就是将传统的模拟视频信号转换为数字信号,通过计算机网络来传输,通过智能化的计算机软件来处理。 系统将传统的视频、音频及控制信号数字化,以IP包的形式在网络上传输,实现了视频/音频的数字化、系统的网络化、应用的多媒体化以及管理的智能化。 3.2 几种视频压缩标准简介 1)MJPEG MJPEG 是指Motion JPEG,即动态JPEG,按照25帧/秒速度使用JPEG 算法压缩视频信号,完成动态视频的压缩。是由JPEG专家组制订的,其图像格式是对每一帧进行压缩,通常可达到6:1的压缩率,但这个比率相对来说仍然不足。就像每一帧都是独立的图像一样。MJPEG图象流的单元就是一帧一帧的JPEG画片。因为每帧都可任意存取,所以MJPEG 常被用于视频编辑系统。动态JPEG能产生高质量、全屏、全运动的视频,但是,它需要依赖附加的硬件。而且,由于MJPEG不是一个标准化的格式,各厂家都有自己版本的MJPEG,双方的文件无法互相识别。 MJPEG的优点是画质还比较清晰,缺点是压缩率低,占用带宽很大。一般单路占用带宽2M左右。 2)H.263 H.263 视频编码标准是专为中高质量运动图像压缩所设计的低码率图像压缩标准。 H.263 采用运动视频编码中常见的编码方法,将编码过程分为帧内编码和帧间编码两个部分。埃帧内用改进的DCT 变换并量化,在帧间采用1/2 象素运动矢量预测补偿技术,使运动补偿更加精确,量化后适用改进的变长编码表(VLC)地量化数据进行熵编码,得到最终的编码系数。 H.263标准压缩率较高,CIF格式全实时模式下单路占用带宽一般在几百左右,具体占用带宽视画面运动量多少而不同。缺点是画质相对差一些,占用带宽随画面运动的复杂度而大幅变化。 3)MPEG-1 VCD标准。

视频压缩编解码标准综述

视频压缩编解码标准综述 摘要:本文从目前视频流传输中最为重要的编解码标准国际电联的H.261、H.263,运动静止图像专家组的M-JPEG,国际标准化组织运动图像专家组的MPEG系列标准,以及在互联网上被广泛应用的Real Video、WMT、 QuickTime等方面,详细地介绍了视频压缩编解码标准及其应用。 关键词:视频压缩编解码标准,H.261,H.263,M-JPEG,MPEG,MPEG-1,MPEG-2,MPEG-4,MPEG-7,MPEG-21,Real Video,WMT,QuickTime。 随着Internet带宽的不断增长,在Internet上传输视频的相关技术也成为Internet节研究和开发的热点。目前,许多实验性的高速宽带网络都把视频传输的技术和应用作为研究的重点课题。在Internet上传输视频有许多困难,其根本的原因在于Internet的无连接每包转发机制主要为突发性的数据传输设计,不适用于对连续媒体流的传输。为了在Internet上有效的、高质量的传输视频流,需要多种技术的支持,其中数字视频的压缩编码技术是Internet视频传输中的关键技术之一。此外,在多媒体的传输、处理、应用中还有许多问题:如何在网络上传输视频?如何通过手机上网并接收视频和图像?如何对多媒体 数据进行快速有效的检索?如何对多媒体信息进行统一的存取?等等。 目前视频流传输中最为重要的编解码标准有国际电联的H.261、H.263,运动静止图像专家组的M-JPEG和国际标准化组织运动图像专家组的MPEG系列标准,此外在互联网上被广泛应用的还有Real-Networks的RealVideo、微软公司的WMT 以及Apple公司的QuickTime等。具体如下: 一、国际电联的H.261、H.263标准 1.H.261 H.261又称为P*64,其中P为64kb/s的取值范围,是1到30的可变参数,它最初是针对在ISDN上实现电信会议应用特别是面对面的可视电话和视频会议而设计的。实际的编码算法类似于MPEG算法,但不能与后者兼容。H.261在实时编码时比MPEG所占用的CPU运算量少得多,此算法为了优化带宽占用量,引进了在图像质量与运动幅度之间的平衡折中机制,也就是说,剧烈运动的图像比相对静止的图像质量要差。因此这种方法是属于恒定码流可变质量编码而非恒定质量可变码流编码。 2.H.263 H.263是国际电联ITU-T的一个标准草案,是为低码流通信而设计的。但实际上

视频格式与编码压缩标准的关系

视频格式与编码压缩标准的关系 通过引入下面三个概念来介绍视频压缩知识。分别是:视频文件格式(简称:文件格式),视频封装格式(简称:视频格式),视频编码方式(简称:视频编码) 一,视频文件格式(简称:文件格式):我们知道Windows系统中的文件名都有后缀,例如1.doc,2.wps,3.psd等等。Windows设置后缀名的目的是让系统中的应用程序来识别并关联这些文件,让相应的文件由相应的应用程序打开。例如你双击1.doc文件,它会知道让Microsoft Office去打开,而不会用Photoshop去打开这个文件。所以常见的视频文件格式如1.avi,2.mpg 这些都叫做视频的文件格式,它由你电脑上安装的视频播放器关联。你可以随意改扩展名,但是真的对视频一点影响都没有,千万不要以为avi 改成mp4,视频就变成mp4 格式了。 二,视频封装格式(简称:视频格式):AVI,MPEG,VOB是一种视频封装格式,相当于一种储存视频信息的容器。它是由相应的公司开发出来的。我们可以在自己的电脑上看到的1.avi,2.mpg,3.vob这些视频文件格式的后缀名即采用相应的视频封装格式的名称。以下集中介绍几种封装格式: 1,AVI格式(后缀为.AVI):它的英文全称为Audio Video Interleaved,即音频视频交错格式。它于1992年被Microsoft公司推出。这种视频格式的优点是图像质量好。由于无损AVI可以保存alpha通道,经常被我们使用。缺点太多,体积过于庞大,而且更加糟糕的是压缩标准不统一,最普遍的现象就是高版本Windows媒体播放器播放不了采用早

视频压缩编码及常用格式

视频压缩编码及常用格式 数据压缩编码已经拥有很长的历史,压缩编码的理论基础是信息论。从信息的角度看,压缩就是去除数据中的消除冗余。即保留不确定的信息,去除确定的信息,用一种更接近信息本质的描述来代替原有冗余的描述压缩的目的是在尽可能保证视觉效果的前题下减少数据率。视频压缩比是指压缩后的数据量与压缩前的数据量之比。由于视频是连续的静态图像,因此其压缩编码算法与静态图像的压缩算法有某些共同的地方,但是运动的视频还有其本身的特性,因此在压缩是还要考虑其运动特性,这样才能达到高效果压缩的目的。 自从上世纪四十年代第一台电视机问世以来,视频技术的研究与应用已经有近六十年的历史。当前电视技术均为模拟视频技术,经过几十年的发展和完善,已经十分成熟。世界通行的模拟电视制式主要有:PAL(欧洲、中国)NTSC(北美、日本)和SECAM(法国)。 随着计算机技术近二十年的发展,特别是九十年代以来互联网的广泛应用,多媒体数字视频技术已经成为了当前信息科学中十分活跃的研究方向。数字化技术的引用。使得对视频信号的捕获、处理、压缩和储存都有了革命性的进步特别是在视频数据的压缩和储存上。国际电信联合会(ITC)于1990年正式提出了ITU-TH261建议,这是第一个关于使用化视频图像压缩编码的国际标准提议。九十年代中,IUT在该建议上提出了MPEG1、MPEG2、MPEG4、H.263和JPEG2000等压缩标准。这些标准的制定和颁布,极大的促进了数字视频压缩与编码技术的研究和实用化。 视频编码标准的发展 视频编码技术在近年得到了迅速的发展和广泛的应用,并在日渐成熟,起标准是多个视频编码国际化标准的制定与应用,即国际标准化组织ISO和国际电工委员会IEC关于静态图像的编码标准JPEG、国际电信联盟ITU-T关于电视、电话会议的视频编码标准H261、H.263及H.264和ISO/TEC关于活动图像的编码标准MPEG-1,MPEG-2、MPEG-4等。这些标准图像编码算法融合了各种性能优良的图像编码方法,代表了目前编码的发张水平。 MPEG-1 MPEG-1标准于1993年8月公布,用于传输1.5Mbps数据传输的数据储存媒体运动图像及其伴音的编码。该标准包括五个部分:第一:说明如何根据第二部(视频)以及第三部分(音频)的规定,对音频和视频进行复合编码。第四部分说明检验解码器或编码器的输出比流符合前三部分规定的过程。第五部分是一个用完整的C语言实现的编码和解码器。 MPEG-1取得一连串的成功,如VCD和MP3的大量使用,可携式MPEG-1摄像

常见的几种高清视频编码格式

常见的几种高清视频编码 格式 The Standardization Office was revised on the afternoon of December 13, 2020

高清视频的编码格式有五种,即、MPEG-4、MPEG-2、WMA-HD以及VC-1。事实上,现在网络上流传的高清视频主要以两类文件的方式存在:一类是经过MPEG-2标准压缩,以tp和ts为后缀的视频流文件;一类是经过WMV- HD(Windows Media Video High Definition)标准压缩过的wmv文件,还有少数文件后缀为avi或mpg,其性质与wmv是一样的。真正效果好的高清视频更多地以与VC-1这两种主流的编码格式流传。 编码 编码高清视频 是由国际电信联盟(iTU-T)所制定的新一代的视频压缩格式。最具价值的部分是更高的数据压缩比,在同等的图像质量,的数据压缩比能比当前DVD系统中使用的 MPEG-2高2~3倍,比MPEG-4高~2倍。正因为如此,经过压缩的视频数据,在网络传输过程中所需要的带宽更少,也更加经济。在 MPEG-2需要6Mbps的传输速率匹配时,只需要1Mbps~2Mbps的传输速率,目前已经获得DVD Forum与Blu-ray Disc Association采纳,成为新一代HD DVD的标准,不过解码算法更复杂,计算要求比WMA-HD还要高。 从ATI的Radeon X1000系列显卡、NVIDIA的GeForce 6/7系列显卡开始,它们均加入对硬解码的支持。与MPEG-4一样,经过压缩的视频文件一般也是采用avi 作为其后缀名,同样不容易辨认,只能通过解码器来自己识别。 总的来说,常见的几种高清视频编码格式的特点是能够以更低的码率得到更高的画质,相同效果的MPEG2与影片做比较,后者在容量上仅需前者的一半左右。这也就意味着,不仅能够节省HDTV的存储空间,而且还可以在手机等带

语音编码分类及编解码标准解读

语音编码分类及编解码标准 将音频或视频信号在模拟格式和数字格式之间转换的硬件(编码器/解码器);压缩和解压缩音频或视频数据的硬件或软件(压缩/解压缩);或是编码器/解码器和压缩/解压缩的组合。通常,编码解码器能够压缩未压缩的数字数据,以减少内存使用量。 编解码器(codec)指的是一个能够对一个信号或者一个数据流进行变换的设备或者程序。这里指的变换既包括将信号或者数据流进行编码(通常是为了传输、存储或者加密)或者提取得到一个编码流的操作,也包括为了观察或者处理从这个编码流中恢复适合观察或操作的形式的操作。编解码器经常用在视频会议和流媒体等应用中,通常主要还是用在广电行业,作前端应用。 G.711类型:Audio 制定者:ITU-T 所需频宽:64Kbps 特性:算法复杂度小,音质一般 优点:算法复杂度低,压缩比小(CD音质>400kbps),编解码延时最短(相对其它技术) 缺点:占用的带宽较高 应用领域:voip 版税方式:Free

备注:70年代CCITT公布的G.711 64kb/s脉冲编码调制PCM。 G.721类型:Audio 制定者:ITU-T 所需频宽:32Kbps 特性:相对于PCMA和PCMU,其压缩比较高,可以提供2:1 的压缩比。 优点:压缩比大 缺点:声音质量一般 应用领域:voip 版税方式:Free 备注:子带ADPCM(SB-ADPCM)技术。G.721标准是一个代码转换系统。它使用ADPCM转换技术,实现64 kb/s A律或μ律PC M速率和32 kb/s速率之间的相互转换。 G.722类型:Audio 制定者:ITU-T 所需频宽:64Kbps 特性:G722能提供高保真的语音质量 优点:音质好 缺点:带宽要求高 应用领域:voip

权威全面解析:高清和标清视频格式的图像尺寸

理解高清和标清视频格式的图像尺寸 目前,视频格式大致可以分为标清(SD)和高清(HD)两类。对于非线编辑而言,标清格式的视频素材主要有分为PAL制式和NTSC制式。我国大陆地区和香港电视节目使用的是PAL制式,而我国台湾地区、韩国、美国使用的NTSC制式。DV的画质标准就能满足标清格式的视频要求,一般PAL DV的图像像素尺寸为720×576,而NTSC DV的图像尺寸为720×480。所不同的是,PAL制式每秒钟传输25帧图像,而NTSL制式每秒钟传输29.97帧(按30帧计算,每隔10秒掉1帧)。 高清(HD)格式比较复杂。一般我们认为,图像垂直线数达到1080线为高清视频。由于高清图像的宽高比均应达到16:9,所以垂直1080线对应的水平宽度为1920线,也就是说标准的高清视频分辨率应该是1920×1080线,所以1920×1080线也叫全高清。但是需要注意的是,高清视频应该采用全帧传输,也就是逐行扫描。区别逐行还是隔行扫描的方式是看帧尺寸后面的字母。高清格式通常用垂直线数来代替图像的尺寸,比如1080i或者720p,就表示垂直线数是1080或者720。i代表隔行扫描,p代表逐行少描。高清视频中还出现i 帧,是为了向下兼容,向标清播放设备兼容。 介于高清(HD)和标清(SD)之间的视频帧尺寸,一般被称为小高清。比较有代表性的是HDV。 HDV的帧尺寸为1400×1080,采用隔行扫描的模式,或者逐行扫描模式,1280×720p。这种HDV是一种基于MPEG-2压缩的数据格式,通过MPEG压缩和减少了拍摄帧尺寸。HDV播放时通过拉伸图像,使之成为1920×1080。因而HDV不是真正的高清,一是因为HDV是压缩图像,其记录的数据量与DV相同,二是原帧尺寸达不到1920×1080,图像是通过拉伸的方式达到的。这样介于标清和高清之间的图像格式优缺点,请参见《高清视频格式概述》。高清视频格式概述因为最新的高清晰度视频规格支持多种帧尺寸、帧速率和扫描方法,所以当前有许多高清晰度格式可用。下面描述了最常用的格式。 1080i60 这是一种常见的广播格式,与标准清晰度NTSC视频兼容。 优点 由于分辨率高,此格式中的单个静帧的质量非常高。 29.97 fps帧速率和隔行扫描都兼容标准清晰度NTSC视频。 缺点 快速动作或快速摄影机移动都可能会造成交错假像。 1080i50 1080i50与标准清晰度PA L视频兼容。 优点 由于分辨率高,此格式中的单个静帧的质量非常高。 25 fps帧速率和隔行扫描都兼容标准清晰度PAL视频。 缺点 快速动作或快速摄影机移动都可能会造成交错假像。 因为帧速率较低,此格式所造成的运动假像比1080i60严重。

视频压缩编码标准H.264详解

视频压缩编码标准H.264详解

视频压缩编码标准H.264详解 ——新疆大学2006级工硕郭新军 JVT(Joint Video Team,视频联合工作组)于2001年12月在泰国Pattaya 成立。它由ITU-T和ISO两个国际标准化组织的有关视频编码的专家联合组成。JVT的工作目标是制定一个新的视频编码标准,以实现视频的高压缩比、高图像质量、良好的网络适应性等目标。目前JVT的工作已被ITU-T接纳,新的视频压缩编码标准称为H.264标准,该标准也被ISO接纳,称为AVC(Advanced Video Coding)标准,是MPEG-4的第10部分。 H.264标准可分为三档: 基本档次(其简单版本,应用面广); 主要档次(采用了多项提高图像质量和增加压缩比的技术措施,可用于SDTV、HDTV和DVD等); 扩展档次(可用于各种网络的视频流传输)。 H.264不仅比H.263和MPEG-4节约了50%的码率,而且对网络传输具有更好的支持功能。它引入了面向IP包的编码机制,有利于网络中的分组传输,支持网络中视频的流媒体传输。H.264具有较强的抗误码特性,可适应丢包率高、干扰严重的无线信道中的视频传输。H.264支持不同网络资源下的分级编码传输,从而获得平稳的图像质量。H.264能适应于不同网络中的视频传输,网络亲和性好。 一、H.264视频压缩系统 H.264标准压缩系统由视频编码层(VCL)和网络提取层(Network Abstraction Layer,NAL)两部分组成。VCL中包括VCL编码器与VCL解码器,主要功能是视频数据压缩编码和解码,它包括运动补偿、变换编码、熵编码等压缩单元。NAL则用于为VCL提供一个与网络无关的统一接口,它负责对视频数

几种视频压缩算法对比

视频压缩算法对比 视频2008-05-23 10:10:09 阅读557 评论0 字号:大中小订阅 视频压缩标准及比较原始的数字视频信号的数据量是相当惊人的,例如,NTSC 图像以大约640X480的分辨率,24bist/象素,每秒30帧的质量传输时,则视频数据有640X480x24X30=221Mb/S或28MB/s秒,显然这样庞大的数据流对大多数传输线路来说是无法承受的,而且也是无法存储的。为此人们开始专门研究将这些视频、音频数据流进行压缩。很多压缩编码标准相继推出,主要有JPEG月吐一JPEG‘,幻,_H.261旧.263和MPEG等标准。其中JPEG标准主要是用在静止图像的压缩。M一PJEG是将PJEG改进后用到运动图像上,在压缩比不高时,有较好的复现图像质量,但占用存储空间大;在压缩比高的情况下,复现图像质量差。.H261爪.263标准是专门为用于图像质量要求不高的视频会议和可视电话设计。MpEG(MovnigPictureExPertGorPu即活动图像专家组)。它是由150(国际标准化组织)和正(c国际电工委员会)于1988年联合成立的。专门致力于运动图像及伴音编码标准化工作。它们推出了MPEG编码标准【1卜,1l。到现在为止,专家组己制定了MPEG一1,MPEG一2和MPEG一4三种标准,由于其标准化、较大的压缩比及较高的画面质量,成为视频压缩系统首选算法。 MPEGI是一种压缩比高但图像质量稍差的技术;而MPEGZ技术主要专注于图像质量,压缩比小,因此需要的存储空间就大;MPEG4技术是时下比较流行的技术,使用这种技术可以节省空间、提高图像质量、节省网络传输带宽等优点。 来自:https://www.docsj.com/doc/e56498089.html,/blog/static/80720305200842310109120/

主流视频编解码格式介绍

前言 2009年,随着“高清MP4”浪潮在市场上的风生水起,令原本略感寒意的MP4市场重获温暖。依靠10M码流解码、支持1280×720分辨率视频直播,以及播放没有色块这三大要素,为用户打造更清晰的画质、更纯粹的音质、更完美的媒介,从而搭建起一座多媒体视听娱乐的金字塔,丰富璀璨的多媒体视听娱乐。 高清MP4标准 对于新生出的高清MP4,很多消费者的了解都比较有限,会存在着或多或少的疑惑,为此,笔者特别整理出相关的信息,为你依次扫除心中的迷雾,探究神秘面纱下的真实面目,帮助你畅享娱乐时尚、享受高清视听。

高清《变形金刚2》视频 高清的定义 高清,英文为“High Definition”,即指“高分辨率”。高清电视(HDTV),是由美国电影电视工程师协会确定的高清晰度电视标准格式。现在的大屏幕液晶电视机,一般都支持1080i和720P,而一些俗称的“全高清”(Full HD),则是指支持1080P输出的电视机。

而现在很多的朋友都想通过电脑或MP4来观看高清电视,那什么样的电影才是真正的高清电影呢?下面就给大家介绍几个高清电影常用的分辨率: 720p格式,750条垂直扫描线,720条可见垂直扫描线,16:9,分辨率为1280×720,逐行/60Hz,行频为45KHz。 1080i格式,1125条垂直扫描线,1080条可见垂直扫描线,16:9,分辨率为1920×1080,隔行/60Hz,行频为33.75KHz。 1080p格式,1125条垂直扫描线,1080条可见垂直扫描线,16:9,分辨率为1920×1080逐行扫描,专业格式。 其中i和p分别是interlace scan(隔行扫描)和progressive scan(逐行扫描)的缩写。 分辨率对比 任何事情都不可能是完美的,同样1080i和720p两个规格也有着各自的优点和缺点。隔行扫描的方式在显示静止画面时存在缺陷,有轻微的闪烁和爬行现象,720p的逐行扫描解决了闪烁现象,但是720p的图像有效利用率低,因为它在行场消隐期间消耗了过多的像素,而1080i则有更多像素用来表现图像。在表现普通电视节目、电影等慢速运行的视频时,1080i优势明显;而在表现体育节目等快速运动的视频时,720p则更适合。 高清解码格式 由于高清视频分辨率高,像素量大,导致了视频原始文件大小都拥有着恐怖的数据,一部未经压缩,普通格式1080P高清影片就会占用几百GB乃至上千GB的存储空间,所以要通过编码技术来缩减视频文件的体积。目前的高清视频编码格式主要有H.264、VC-1、MPEG-2、MPEG-4、DivX、XviD、WMA-HD以及X264。事实上,现在网络上流传的高清视频主要以两类

相关文档