文档视界 最新最全的文档下载
当前位置:文档视界 › 视频压缩原理

视频压缩原理

视频压缩原理
视频压缩原理

第1章介绍

1. 为什么要进行视频压缩?

?未经压缩的数字视频的数据量巨大

?

存储困难

?

?一张DVD只能存储几秒钟的未压缩数字视频。

?

传输困难

?

?1兆的带宽传输一秒的数字电视视频需要大约4分钟。

2.?为什么可以压缩

?

去除冗余信息

?

?空间冗余:图像相邻像素之间有较强的相关性

?时间冗余:视频序列的相邻图像之间内容相似

?编码冗余:不同像素值出现的概率不同

?视觉冗余:人的视觉系统对某些细节不敏感

?知识冗余:规律性的结构可由先验知识和背景知识得到3.?数据压缩分类

无损压缩(Lossless)

?

?压缩前解压缩后图像完全一致X=X'

?压缩比低(2:1~3:1)

?例如:Winzip,JPEG-LS

?

有损压缩(Lossy)

?

?压缩前解压缩后图像不一致X≠X'

?压缩比高(10:1~20:1)

?利用人的视觉系统的特性

?例如:MPEG-2,H.264/AVC,AVS 4.?编解码器

?

编码器(Encoder)

?

?压缩信号的设备或程序

?

解码器(Decoder)

?

?解压缩信号的设备或程序

编解码器(Codec)

?

?编解码器对

5. 压缩系统的组成

(1) 编码器中的关键技术

(2) 编解码中的关键技术

6.?编解码器实现

?

编解码器的实现平台:

?

?

超大规模集成电路VLSI

?

?ASIC,FPGA

?数字信号处理器DSP

?软件

?

编解码器产品:

?

?机顶盒

?数字电视

?摄像机

?监控器

7. 视频编码标准

编码标准作用:

?

兼容:

?

?不同厂家生产的编码器压缩的码流能够被不同厂家的解码器解码

?

高效:

?

?标准编解码器可以进行批量生产,节约成本。

主流的视频编码标准:

?MPEG-2

?MPEG-4 Simple Profile

?H.264/AVC

?AVS

?VC-1

标准化组织:

?

ITU:International Telecommunications Union

?

?VECG:Video Coding Experts Group

?

ISO:International Standards Organization

?

?MPEG:Motion Picture Experts Group

8. 视频传输

?视频传输:通过传输系统将压缩的视频码流从编码端传输到解码端?传输系统:互联网,地面无线广播,卫星

9. 视频传输面临的问题

?

传输系统不可靠

?

?带宽限制

?信号衰减

?噪声干扰

?传输延迟

?

视频传输出现的问题

?

?不能解码出正确的视频

?视频播放延迟

10. 视频传输差错控制

?差错控制(Error Control)解决视频传输过程中由于数据丢失或延迟导致的问题?

差错控制技术:

?

?信道编码差错控制技术

?编码器差错恢复

?解码器差错隐藏

11.?视频传输的QoS参数

?数据包的端到端的延迟

?带宽:比特/秒

?数据包的流失率

?数据包的延迟时间的波动

第2章数字视频

1.图像与视频

?图像:是人对视觉感知的物质再现。

?三维自然场景的对象包括:深度,纹理和亮度信息

?二维图像:纹理和亮度信息

?视频:连续的图像。

?视频由多幅图像构成,包含对象的运动信息,又称为运动图像。

2. 数字视频

?

数字视频:自然场景空间和时间的数字采样表示。

?

空间采样

?

?解析度(Resolution)

?

时间采样

?

?帧率:帧/秒

3. 空间采样

?二维数字视频图像空间采样

4. 数字视频系统

?

采集

?

?照相机,摄像机

?

处理

?

?编解码器,传输设备

?

显示

?显示器

5. 人类视觉系统HVS

?

HVS

?

?眼睛

?神经

?大脑

?

HVS特点:

?

?对高频信息不敏感

?对高对比度更敏感

?对亮度信息比色度信息更敏感

?对运动的信息更敏感

6. 数字视频系统的设计应该考虑HVS的特点:

?丢弃高频信息,只编码低频信息

?提高边缘信息的主观质量

?降低色度的解析度

?对感兴趣区域(Region of Interesting,ROI)进行特殊处理7. RGB色彩空间

?三原色:红(R),绿(G),蓝(B)。

?任何颜色都可以通过按一定比例混合三原色产生。

?

RGB色度空间

?

?由RGB三原色组成

?广泛用于BMP,TIFF,PPM等

?每个色度成分通常用8bit表示[0,255]

8. YUV色彩空间

?

YUV色彩空间:

?

?Y:亮度分量

?UV:两个色度分量

?YUV更好的反映HVS特点

9. RGB转化到YUV空间

亮度分量Y与三原色有如下关系:

经过大量实验后ITU-R给出了,?,??,

主流的编解码标准的压缩对象都是YUV图像

10.?YUV图像分量采样

?YUV图像可以根据HVS的特点,对色度分量下采样,可以降低视频数据量。

?根据亮度和色度分量的采样比率,YUV图像通常有以下几种格式:11. 通用的YUV图像格式

?根据YUV图像的亮度分辨率定义图像格式

12. 帧和场图像

?一帧图像包括两场——顶场,底场

13. 逐行与隔行图像

?逐行图像:一帧图像的两场在同一时间得到,t top=t bot。

?隔行图像:一帧图像的两场在不同时间得到,?t top≠t bot。

14. 视频质量评价

?有损视频压缩使编解码图像不同,需要一种手段来评价解码图像的质量。

?

质量评价:

?

?客观质量评价

?主观质量评价

?基于视觉的视频质量客观评价

?客观质量评价:通过数学方法测量图像质量评价的方式。

?

优点:

?

?可量化

?测量结果可重复

?测量简单

?

缺点:

?

?不完全符合人的主观感知

15. 客观评价的方法

常用的客观评价方法:

16. 主观评价方法

?主观质量评价:用人的主观感知直接测量的方式。

?

优点:

?

?符合人的主观感知

?

缺点:

?

?不容易量化

?受不确定因素影响,测量结果一般不可重复

?测量代价高

常用主观评价方法

17.?基于视觉的视频质量客观评价方法

?基于视觉的视频质量客观评价:将人的视觉特性用数学方法描述并用于视频质量评价的方式。

?结合了主观质量评价和客观质量评价两方面优点。

?常用方法:结构相似度(Structural SIMilarity,SSIM)方法。

?将HVS的特征用数学模型表达出来。

?未来重要的研究方向

第3章信息论基础

1. 通信系统的组成

?信源:产生消息

?信道:传输消息

?信宿:接收消息

2. 基本概念

?

通信中对信息的表达分为三个层次:信号,消息,信息。

?

?信号:是信息的物理层表达,可测量,可描述,可显示。如电信号,光信号。

?消息:是信息的载体,以文字,语言,图像等人类可以认知的形式表示。

?信息:不确定的内容。

3. 信息熵

信息的特点

信息的测量

自信息量

条件信息量

4. 信息熵

5. 条件熵和联合熵

6. 熵的性质

?非负性:信源熵是非负值,即H(X) >=0;

?扩展性:信源熵X有M个符号,如果其中一个符号出现的概率趋于零,信源熵就等于剩余M-1个符号的信源熵;

?极值性(最大信息熵):对于具有M个符号的信源,只有在所有符号等概率出现的情况下,信源熵达到最大值,即

?可加性:

?熵不增:条件熵不大于信息熵?H(X|Y) <= H(X);

?联合熵不大于各信息熵的和,即H(XY) <= H(X) + H(Y)。

7. 互信息量

8. 互信息

?物理意义:H(X)是X所含的信息,H(X|Y)是已知Y的条件下X还能带来的信息量。

那么两者之差就是由于知道Y使得X减少的信息量,也即由Y可以得到的关于X的信息量。

9. 各种熵的关系

11. 信源编码

?信源编码:将消息符号转变成信道可传输的信息。

?

两个基本问题:

?

?用尽可能少的信道传输符号来传递信源消息,提高传输效率;

?减少由于信道传输符号的减少导致的失真。

12. 离散信源统计特性

13. 离散信源类型:简单无记忆信源和马尔可夫信源

14. 编码分类

?等长码:在一组码字集合C中的所有码字c m?(m?= 1,2, …,M),其码长都相同,则称这组码C为等长码。

?变长码:若码字集合C中的所有码字c m?(m?= 1,2, …,M),其码长不都相同,称码C为变长码。

15. 平均码长

16. 等长码与变长码比较

?等长编码将信源输出符号序列的任意一种取值(概率可能不同)都编码成相同长度的输出码字,没有利用信源的统计特性;

?变长编码可以根据信源输出符号序列各种取值的概率大小不同,将他们编码成不同长度的输出码字,利用了信源的统计特性。因此又称其为熵编码。

17. Huffman编码

?Huffman编码:典型的变长编码。

?

步骤:

?

?将信源符号按概率从大到小的顺序排列,假定p(x1)≥?p(x2)…≥?p(x n)

?给两个概率最小的信源符号p(x n-1),?p(x n)各分配一个码位"0"和"1",将这两个信源符号合并成一个新符号,并用这两个最小的概率之和作为新符号的

概率,结果得到一个只包含(n-1)个信源符号的新信源。称为信源的第一次缩

减信源,用S1表表示。

?将缩减信源S1的符号仍按概率从大到小的顺序排列,重复步骤2,得到只含(n-2)个符号的缩减信源S2。

?重复上述步骤,直至缩减信源只剩下两个符号为止,此时所剩两个符号的概率之和必为1。然后从最后一级缩减信源开始,依编码路径向前返回,就得

到各信源符号所对应的码字。

18. 信道编码

?信道编码主要考虑如何增加信号的抗干扰能力,提高传输的可靠性,并且提高传输效率。

?一般是采用冗余编码法,赋予信码自身一定的纠错和检错能力,使信道传输的差错概率降到允许的范围之内。

19. 信道类型

?

根据信道连续与否分类

?

?离散信道

?连续信道

?半连续信道

?

根据信道是否有干扰分类

?

?无干扰信道

?有干扰信道

?

根据信道的统计特性分类

?

?无记忆信道

?有记忆信道

?恒参信道

?变参信道

?对称信道

?非对称信道

20. 信道容量

?在信息论中,称信道无差错传输的最大信息速率为信道容量。

?

仙农信道容量公式:

?

?假设连续信道的加性高斯白噪声功率为N,信道带宽为B,信号功率为S,则该信道的容量为

?由于噪声功率N与信道带宽B有关,则噪声功率N=n0B?。因此,仙农公式还可以表示为

21. 香农信道容量公式的意义

?在给定B和S/N的情况下,信道的极限传输能力为C,而且此时能够做到无差错传输。如果信道的实际传输速率大于C?值,则无差错传输在理论上就已不可能。因此,实际传输速率一般不能大于信道容量C?,除非允许存在一定的差错率。

?提高信噪比S/N(通过减小n0或增大S),可提高信道容量C。特别是,若n0->0,则C->∞,这意味着无干扰信道容量为无穷大;

?增加信道带宽B,也可增加信道容量C,但做不到无限制地增加。这是因为,如果?S、n0一定,有

?维持同样大小的信道容量,可以通过调整信道的B及S/N来达到,即信道容量可以通过系统带宽与信噪比的互换而保持不变。

22. 失真

?失真:信源的消息经过编解码后不能完全复原

?

在实际的信源和信道编码中,消息的传输并不总是无失真的。

?

?由于存储和传输资源的限制

?噪声等因素的干扰

23. 率失真理论

?

仙农定义了信息率失真函数R(D)

?

?D是消息失真

?R是码率

?率失真定理:在允许一定失真度D的情况下,信源输出的信息率可压缩到R(D)。

24. 失真函数

?失真函数:信源符号X={x1,?x2, …..x n},经信道传输接收端符号Y={y1,?y2….y n},对于每一对(x i,?y j)指定一个非负函数?d(x i,?y j),称d(x i,?y j)为单个符号的失真度或失真函数。对于连续信源连续信道的情况,常用d(x,?y)表示。

?

常用失真函数:

?

?

?

平均失真度:

?

?

第四章视频编码基础

1. 压缩码流

?

语法:码流中各个元素的位置关系

?

?01001001…

?图像编码类型(01),宏块类型(00),编码系数1001等

?

语义:每个语法元素所表达的意义。

?

?例如:图像编码类型

2. 编码层次

?序列(Sequence)

?图像组(Group of Pictures,GOP)

?图像(Picture)

?条带(Slice)

?宏块(Macroblock,MB)

?块(Block)

3. 码流结构

3. PB帧编码

4. 序列编码对象

(1)IBBP序列

?序列:一段连续编码的并具有相同参数的视频图像。

?

序列起始码:专有的一段比特串,标识一个序列的压缩数据的开始?

?MPEG-2的序列起始码为十六进制数000001(B3)。

?

序列头:记录序列信息

?

?档次(Profile),级别(Level),宽度,高度,是否是逐行序列,帧率等。

?

序列结束码:专有的一段比特串,标识该序列的压缩数据的结束

?

?MPEG-2的序列结束码为十六进制数000001(B7)。

5. 图像组编码对象

6. 图像编码结构

?图像:

?

图像起始码:专有的一段比特串,标识一个图像的压缩数据的开始

?

?MPEG-2的图像起始码为十六进制数000001(00)。

?

图像头:记录图像信息

?

?图像编码类型,图像距离,图像编码结构,图像是否为逐行扫描。

7. 图像分块编码

8. 条带编码结构

?条带:多个宏块的组合。

?

条带起始码:专有的一段比特串,标识一个条带的压缩数据的开始

?

视频压缩原理

1. 为什么要进行视频压缩 未经压缩的数字视频的数据量巨大 存储困难 一张DVD只能存储几秒钟的未压缩数字视频。 传输困难 1兆的带宽传输一秒的数字电视视频需要大约4分钟。 2. 为什么可以压缩 ? 去除冗余信息 ? 空间冗余:图像相邻像素之间有较强的相关性 时间冗余:视频序列的相邻图像之间内容相似 编码冗余:不同像素值出现的概率不同 视觉冗余:人的视觉系统对某些细节不敏感 知识冗余:规律性的结构可由先验知识和背景知识得到3. 数据压缩分类 ? 无损压缩(Lossless) ? 压缩前解压缩后图像完全一致X=X' 压缩比低(2:1~3:1) 例如:Winzip,JPEG-LS ?

有损压缩(Lossy) ? 压缩前解压缩后图像不一致X≠X' 压缩比高(10:1~20:1) 利用人的视觉系统的特性 例如:MPEG-2,AVC,AVS 4. 编解码器 ? 编码器(Encoder) ? 压缩信号的设备或程序 ? 解码器(Decoder) ? 解压缩信号的设备或程序 ? 编解码器(Codec) ? 编解码器对 5. 压缩系统的组成 (1) 编码器中的关键技术 (2) 编解码中的关键技术 6. 编解码器实现 ?

编解码器的实现平台: ? ? 超大规模集成电路VLSI ? ASIC, FPGA 数字信号处理器DSP 软件 ? 编解码器产品: ? 机顶盒 数字电视 摄像机 监控器 7. 视频编码标准 编码标准作用: ? 兼容: ? 不同厂家生产的编码器压缩的码流能够被不同厂家的解码器解码? 高效: ? 标准编解码器可以进行批量生产,节约成本。 主流的视频编码标准: MPEG-2 MPEG-4 Simple Profile AVC

视频压缩编码技术及应用

2005年第9期信息技术 中图分类号:T N919.31 文献标识码:B 文章编号:1009-2552(2005)09-0047-02 MPEG4视频压缩编码技术及应用 赵 巍,艾斯卡尔 (新疆大学电子系,乌鲁木齐830046) 摘 要:MPEG4是国际标准组织制定的多媒体通信的标准,文中概述了MPEG4的背景,MPEG4与MPEG1,MPEG2的主要区别以及MPEG4的主要技术。最后,展望了MPEG4的应用前景。 关键词:MPEG4;视频对象平面 MPEG4video compression coding technology and its application ZHAO Wei,Askar (Dep artment of E lectron.Xinjiang U niversity,U rumqi830046,China) Abstract:The MPEG4standard is w orked out for multimedia communications by IS O.This paper deseribes the background of MPEG4’s appearance,the basic structure of MPEG4,the main differences between MPEG4 and MPEG1Π2,the key technology of MPEG4.Finally,it forecasts the foreground of its application. K ey w ords:MPEG4;VOP 0 前言 解决视频、音频数字化后数据量大与数字存储媒体和通信网容量小的矛盾的主要途径之一就是压缩。为此,国际标准化组织先后于1993年和1995年制定了视频、音频编码的国际标准MPEG1和MPEG2。MPEG1,MPEG2技术当初制定时,它们定位的标准均为高层媒体表示与结构,但随着计算机软件及网络技术的快速发展,MPEG1,MPEG2技术的弊端就显示出来了:交互性及灵活性较低,压缩的多媒体文件体积过于庞大,难以实现网络的实时传播。因此,制定出了新的多媒体通信标准MPEG4。 1 MPEG4与MPEG1,MPEG2的比较MPEG1,MPEG2都是采用第一代压缩编码技术,着眼于图像信号的统计特性来设计编码器,属于波形编码的范畴。第一代压缩编码方案把视频序列按时间先后分为一系列帧,每一帧图像又分成宏块以进行运动补偿和编码。这种编码存在以下缺陷: (1)将图像固定地分成相同大小的块,在高压缩比的情况下会出现严重的块效应,即马赛克效应; (2)不能对图像内容进行访问、编辑和回放等操作; (3)不能充分利用人类视觉系统(H VS,Huaman Visual System)的特性。 MPEG4代表了基于模型Π对象的第二代压缩编码技术,它充分利用了人眼视觉特性,抓住了图像信息传输的本质,从轮廓、纹理思路出发,支持基于视觉内容的交互功能,这适应了多媒体信息的应用由播放型转向基于内容的访问、检索及操作的发展趋势。 MPEG4为支持基于内容编码而提出了AV (AVO,Audio Visual Object)对象的概念,在MPEG4中所见的视音频已不再是过去MPEG1,MPEG2中图像帧的概念,而是一个个视听场景(AV场景)。不同的AV场景由不同的AV对象组成,AV对象是听觉,视觉或视听内容的表示单元,其基本单位是原始AV 对象,它可以是自然的或合成的声音,图像。原始AV对象具有高效编码,高效存储与传输以及可交互操作的特性,它又可进一步组成复合AV对象。 因此,MPEG4标准的基本内容就是对AV对象进行高效编织,组织,存储与传输。MPEG4B不仅可提供高压缩率,同时也可实现更好的多媒体内容互动性及全方位的寸取性,它采用开放的编码系统,可随时加入新的编码算法模块,同时也可根据不同应用需求现场配置解码器,以支持多种多媒体应用。 收稿日期:2005-03-02 作者简介:赵巍,男,硕士生,研究方向为数字图像处理。 — 7 4 —

超级视频压缩工具小日本 使用手册

超级视频压缩工具小日本使用手册 https://www.docsj.com/doc/f05493436.html,/content/12/0913/20/3676499_235961889.shtml 简介TMPGEnc的使用教程2007/07/11 近日在论坛里看到有越来越多的朋友开始对TMPGEnc这款软件产生了兴趣,笔者由衷地感到高兴. TMPGEnc一款相当不错的视频编码软件,它的特色在于体积小巧,功能强大,使用它我们能够很方便地制作出高质量的VCD\SVCD\DVD文件来。 图1:TMPGEnc的主界面 同时TMPGEnc由于较强的专业性能,受到了很多这方面资深玩家的喜爱,有的朋友甚至把能否熟练使用TMPGEnc当成是脱离菜鸟的标志,所以对于一般的入门者来说TMPGEnc总有着一股神秘而又不可接近的距离感。经常在论坛里看到有些朋友这么嘀咕:“这软件好是好,但这么专业的软件我能用好吗?它是不是真的适合我这样的新手使用呢?”其实不然,TMPGEnc作为一款比较成熟的商业软件,目前已经具备了比较人性化的设计,所以对于一般的初学者来说现在也无需掌握其较多的专业知识就能压缩出比较满意的作品来了。下面,笔者将“手把手教你”怎么拿TMPGEnc来简单地压缩出属于自己的一盒DVD 来。 文章目录: 选择视频格式与压缩质量 选择编码源文件-滤镜的设定 参数设定

码率的设定-完结 一、TMPGEnc的简介 首先,还是来简单地介绍一下TMPGEnc这款软件吧。TMPGEnc是津波(Tsunami)MPEG编码(Encoder)的拉丁字母的缩写,顾名思义它一款视频编码软件,自身并不具备采集功能,它的作用只是把从DV中采集下来的AVI等格式的视频文件重新进行编码转换成MPEG格式的视频文件,俗称压VCD或DVD。该软件是由日本人堀浩行在六年前开发,所以中国玩家给它起了个别名叫做“小日本”,该软件起先是一个自由软件,由于其体积小(不到5M),启动速度快,压缩出来的文件效果好,比起那些动辄数百M且价格昂贵的专业软件来说是很有优势的,更重要的是当时它是完全免费的,所以在短时间内就红遍全球。如今的TMPGEnc已经今非昔比了,现在的它已经是一款商业软件,而各方面也更趋向于成熟,但是购买它就付出一定的费用,具体可以参见其官方网站 https://www.docsj.com/doc/f05493436.html,/gb/gb_main.html。另外笔者强烈推荐大家使用其简体中文版,因为TMPGEnc的设置里涉及到一些专业名词,对于E文不好的朋友来说可能会有理解上的困难,因此本文所介绍的TMPGEnc版本为TMPGEnc PLUS 2.58简体中文正式版。 二、具体应用 说了这么多废话,下面开始进入正题吧。首先双击软件的安装包进行安装,TMPGEnc 的体积非常小巧,安装包的体积仅仅为3.35M,安装完成后也不过5.15M。正是由于其小巧大的体积,所以软件启动速度飞快,以笔者的P4 2.8G为例,所需时间不到3秒,对于受够了会声会影7等软件慢吞吞启动速度的朋友肯定会觉得眼前一亮。安装好软件,双击桌面上的TMPGEnc图标运行软件,这时首先出现的是一个项目向导,这便是TMPGEnc 的人性化设置之一,利用这个向导我们可以跳过很多的专业参数设置进而对TMPGEnc进行简单的操作。

视频压缩原理

第1章介绍 1. 为什么要进行视频压缩? ?未经压缩的数字视频的数据量巨大 ? 存储困难 ? ?一DVD只能存储几秒钟的未压缩数字视频。 ? 传输困难 ? ?1兆的带宽传输一秒的数字电视视频需要大约4分钟。 2. 为什么可以压缩 ? 去除冗余信息

? ?空间冗余:图像相邻像素之间有较强的相关性 ?时间冗余:视频序列的相邻图像之间容相似 ?编码冗余:不同像素值出现的概率不同 ?视觉冗余:人的视觉系统对某些细节不敏感 ?知识冗余:规律性的结构可由先验知识和背景知识得到3. 数据压缩分类 ? 无损压缩(Lossless) ? ?压缩前解压缩后图像完全一致X=X' ?压缩比低(2:1~3:1) ?例如:Winzip,JPEG-LS ? 有损压缩(Lossy) ? ?压缩前解压缩后图像不一致X≠X' ?压缩比高(10:1~20:1) ?利用人的视觉系统的特性 ?例如:MPEG-2,H.264/AVC,AVS

4. 编解码器 ? 编码器(Encoder) ? ?压缩信号的设备或程序 ? 解码器(Decoder) ? ?解压缩信号的设备或程序 ? 编解码器(Codec) ? ?编解码器对 5. 压缩系统的组成

(1) 编码器中的关键技术 (2) 编解码中的关键技术 6. 编解码器实现 ? 编解码器的实现平台: ? ?

超大规模集成电路VLSI ? ?ASIC,FPGA ?数字信号处理器DSP ?软件 ? 编解码器产品: ? ?机顶盒 ?数字电视 ?摄像机 ?监控器 7. 视频编码标准 编码标准作用: ? 兼容: ? ?不同厂家生产的编码器压缩的码流能够被不同厂家的解码器解码 ? 高效: ?

图像压缩原理

1、为什么要对图像数据进行压缩?其压缩原理是什么? 答:(1)数字图像如果不进行压缩,数据量是比较大的,例如一幅分辨率为1024×768的静态真彩色图像,其数据量为1024×768×24=2.25(MB)。这无疑对图像的存储、处理、传送带来很大的困难。事实上,在图像像素之间,无论在行方向还是列方向,都存在一定的相关性。也就是说,在一般图像中都存在很大的相关性,即冗余度。静态图像数据的冗余包括:空间冗余、时间冗余、结构冗余、知识冗余和视觉冗余、图像区域的相同性冗余、纹理的统计冗余等。图像压缩编码技术就是利用图像数据固有的冗余性和相干性,将一个大的图像数据文件转换为较小的同性质的文件。 (2)其压缩原理: 空间冗余、时间冗余、结构冗余、和视觉冗余。 2、图像压缩编码的目的是什么?目前有哪些编码方法? 答:(1)视频经过数字化处理后易于加密、抗干扰能力强、可再生中继等诸多优点,但是由于数字化的视频数据量十分巨大,不利于传输和存储。若不经压缩,数字视频传输所需的高传输率和数字视频存储所需的巨大容量,将成为推广数字电视视频通信的最大障碍,这就是进行视频压缩编码的目的。 (2)目前主要是预测编码,变换编码,和统计编码三种编码方法。 3、某信号源共有7个符号,概率分别为0.2,0.18,0.1,0.15,0.07,0.05,0.25,试进行霍夫曼编码,并解释是否进

行了压缩,压缩比为多少? 0000 0001 000 00 111 110 10 0.05 0.07 0.1 0.2 0.18 0.15 0.25 0.05×4+0.07×4+0.1×3+0.2×2+0.18×3+0.15×3+0.25×2=2.67

视频压缩编码及常用格式

视频压缩编码及常用格式 数据压缩编码已经拥有很长的历史,压缩编码的理论基础是信息论。从信息的角度看,压缩就是去除数据中的消除冗余。即保留不确定的信息,去除确定的信息,用一种更接近信息本质的描述来代替原有冗余的描述压缩的目的是在尽可能保证视觉效果的前题下减少数据率。视频压缩比是指压缩后的数据量与压缩前的数据量之比。由于视频是连续的静态图像,因此其压缩编码算法与静态图像的压缩算法有某些共同的地方,但是运动的视频还有其本身的特性,因此在压缩是还要考虑其运动特性,这样才能达到高效果压缩的目的。 自从上世纪四十年代第一台电视机问世以来,视频技术的研究与应用已经有近六十年的历史。当前电视技术均为模拟视频技术,经过几十年的发展和完善,已经十分成熟。世界通行的模拟电视制式主要有:PAL(欧洲、中国)NTSC(北美、日本)和SECAM(法国)。 随着计算机技术近二十年的发展,特别是九十年代以来互联网的广泛应用,多媒体数字视频技术已经成为了当前信息科学中十分活跃的研究方向。数字化技术的引用。使得对视频信号的捕获、处理、压缩和储存都有了革命性的进步特别是在视频数据的压缩和储存上。国际电信联合会(ITC)于1990年正式提出了ITU-TH261建议,这是第一个关于使用化视频图像压缩编码的国际标准提议。九十年代中,IUT在该建议上提出了MPEG1、MPEG2、MPEG4、H.263和JPEG2000等压缩标准。这些标准的制定和颁布,极大的促进了数字视频压缩与编码技术的研究和实用化。 视频编码标准的发展 视频编码技术在近年得到了迅速的发展和广泛的应用,并在日渐成熟,起标准是多个视频编码国际化标准的制定与应用,即国际标准化组织ISO和国际电工委员会IEC关于静态图像的编码标准JPEG、国际电信联盟ITU-T关于电视、电话会议的视频编码标准H261、H.263及H.264和ISO/TEC关于活动图像的编码标准MPEG-1,MPEG-2、MPEG-4等。这些标准图像编码算法融合了各种性能优良的图像编码方法,代表了目前编码的发张水平。 MPEG-1 MPEG-1标准于1993年8月公布,用于传输1.5Mbps数据传输的数据储存媒体运动图像及其伴音的编码。该标准包括五个部分:第一:说明如何根据第二部(视频)以及第三部分(音频)的规定,对音频和视频进行复合编码。第四部分说明检验解码器或编码器的输出比流符合前三部分规定的过程。第五部分是一个用完整的C语言实现的编码和解码器。 MPEG-1取得一连串的成功,如VCD和MP3的大量使用,可携式MPEG-1摄像

视频压缩编码标准H.264详解

视频压缩编码标准H.264详解 ——新疆大学2006级工硕郭新军 JVT(Joint Video Team,视频联合工作组)于2001年12月在泰国Pattaya 成立。它由ITU-T和ISO两个国际标准化组织的有关视频编码的专家联合组成。JVT的工作目标是制定一个新的视频编码标准,以实现视频的高压缩比、高图像质量、良好的网络适应性等目标。目前JVT的工作已被ITU-T接纳,新的视频压缩编码标准称为H.264标准,该标准也被ISO接纳,称为AVC(Advanced Video Coding)标准,是MPEG-4的第10部分。 H.264标准可分为三档: 基本档次(其简单版本,应用面广); 主要档次(采用了多项提高图像质量和增加压缩比的技术措施,可用于SDTV、HDTV和DVD等); 扩展档次(可用于各种网络的视频流传输)。 H.264不仅比H.263和MPEG-4节约了50%的码率,而且对网络传输具有更好的支持功能。它引入了面向IP包的编码机制,有利于网络中的分组传输,支持网络中视频的流媒体传输。H.264具有较强的抗误码特性,可适应丢包率高、干扰严重的无线信道中的视频传输。H.264支持不同网络资源下的分级编码传输,从而获得平稳的图像质量。H.264能适应于不同网络中的视频传输,网络亲和性好。 一、H.264视频压缩系统 H.264标准压缩系统由视频编码层(VCL)和网络提取层(Network Abstraction Layer,NAL)两部分组成。VCL中包括VCL编码器与VCL解码器,主要功能是视频数据压缩编码和解码,它包括运动补偿、变换编码、熵编码等压缩单元。NAL则用于为VCL提供一个与网络无关的统一接口,它负责对视频数据

转换成AVI格式的利器]WisMencoder 电影制作(视频参数设置详解)

[转换成AVI格式的利器]WisMencoder 电影制作教程+工具下载 WisMencoder 能够把您的电脑上的所有视频格式,包括avi,mpg,rmvb,wmv,mp4,mov,dat等格式以最快的速度和最高的质量转换为A VI格式。速度和质量都高于同类软件。 WisMencoder特点:1.压缩速度快且质量较高。 2.简洁而又丰富的设置外观非常便于操作。 3.支持批量压缩,压缩后关机。 4.支持多种音频、视频编码器,支持字幕 5.支持压缩的优先级 6.利用已经设置好的配置文件轻松为PDA等移动设备配置参数 WisMencoder采用mencoder核心,是Mencoder的GUI(图形用户界面)。Mencoder是最快的视频转换压缩工具,能够把所有视频格式转换为A VI。并且转换速度极为快速,可谓同类软件中转换速度最快的软件,功能强大。但是由于Mencoder是命令行程序需要像DOS 一样输入复杂的命令行,所以操作不很方便,特别是对于初学者。WisMencoder这个程序通过简单而详细的图形化界面,让您不用输

入那些繁琐的命令行而轻松使用Mencoder! 使用教程 1、首先,选择“CPU类型”根据你的CPU来选择,里面只有P4、P3、AMD K7(如果您的CUP为AMD的产品,在这里直接选择K7就可以了),可以根据你的CPU类型来选择;然后再选择“优先级”,一般选择中等以上,如果你的电脑在转换过程中只运行该程序,那么可以选择高或最高来加快转换速度 2、选择输出目录: 路径中不要包含有中文;然后添加文件,有两种方式,直接将文件拖到白色区域或择点击“添加文件***”。 3、快速配置: 压缩速度:在NOKIA电话上看当然质量优先 在什么设备上观看:软件内置了Nokia S60(208*176)的选项 类型:普通电影或动作类型多的可以选择动作电影 音质:一般至少选择中等以上,我喜欢较好音质的影片,所以我通常都选高;选好后软件会弹出一个文件大小计算器,不用理会,直接关掉

常见的几种高清视频编码格式

高清视频的编码格式有五种,即H.264、MPEG-4、MPEG-2、WMA-HD以及VC-1。事实上,现在网络上流传的高清视频主要以两类文件的方式存在:一类是经过MPEG-2标准压缩,以tp和ts为后缀的视频流文件;一类是经过WMV-HD(Windows Media Video High Definition)标准压缩过的wmv文件,还有少数文件后缀为avi或mpg,其性质与wmv是一样的。真正效果好的高清视频更多地以H.264与VC-1这两种主流的编码格式流传。 H.264编码 H.264编码高清视频 H.264是由国际电信联盟(iTU-T)所制定的新一代的视频压缩格式。H.264 最具价值的部分是更高的数据压缩比,在同等的图像质量,H.264的数据压缩比能比当前DVD系统中使用的 MPEG-2高2~3倍,比MPEG-4高1.5~2倍。正因为如此,经过H.264压缩的视频数据,在网络传输过程中所需要的带宽更少,也更加经济。在 MPEG-2需要6Mbps的传输速率匹配时,H.264只需要1Mbps~2Mbps 的传输速率,目前H.264已经获得DVD Forum与Blu-ray Disc Association采纳,成为新一代HD DVD的标准,不过H.264解码算法更复杂,计算要求比WMA-HD 还要高。 从ATI的Radeon X1000系列显卡、NVIDIA的GeForce 6/7系列显卡开始,它们均加入对H.264硬解码的支持。与MPEG-4一样,经过H.264压缩的视频文件一般也是采用avi 作为其后缀名,同样不容易辨认,只能通过解码器来自己识别。 总的来说,常见的几种高清视频编码格式的特点是能够以更低的码率得到更高的画质,相同效果的MPEG2与H.264影片做比较,后者在容量上仅需前者的一半左右。这也就意味着,H.264不仅能够节省HDTV的存储空间,而且还可以在手机等带宽较窄的网络上传输高质量的视频,可以说应用前途一片光明。但另

视频压缩方法

视频压缩方法 一、视频压缩方法有两种: 1.同格式转化:降低分辨率(视频播放窗口大小),改变编码方式(主要适合 AVI ),降低音频质量。通常在转化时设置“高级”选项内容即可; 2.不同格式转化:转化成rmvb 和mov 都是不错的选择。转化成rmvb前,最 好先安装最新版的Realone,以获得解码器。 3.手机拍摄的视频多数为3GP格式,个别国产手机为MJP格式。这两种格式可以直接上传到互联播客,但如果想对其进行编辑,就必须转化成其他格式,AVI格式 为首选。 二,从DVD或VCD光盘里导出视频方法: 第一步:右键单击光盘符,选则“资源浏览器”打开光盘; 第二步:找到视频文件。一般来说DVD里的视频为VOB格式,但是由于各家标准不同,也会有其他格式。方法很简单,就是每个文件夹都打开看看,文件特别大的(通常几十MB以上)就是真实的视频了。找到视频以后,复制粘贴到硬盘就ok了。 DVD光盘里的有多个视频文件,通常一个大场景一个视频文件; 第三步:把视频文件转化成其他格式,然后就可以编辑了。 视频格式转化 1.AVI、WMV、RM和VCD/SVCD/DVD到AVI等的转化 推荐软件:winAVI video converter WinAVI Video Converter支持包括: a.AVI、MPEG1/2/4、VCD/SVCD/DVD、DivX、XVid、ASF、WMV、RM 在内 的几乎所有视频文件格式; b.自身支持VCD/SVCD/DVD 烧录;

c.支持AVI->DVD、AVI->VCD、AVI->MPEG、AVI->MPG、AVI->WMV、 DVD->AVI、及视频到AVI/WMV/RM的转换。 提醒:当进行视频编辑时或储存时,最好转化成AVI 格式,因为很多格式是很难编辑和转化的。另外,在转化成AVI 格式时,最好在“高级”里选择Intel Indeo video 5.10、mpeg-4 、DivX 5.0 或Xvid 视频编码方式。音频格式选择MP3 就可 以了。 2.3GP格式的转化 推荐软件:ImTOO 3gp video converter 该软件适合几乎所有格式转化成3gp ,和3gp 到其他格式的转化,也支持其 他手机常用的视频格式之间的转化。 3.MJP格式的转化 很多国产手机只支持MJP 格式的视频,目前还没有相应 的软件把MJP 转化成其他格式,且新浪互联星空播客目前还不支持这种格式。想把其他格式转化成MJP 格式,给我们留言吧,新浪互联星空播客工作组会给您发 过去。 很多视频格式切割非常困难,如RMVB和3GP等,具体原因说来复杂。不过可以采取迂回战术,即先把视频文件转化成容易编辑的AVI、WMV或MPEG格式, 然后再进行切割、截取等操作。 推荐了3个软件,分别用来: 1. 分割和修剪AVI、MPEG、ASF或者WMV等; 2. 截取或合并多个RM / RMVB文件。 1.Zealot All Video Splitter v1.5.2 版 Zealot All Video Splitter功能简介:

视频编码的基本原理及基本框架

视频编码的基本原理及基本框架 视频图像数据有极强的相关性,也就是说有大量的冗余信息。其中冗余信息可分为空域冗余信息和时域冗余信息。压缩技术就是将数据中的冗余信息去掉(去除数据之间的相关性),压缩技术包含帧内图像数据压缩技术、帧间图像数据压缩技术和熵编码压缩技术。 去时域冗余信息 使用帧间编码技术可去除时域冗余信息,它包括以下三部分: -运动补偿 运动补偿是通过先前的局部图像来预测、补偿当前的局部图像,它是减少帧序列冗余信息的有效方法。 -运动表示 不同区域的图像需要使用不同的运动矢量来描述运动信息。运动矢量通过熵编码进行压缩。-运动估计 运动估计是从视频序列中抽取运动信息的一整套技术。 注:通用的压缩标准都使用基于块的运动估计和运动补偿 去空域冗余信息 主要使用帧内编码技术和熵编码技术: -变换编码 帧内图像和预测差分信号都有很高的空域冗余信息。变换编码将空域信号变换到另一正交矢量空间,使其相关性下降,数据冗余度减小。 -量化编码 经过变换编码后,产生一批变换系数,对这些系数进行量化,使编码器的输出达到一定的位率。这一过程导致精度的降低。

熵编码是无损编码。它对变换、量化后得到的系数和运动信息,进行进一步的压缩。 视频编码的基本框架 H.261 H.261标准是为ISDN设计,主要针对实时编码和解码设计,压缩和解压缩的信号延时不超过150ms,码率px64kbps(p=1~30)。 H.261标准主要采用运动补偿的帧间预测、DCT变换、自适应量化、熵编码等压缩技术。只有I帧和P帧,没有B帧,运动估计精度只精确到像素级。支持两种图像扫描格式:QCIF 和CIF。 H.263 H.263标准是甚低码率的图像编码国际标准,它一方面以H.261为基础,以混合编码为核心,其基本原理框图和H.261十分相似,原始数据和码流组织也相似;另一方面,H.263也吸收了MPEG等其它一些国际标准中有效、合理的部分,如:半像素精度的运动估计、PB帧预测等,使它性能优于H.261。 H.263使用的位率可小于64Kb/s,且传输比特率可不固定(变码率)。H.263支持多种分辨率:SQCIF(128x96)、QCIF、CIF、4CIF、16CIF。 与H.261和H.263相关的国际标准 与H.261有关的国际标准 H.320:窄带可视电话系统和终端设备; H.221:视听电信业务中64~1 920Kb/s信道的帧结构; H.230:视听系统的帧同步控制和指示信号; H.242:使用直到2Mb/s数字信道的视听终端的系统。 与H.263有关的国际标准 H.324:甚低码率多媒体通信终端设备; H.223:甚低码率多媒体通信复合协议; H.245:多媒体通信控制协议; G.723.1.1:传输速率为5.3Kb/s和6.3Kb/s的语音编码器。 JPEG 国际标准化组织于1986年成立了JPEG(Joint Photographic Expert Group)联合图片专家小组,主要致力于制定连续色调、多级灰度、静态图像的数字图像压缩编码标准。常用的基于离散余弦变换(DCT)的编码方法,是JPEG算法的核心内容。

各种音视频编解码学习详解 h264

各种音视频编解码学习详解h264 ,mpeg4 ,aac 等所有音视频格式 编解码学习笔记(一):基本概念 媒体业务是网络的主要业务之间。尤其移动互联网业务的兴起,在运营商和应用开发商中,媒体业务份量极重,其中媒体的编解码服务涉及需求分析、应用开发、释放license收费等等。最近因为项目的关系,需要理清媒体的codec,比较搞的是,在豆丁网上看运营商的规范标准,同一运营商同样的业务在不同文档中不同的要求,而且有些要求就我看来应当是历史的延续,也就是现在已经很少采用了。所以豆丁上看不出所以然,从wiki上查。中文的wiki信息量有限,很短,而wiki的英文内容内多,删减版也减肥得太过。我在网上还看到一个山寨的中文wiki,长得很像,红色的,叫―天下维客‖。wiki的中文还是很不错的,但是阅读后建议再阅读英文。 我对媒体codec做了一些整理和总结,资料来源于wiki,小部分来源于网络博客的收集。网友资料我们将给出来源。如果资料已经转手几趟就没办法,雁过留声,我们只能给出某个轨迹。 基本概念 编解码 编解码器(codec)指的是一个能够对一个信号或者一个数据流进行变换的设备或者程序。这里指的变换既包括将信号或者数据流进行编码(通常是为了传输、存储或者加密)或者提取得到一个编码流的操作,也包括为了观察或者处理从这个编码流中恢复适合观察或操作的形式的操作。编解码器经常用在视频会议和流媒体等应用中。 容器 很多多媒体数据流需要同时包含音频数据和视频数据,这时通常会加入一些用于音频和视频数据同步的元数据,例如字幕。这三种数据流可能会被不同的程序,进程或者硬件处理,但是当它们传输或者存储的时候,这三种数据通常是被封装在一起的。通常这种封装是通过视频文件格式来实现的,例如常见的*.mpg, *.avi, *.mov, *.mp4, *.rm, *.ogg or *.tta. 这些格式中有些只能使用某些编解码器,而更多可以以容器的方式使用各种编解码器。 FourCC全称Four-Character Codes,是由4个字符(4 bytes)组成,是一种独立标示视频数据流格式的四字节,在wav、a vi档案之中会有一段FourCC来描述这个AVI档案,是利用何种codec来编码的。因此wav、avi大量存在等于―IDP3‖的FourCC。 视频是现在电脑中多媒体系统中的重要一环。为了适应储存视频的需要,人们设定了不同的视频文件格式来把视频和音频放在一个文件中,以方便同时回放。视频档实际上都是一个容器里面包裹着不同的轨道,使用的容器的格式关系到视频档的可扩展性。 参数介绍 采样率 采样率(也称为采样速度或者采样频率)定义了每秒从连续信号中提取并组成离散信号的采样个数,它用赫兹(Hz)来表示。采样频率的倒数叫作采样周期或采样时间,它是采样之间的时间间隔。注意不要将采样率与比特率(bit rate,亦称―位速率‖)相混淆。

常见的几种高清视频编码格式

常见的几种高清视频编码 格式 The Standardization Office was revised on the afternoon of December 13, 2020

高清视频的编码格式有五种,即、MPEG-4、MPEG-2、WMA-HD以及VC-1。事实上,现在网络上流传的高清视频主要以两类文件的方式存在:一类是经过MPEG-2标准压缩,以tp和ts为后缀的视频流文件;一类是经过WMV- HD(Windows Media Video High Definition)标准压缩过的wmv文件,还有少数文件后缀为avi或mpg,其性质与wmv是一样的。真正效果好的高清视频更多地以与VC-1这两种主流的编码格式流传。 编码 编码高清视频 是由国际电信联盟(iTU-T)所制定的新一代的视频压缩格式。最具价值的部分是更高的数据压缩比,在同等的图像质量,的数据压缩比能比当前DVD系统中使用的 MPEG-2高2~3倍,比MPEG-4高~2倍。正因为如此,经过压缩的视频数据,在网络传输过程中所需要的带宽更少,也更加经济。在 MPEG-2需要6Mbps的传输速率匹配时,只需要1Mbps~2Mbps的传输速率,目前已经获得DVD Forum与Blu-ray Disc Association采纳,成为新一代HD DVD的标准,不过解码算法更复杂,计算要求比WMA-HD还要高。 从ATI的Radeon X1000系列显卡、NVIDIA的GeForce 6/7系列显卡开始,它们均加入对硬解码的支持。与MPEG-4一样,经过压缩的视频文件一般也是采用avi 作为其后缀名,同样不容易辨认,只能通过解码器来自己识别。 总的来说,常见的几种高清视频编码格式的特点是能够以更低的码率得到更高的画质,相同效果的MPEG2与影片做比较,后者在容量上仅需前者的一半左右。这也就意味着,不仅能够节省HDTV的存储空间,而且还可以在手机等带

OpenMeetings音视频参数设置及优化

OpenMeetins音视频参数 设置及优化 作者:老猫 日期:2010-9-17 一、前言 OpenMeetings是一个基于Flash视频的视频会议系统,它的后台是基于开源的流媒体服务器RED5做的二次开发,而前台实质上是一个采用OpenLaszlo开发的Flash。也就是说,OpenMeetings的客户端必须运行在Flash环境下。因此,我们不妨把PC机上的Flash Player 看作是一个OS(操作系统),而把OpenMeetings的前台(swf文件)当作该操作系统下的一个可执行程序。这样的思路下,我们就可以理解,就如我们在Windows下开发依赖于硬件的应用程序时必须要借助WINDOWS API的支持一样,OpenMeetings的客户端也极度依赖Flash环境所能提供的功能和性能,尤其是和音频视频相关的地方。 二、OpenMeetings流媒体采集和编码 Flash视频的客户端采集视频和音频信号后由Flash插件完成音视频编码,编码算法是封闭的,据说采用的编码协议是H.323(视频编码为H.263),应用开发者无法优化这一块。 OpenMeetings调用摄像头时并创建一个广播流时,我们来看看Flash做了哪些动作: ●捕获摄像头信号 ●进行视频压缩编码 ●创建一个基于RTMP协议的流与RED5建立连接 ●将经过视频压缩编码后的数据按照RTMP协议进行信道编码 ●将信道编码后的数据放入流中 我们可以发现,Flash自动帮我们完成了大部分的工作,所以开发基于Flash的流媒体应用是一件相当轻松愉快的事情。然而,事物总是具备两面性的,Flash的封闭性使我们无从着手改进音视频的压缩编码算法,更谈不上改进RTMP协议传输协议。能改善性能的地方都被牢牢地封闭在黑箱子里,就好比我们要参加汽车节油比赛时,却发现手里只有一辆纯自动档的汽车,让你空有一身车技却无用武之地时,郁闷更是无与伦比。

摄像头视频采集压缩及传输原理

摄像头视频采集压缩及传输原理 摄像头基本的功能还是视频传输,那么它是依靠怎样的原理来实现的呢?所谓视频传输:就是将图片一张张传到屏幕,由于传输速度很快,所以可以让大家看到连续动态的画面,就像放电影一样。一般当画面的传输数量达到每秒24帧时,画面就有了连续性。 下边我们将介绍摄像头视频采集压缩及传输的整个过程。 一.摄像头的工作原理(获取视频数据) 摄像头的工作原理大致为:景物通过镜头(LENS)生成的光学图像投射到图像传感器表面上,然后转为电信号,经过A/D(模数转换)转换后变为数字图像信号,再送到数字信号处理芯片(DSP)中加工处理,再通过USB接口传输到电脑中处理,通过显示器就可以看到图像了。下图是摄像头工作的流程图: 注1:图像传感器(SENSOR)是一种半导体芯片,其表面包含有几十万到几百万的光电二极管。光电二极管受到光照射时,就会产生电荷。 注2:数字信号处理芯片DSP(DIGITAL SIGNAL PROCESSING)功能:主要是通过一系列复杂的数学算法运算,对数字图像信号参数进行优化处理,并把处理后的信号通过USB等接口传到PC等设备。 DSP结构框架: 1. ISP(image signal processor)(镜像信号处理器) 2. JPEG encoder(JPEG图像解码器) 3. USB device controller(USB设备控制器) 而视频要求将获取的视频图像通过互联网传送到异地的电脑上显示出来这其中就涉及到对于获得的视频图像的传输。 在进行这种图片的传输时,必须将图片进行压缩,一般压缩方式有如H.261、JPEG、MPEG 等,否则传输所需的带宽会变得很大。大家用RealPlayer不知是否留意,当播放电影的时候,在播放器的下方会有一个传输速度250kbps、400kbps、1000kbps…画面的质量越高,这个速度也就越大。而摄像头进行视频传输也是这个原理,如果将摄像头的分辨率调到640×480,捕捉到的图片每张大小约为50kb左右,每秒30帧,那么摄像头传输视频所需的速度为50×30/s=1500kbps=1.5Mbps。而在实际生活中,人们一般用于网络视频聊天时的分辨率为320×240甚至更低,传输的帧数为每秒24帧。换言之,此时视频传输速率将不到300kbps,人们就可以进行较为流畅的视频传输聊天。如果采用更高的压缩视频方式,如MPEG-1等等,可以将传输速率降低到200kbps不到。这个就是一般视频聊天时,摄像头所需的网络传输速度。 二.视频压缩部分 视频的压缩是视频处理的核心,按照是否实时性可以分为非实时压缩和实时压缩。而视频传输(如QQ视频即时聊天)属于要求视频压缩为实时压缩。 下面对于视频为什么能压缩进行说明。 视频压缩是有损压缩,一般说来,视频压缩的压缩率都很高,能够做到这么 高的压缩率是因为视频图像有着非常大的时间和空间的冗余度。所谓的时间冗余度指的是两帧相邻的图像他们相同位置的像素值比较类似,具有很大的相关性,尤其是静止图像,甚至两帧图像完全相同,对运动图像,通过某种运算(运动估计),应该说他们也具有很高的相关性;而空间相关性指的是同一帧图像,相邻的两个像素也具备一定的相关性。这些相关性

各种音视频编解码学习详解

各种音视频编解码学习详解 编解码学习笔记(一):基本概念 媒体业务是网络的主要业务之间。尤其移动互联网业务的兴起,在运营商和应用开发商中,媒体业务份量极重,其中媒体的编解码服务涉及需求分析、应用开发、释放license收费等等。最近因为项目的关系,需要理清媒体的codec,比较搞的是,在豆丁网上看运营商的规范标准,同一运营商同样的业务在不同文档中不同的要求,而且有些要求就我看来应当是历史的延续,也就是现在已经很少采用了。所以豆丁上看不出所以然,从wiki上查。中文的wiki信息量有限,很短,而wiki的英文内容内多,删减版也减肥得太过。我在网上还看到一个山寨的中文wiki,长得很像,红色的,叫―天下维客‖。wiki的中文还是很不错的,但是阅读后建议再阅读英文。 我对媒体codec做了一些整理和总结,资料来源于wiki,小部分来源于网络博客的收集。网友资料我们将给出来源。如果资料已经转手几趟就没办法,雁过留声,我们只能给出某个轨迹。 基本概念 编解码 编解码器(codec)指的是一个能够对一个信号或者一个数据流进行变换的设备或者程序。这里指的变换既包括将信号或者数据流进行编码(通常是为了传输、存储或者加密)或者提取得到一个编码流的操作,也包括为了观察或者处理从这个编码流中恢复适合观察或操作的形式的操作。编解码器经常用在视频会议和流媒体等应用中。 容器 很多多媒体数据流需要同时包含音频数据和视频数据,这时通常会加入一些用于音频和视频数据同步的元数据,例如字幕。这三种数据流可能会被不同的程序,进程或者硬件处理,但是当它们传输或者存储的时候,这三种数据通常是被封装在一起的。通常这种封装是通过视频文件格式来实现的,例如常见的*.mpg, *.avi, *.mov, *.mp4, *.rm, *.ogg or *.tta. 这些格式中有些只能使用某些编解码器,而更多可以以容器的方式使用各种编解码器。 FourCC全称Four-Character Codes,是由4个字符(4 bytes)组成,是一种独立标示视频数据流格式的四字节,在wav、avi档案之中会有一段FourCC来描述这个AVI档案,是利用何种codec来编码的。因此wav、avi大量存在等于―IDP3‖的FourCC。 视频是现在电脑中多媒体系统中的重要一环。为了适应储存视频的需要,人们设定了不同的视频文件格式来把视频和音频放在一个文件中,以方便同时回放。视频档实际上都是一个容器里面包裹着不同的轨道,使用的容器的格式关系到视频档的可扩展性。 参数介绍 采样率 采样率(也称为采样速度或者采样频率)定义了每秒从连续信号中提取并组成离散信号的采样个数,它用赫兹(Hz)来表示。采样频率的倒数叫作采样周期或采样时间,它是采样之间的时间间隔。注意不要将采样率与比特率(bit rate,亦称―位速率‖)相混淆。 采样定理表明采样频率必须大于被采样信号带宽的两倍,另外一种等同的说法是奈奎斯特频率必须大于被采样信号的带宽。如果信号的带宽是100Hz,那么为了避免混叠现象采样频率必须大于200Hz。换句话说就是采样频率必须至少是信号中最大频率分量频率的两倍,否则就不能从信号采样中恢复原始信号。 对于语音采样: ?8,000 Hz - 电话所用采样率, 对于人的说话已经足够 ?11,025 Hz ?22,050 Hz - 无线电广播所用采样率 ?32,000 Hz - miniDV 数码视频camcorder、DAT (LP mode)所用采样率 ?44,100 Hz - 音频CD, 也常用于MPEG-1 音频(VCD, SVCD, MP3)所用采样率

视频压缩编码方法简介

视频压缩编码方法简介—AVI AVI(Audio Video Interleave)是一种音频视像交插记录的数字视频文件格式。1992年初Microsoft公司推出了AVI技术及其应用软件VFW(Video for Windows)。在AVI文件中,运动图像和伴音数据是以交织的方式存储,并独立于硬件设备。这种按交替方式组织音频和视像数据的方式可使得读取视频数据流时能更有效地从存储媒介得到连续的信息。构成一个AVI文件的主要参数包括视像参数、伴音参数和压缩参数等: 1、视像参数 (1)、视窗尺寸(Video size):根据不同的应用要求,AVI的视窗大小或分辨率可按4:3的比例或随意调整:大到全屏640×480,小到160×120甚至更低。窗口越大,视频文件的数据量越大。 (2)、帧率(Frames per second):帧率也可以调整,而且与数据量成正比。不同的帧率会产生不同的画面连续效果。 2、伴音参数:在AVI文件中,视像和伴音是分别存储的,因此可以把一段视频中的视像与另一段视频中的伴音组合在一起。AVI 文件与WAV文件密切相关,因为WAV文件是AVI文件中伴音信号的来源。伴音的基本参数也即WAV文件格式的参数,除此以外,AVI文件还包括与音频有关的其他参数: (1)、视像与伴音的交织参数(Interlace Audio Every X Frames)AVI格式中每X帧交织存储的音频信号,也即伴音和视像交替的频率X是可调参数,X的最小值是一帧,即每个视频帧与音频数据交织组织,这是CD-ROM上使用的默认值。交织参数越小,回放AVI文件时

读到内存中的数据流越少,回放越容易连续。因此,如果AVI文件的存储平台的数据传输率较大,则交错参数可设置得高一些。当AVI文件存储在硬盘上时,也即从硬盘上读AVI文件进行播放时,可以使用大一些的交织频率,如几帧,甚至1秒。 (2)、同步控制(Synchronization) 在AVI文件中,视像和伴音是同步得很好的。但在MPC中回放AVI文件时则有可能出现视像和伴音不同步的现象。 (3)、压缩参数:在采集原始模拟视频时可以用不压缩的方式,这样可以获得最优秀的图像质量。编辑后应根据应用环境环择合适的压缩参数。 3、 AVI数字视频的特点 (1)、提供无硬件视频回放功能:AVI格式和VFW软件虽然是为当前的MPC设计的,但它也可以不断提高以适应MPC的发展。根据AVI格式的参数,其视窗的大小和帧率可以根据播放环境的硬件能力和处理速度进行调整。在低档MPC机上或在网络上播放时,VFW的视窗可以很小,色彩数和帧率可以很低;而在Pentium级系统上,对于64K色、320×240的压缩视频数据可实现每秒25帧的回放速率。这样,VFW就可以适用于不同的硬件平台,使用户可以在普通的MPC上进行数字视频信息的编辑和重放,而不需要昂贵的专门硬件设备。 (2)、实现同步控制和实时播放:通过同步控制参数,AVI可以通过自调整来适应重放环境,如果MPC的处理能力不够高,而AVI文件的数据率又较大,在WINDOWS环境下播放该AVI文件时,播放器可

相关文档
相关文档 最新文档