导航:首页 > 文件处理 > 压缩编码方法的优点

压缩编码方法的优点

发布时间:2022-12-13 14:30:30

A. 1.栅格数据存储的压缩编码有几种各有什么优点和缺点

2.1.6 栅格数据存储的压缩编码 1 直接编码 直接栅格编码是最简单最直观而又非常重要的一种栅格结构编码方法,通常称这种编码为图像文件或栅格文件。直接编码就是将栅格数据看作一个数据矩阵,逐行(或逐列)逐个记录代码,可以每行都从左到右逐象元记录,也可奇数行从左到右,而偶数行由右向左记录,为了特定目的还可采用其它特殊的顺序,右图直接编码可表示为矩阵: 2 链式编码 链式编码又称为弗里曼链码(Freeman,1961)或边界链码。由某一原点开始并按某些基本方向确定的单位矢量链。基本方向可定义为:东=0,南=3,西=2,北=1等。右图多边形边如果确定原点为像元(10,1),则该多边形界按顺时方向的链式编码为:

链式编码对多边形的表示具有很强的数据压缩能力,且具有一定的运算功能,如面积和周长计算等,探测边界急弯和凹进部分等都比较容易。但是,叠置运算如组合、相交等则很难实施,
3 行程编码 行程编码1 只在各行(或列)数据的代码发生变化时依次记录该代码以及相同代码重复的个数。左图可沿行方向进行行程编码: 行程编码2 逐个记录各行(或列)代码发生变化的位置和相应的代码,左图可沿列方向进行行程编码:
1列:(1,3),(3,1);
2列:(1,3),(4,1);
3列:(1,3),(5,1);
4列:(1,4),(2,3),(5,1);
5列:(1,4),(4,3),(6,2),(7,1);
6列:(1,4),(4,2);
7列:(1,4),(4,2);
8列:(1,4),(3,2)。 行程编码3 按行(或列)记录相同代码的始末象元的列号(或行号)和相应的代码,左图可沿行方向进行程编码:
4 块式编码 把多边形范围划分成由象元组成的正方形,然后对各个正方形进行编码。块式编码数据结构中包括3个数字:块的初始位置(行、列号)和块的大小(块包括的象元数),再加上记录单元的代码组成。左图块式编码:
5 四叉树编码2.1.6 栅格数据存储的压缩编码 1 直接编码 直接栅格编码是最简单最直观而又非常重要的一种栅格结构编码方法,通常称这种编码为图像文件或栅格文件。直接编码就是将栅格数据看作一个数据矩阵,逐行(或逐列)逐个记录代码,可以每行都从左到右逐象元记录,也可奇数行从左到右,而偶数行由右向左记录,为了特定目的还可采用其它特殊的顺序,右图直接编码可表示为矩阵: 2 链式编码 链式编码又称为弗里曼链码(Freeman,1961)或边界链码。由某一原点开始并按某些基本方向确定的单位矢量链。基本方向可定义为:东=0,南=3,西=2,北=1等。右图多边形边如果确定原点为像元(10,1),则该多边形界按顺时方向的链式编码为: 链式编码对多边形的表示具有很强的数据压缩能力,且具有一定的运算功能,如面积和周长计算等,探测边界急弯和凹进部分等都比较容易。但是,叠置运算如组合、相交等则很难实施, 3 行程编码 行程编码1 只在各行(或列)数据的代码发生变化时依次记录该代码以及相同代码重复的个数。左图可沿行方向进行行程编码: 行程编码2 逐个记录各行(或列)代码发生变化的位置和相应的代码,左图可沿列方向进行行程编码:1列:(1,3),(3,1); 2列:(1,3),(4,1); 3列:(1,3),(5,1); 4列:(1,4),(2,3),(5,1); 5列:(1,4),(4,3),(6,2),(7,1); 6列:(1,4),(4,2); 7列:(1,4),(4,2); 8列:(1,4),(3,2)。 行程编码3 按行(或列)记录相同代码的始末象元的列号(或行号)和相应的代码,左图可沿行方向进行程编码: 4 块式编码 把多边形范围划分成由象元组成的正方形,然后对各个正方形进行编码。块式编码数据结构中包括3个数字:块的初始位置(行、列号)和块的大小(块包括的象元数),再加上记录单元的代码组成。左图块式编码: 5 四叉树编码 四叉树分割 将图像区域按四个大小相同的象限四等分,每个象限又可根据一定规则判断是否继续等分为次一层的四个象限,无论分割到哪一层象限,只要子象限上仅含一种属性代码或符合既定要求的少数几种属性时,则停止继续分割。否则就一直分割到单个象元为止。按照象限递归分割的原则所分图像区域的栅格阵列应为2n×2n(n为分割的层数)的形式。 四叉树结构 把整个2n×2n象元组成的阵列当作树的根结点,树的高度为n级(最多为n级)。每个结点有分别代表南西(SW)、南东(SE)、北西(NW)、北东(NE)四个象限的四个分支。四个分支中要么是树叶,要么是树叉。树叶代表不能继续划分的结点,该结点代表子象限具有单一的代码;树叉不只包含一种代在码,必须继续划分,直到变成树叶为止。 四叉树编码 1 指针四叉树编码 通过在子结点与父结点之间设立指针的方式建立起整个结构。按这种方式,四叉树的每个结点通常存储6个量,即四个子结点指针、一个父结点指针和该结点的属性代码。这种方法除了要记录叶结点外,还要记录中间结点,一般要占用较大存储空间。 2 线性四叉树编码 为美国马里兰大学地理信息系统中采用的编码方法,该方法记录每个终止结点(或叶结点)的地址和值,值就是子区的属性代码,其中地址包括两部分,共32位(二进制),最右边4位记录该叶结点的深度,即处于四叉树的第几层上,有了深度可以推知子区大小;左边的28位记录路径,从右边第五位往左记录从叶结点到根结点的路径,0,1,2,3分别表示SW、SE、NW、NE。28位 4位 0 0 0 0 ... ... 0 0 0 0 1 1 1 0 0 0 1 1(路径0SW,3NE,2NW) 0 3 2 深度3记录了各个叶子的地址,再记录相应代码值,就记录了整个图像。 四叉树优点 1.容易而有效地计算多边形的数量特征; 2.阵列各部分的分辨率是可变的,边界复杂部分四叉树较高,即分级多,分辨率也高,而不需要表示许多细节的部分则分级少,分辨率低,因而既可精确表示图形结构又可减少存储量; 3.栅格到四叉树及到四叉树到简单栅格结构的转换比其他压缩方法容易; 4.多边形中嵌套异类多边形的表示较方便。 四叉树分割 将图像区域按四个大小相同的象限四等分,每个象限又可根据一定规则判断是否继续等分为次一层的四个象限,无论分割到哪一层象限,只要子象限上仅含一种属性代码或符合既定要求的少数几种属性时,则停止继续分割。否则就一直分割到单个象元为止。按照象限递归分割的原则所分图像区域的栅格阵列应为2n×2n(n为分割的层数)的形式。 四叉树结构 把整个2n×2n象元组成的阵列当作树的根结点,树的高度为n级(最多为n级)。每个结点有分别代表南西(SW)、南东(SE)、北西(NW)、北东(NE)四个象限的四个分支。四个分支中要么是树叶,要么是树叉。树叶代表不能继续划分的结点,该结点代表子象限具有单一的代码;树叉不只包含一种代在码,必须继续划分,直到变成树叶为止。 四叉树编码 1 指针四叉树编码 通过在子结点与父结点之间设立指针的方式建立起整个结构。按这种方式,四叉树的每个结点通常存储6个量,即四个子结点指针、一个父结点指针和该结点的属性代码。这种方法除了要记录叶结点外,还要记录中间结点,一般要占用较大存储空间。 2 线性四叉树编码 为美国马里兰大学地理信息系统中采用的编码方法,该方法记录每个终止结点(或叶结点)的地址和值,值就是子区的属性代码,其中地址包括两部分,共32位(二进制),最右边4位记录该叶结点的深度,即处于四叉树的第几层上,有了深度可以推知子区大小;左边的28位记录路径,从右边第五位往左记录从叶结点到根结点的路径,0,1,2,3分别表示SW、SE、NW、NE。
28位 4位
0 0 0 0 ... ... 0 0 0 0 1 1 1 0 0 0 1 1
(路径0SW,3NE,2NW) 0 3 2 深度3
记录了各个叶子的地址,再记录相应代码值,就记录了整个图像。 四叉树优点 1.容易而有效地计算多边形的数量特征; 2.阵列各部分的分辨率是可变的,边界复杂部分四叉树较高,即分级多,分辨率也高,而不需要表示许多细节的部分则分级少,分辨率低,因而既可精确表示图形结构又可减少存储量; 3.栅格到四叉树及到四叉树到简单栅格结构的转换比其他压缩方法容易; 4.多边形中嵌套异类多边形的表示较方便。

B. prores编码的优势在哪里它属于什么压缩方式

prores功能
简单来说ProRes是苹果自家的一种低压缩格式,存在的主要意义在于增加Mac剪辑时的流畅度。
其中细分为几个格式,码率不同,当然效果也有点差别。现在ProRes主要竞争对手是H264,ProRes整体来说编码效率比较低,存储空间占用大,而H264正相反,以往由于电脑硬件性能的制约直接剪辑H264格式不太流畅,现在由于GPU加速的普及和代理剪辑功能的完善流畅度已经不是问题,ProRes有逐渐失宠的趋势

C. 为什么要使用视音频压缩编码

减少视频的大小优化其架构等.使其可以在各类设备上使用!以上是我个人见解.
希望我的的回答对你有帮助!

D. 监控视频压缩编解码的介绍

(一)、M-JPEG
M-JPEG(Motion- Join Photographic Experts Group)技术即运动静止图像(或逐帧)压缩技术,广泛应用于非线性编辑领域可精确到帧编辑和多层图像处理,把运动的视频序列作为连续的静止图像来处理,这种压缩方式单独完整地压缩每一帧,在编辑过程中可随机存储每一帧,可进行精确到帧的编辑,此外M-JPEG的压缩和解压缩是对称的,可由相同的硬件和软件实现。但M-JPEG只对帧内的空间冗余进行压缩。不对帧间的时间冗余进行压缩,故压缩效率不高。采用M-JPEG数字压缩格式,当压缩比7:1时,可提供相当于Betecam SP质量图像的节目。
JPEG标准所根据的算法是基于DCT(离散余弦变换)和可变长编码。JPEG的关键技术有变换编码、量化、差分编码、运动补偿、霍夫曼编码和游程编码等
M-JPEG的优点是:可以很容易做到精确到帧的编辑、设备比较成熟。缺点是压缩效率不高。
此外,M-JPEG这种压缩方式并不是一个完全统一的压缩标准,不同厂家的编解码器和存储方式并没有统一的规定格式。这也就是说,每个型号的视频服务器或编码板有自己的M-JPEG版本,所以在服务器之间的数据传输、非线性制作网络向服务器的数据传输都根本是不可能的。
(二)、MPEG系列标准
MPEG是活动图像专家组(Moving Picture Exports Group)的缩写,于1988年成立,是为数字视/音频制定压缩标准的专家组,目前已拥有300多名成员,包括IBM、SUN、BBC、NEC、INTEL、AT&T等世界知名公司。MPEG组织最初得到的授权是制定用于“活动图像”编码的各种标准,随后扩充为“及其伴随的音频”及其组合编码。后来针对不同的应用需求,解除了“用于数字存储媒体”的限制,成为现在制定“活动图像和音频编码”标准的组织。MPEG组织制定的各个标准都有不同的目标和应用,目前已提出MPEG-1、MPEG-2、MPEG-4、MPEG-7和MPEG-21标准。
1.MPEG-1标准
MPEG-1标准于1993年8月公布,用于传输1.5Mbps数据传输率的数字存储媒体运动图像及其伴音的编码。该标准包括五个部分:
第一部分说明了如何根据第二部分(视频)以及第三部分(音频)的规定,对音频和视频进行复合编码。第四部分说明了检验解码器或编码器的输出比特流符合前三部分规定的过程。第五部分是一个用完整的C语言实现的编码和解码器。
该标准从颁布的那一刻起,MPEG-1取得一连串的成功,如VCD和MP3的大量使用,Windows95以后的版本都带有一个MPEG-1软件解码器,可携式MPEG-1摄像机等等。
2.MPEG-2标准
MPEG组织于1994年推出MPEG-2压缩标准,以实现视/音频服务与应用互操作的可能性。MPEG-2标准是针对标准数字电视和高清晰度电视在各种应用下的压缩方案和系统层的详细规定,编码码率从每秒3兆比特~100兆比特,标准的正式规范在ISO/IEC13818中。MPEG-2不是MPEG-1的简单升级,MPEG-2在系统和传送方面作了更加详细的规定和进一步的完善。MPEG-2特别适用于广播级的数字电视的编码和传送,被认定为SDTV和HDTV的编码标准。
MPEG-2图像压缩的原理是利用了图像中的两种特性:空间相关性和时间相关性。这两种相关性使得图像中存在大量的冗余信息。如果我们能将这些冗余信息去除,只保留少量非相关信息进行传输,就可以大大节省传输频带。而接收机利用这些非相关信息,按照一定的解码算法,可以在保证一定的图像质量的前提下恢复原始图像。一个好的压缩编码方案就是能够最大限度地去除图像中的冗余信息。
MPEG-2的编码图像被分为三类,分别称为I帧,P帧和B帧。
I帧图像采用帧内编码方式,即只利用了单帧图像内的空间相关性,而没有利用时间相关性。P帧和B帧图像采用帧间编码方式,即同时利用了空间和时间上的相关性。P帧图像只采用前向时间预测,可以提高压缩效率和图像质量。P帧图像中可以包含帧内编码的部分,即P帧中的每一个宏块可以是前向预测,也可以是帧内编码。B帧图像采用双向时间预测,可以大大提高压缩倍数。
MPEG-2的编码码流分为六个层次。为更好地表示编码数据,MPEG-2用句法规定了一个层次性结构。它分为六层,自上到下分别是:图像序列层、图像组(GOP)、图像、宏块条、宏块、块。
MPEG-2标准在广播电视领域中的主要应用如下:
(1)视音频资料的保存
一直以来,电视节目、音像资料等都是用磁带保存的。这种方式有很多弊端:易损,占地大,成本高,难于重新使用。更重要的是难以长期保存,难以查找、难以共享。随着计算机技术和视频压缩技术的发展,高速宽带计算机网络以及大容量数据存储系统给电视台节目的网络化存储、查询、共享、交流提供了可能。
采用MPEG-2压缩编码的DVD视盘,给资料保存带来了新的希望。电视节目、音像资料等可通过MPEG-2编码系统编码,保存到低成本的CD-R光盘或高容量的可擦写DVD-RAM上,也可利用DVD编着软件(如Daikin Scenarist NT、Spruce DVDMaestro等)制作成标准的DVD视盘,既可节约开支,也可节省存放空间。
(2)电视节目的非线性编辑系统及其网络
在非线性编辑系统中,节目素材是以数字压缩方式存储、制作和播出的, 视频压缩技术是非线性编辑系统的技术基础。目前主要有M-JPEG和MPEG-2两种数字压缩格式。
M-JPEG技术即运动静止图像(或逐帧)压缩技术,可进行精确到帧的编辑,但压缩效率不高。
MPEG-2采用帧间压缩的方式,只需进行I帧的帧内压缩处理,B帧和P帧通过侦测获得,因此 ,传输和运算的数据大多由帧之间的时间相关性得到,相对来说,数据量小,可以实现较高的压缩比。随着逐帧编辑问题的解决,MPEG-2将广泛应用于非线性编辑系统,并大大地降低编辑成本,同时MPEG-2的解压缩是标准的,不同厂家设计的压缩器件压缩的数据可由其他厂家设计解压缩器来解压缩,这一点保证了各厂家的设备之间能完全兼容。
由于采用MPEG-2 IBP视频压缩技术,数据量成倍减少,降低了存储成本,提高了数据传输速度,减少了对计算机总线和网络带宽的压力,可采用纯以太网组建非线性编辑网络系统已成为可能,而在目前以太网是最为成熟的网络,系统管理比较完善,价格也比较低廉。
基于MPEG-2的非线性编辑系统及非线性编辑网络将成为未来的发展方向。
(3)卫星传输
MPEG-2已经通过ISO认可,并在广播领域获得广泛的应用,如数字卫星视频广播(DVB-S)、DVD视盘和视频会议等。目前,全球有数以千万计的DVB-S用户,DVB-S信号采用MPEG-2压缩格式编码,通过卫星或微波进行传输,在用户端经MPEG-2卫星接收解码器解码,以供用户观看。此外,采用MPEG-2压缩编码技术,还可以进行远程电视新闻或节目的传输和交流。
(4)电视节目的播出
在整个电视技术中播出是一个承上启下的环节,对播出系统进行数字化改造是非常必要的,其中最关键一步就是构建硬盘播出系统。MPEG-2硬盘自动播出系统因编播简便、储存容量大、视频指标高等优点,而为人们所青睐。但以往MPEG-2播出设备因非常昂贵,而只有少量使用。随着MPEG-2技术的发展和相关产品成本的下降,MPEG-2硬盘自动系统播出可望得到普及。
3.MPEG-4标准
运动图像专家组MPEG 于1999年2月正式公布了MPEG-4(ISO/IEC14496)标准第一版本。同年年底MPEG-4第二版亦告底定,且于2000年年初正式成为国际标准。
MPEG-4与MPEG-1和MPEG-2有很大的不同。MPEG-4不只是具体压缩算法,它是针对数字电视、交互式绘图应用(影音合成内容)、交互式多媒体(WWW、资料撷取与分散)等整合及压缩技术的需求而制定的国际标准。MPEG-4标准将众多的多媒体应用集成于一个完整的框架内,旨在为多媒体通信及应用环境提供标准的算法及工具,从而建立起一种能被多媒体传输、存储、检索等应用领域普遍采用的统一数据格式。
MPEG-4的编码理念是:MPEG-4标准同以前标准的最显着的差别在于它是采用基于对象的编码理念,即在编码时将一幅景物分成若干在时间和空间上相互联系的视频音频对象,分别编码后,再经过复用传输到接收端,然后再对不同的对象分别解码,从而组合成所需要的视频和音频。这样既方便我们对不同的对象采用不同的编码方法和表示方法,又有利于不同数据类型间的融合,并且这样也可以方便的实现对于各种对象的操作及编辑。例如,我们可以将一个卡通人物放在真实的场景中,或者将真人置于一个虚拟的演播室里,还可以在互联网上方便的实现交互,根据自己的需要有选择的组合各种视频音频以及图形文本对象。
MPEG-4系统的一般框架是:对自然或合成的视听内容的表示;对视听内容数据流的管理,如多点、同步、缓冲管理等;对灵活性的支持和对系统不同部分的配置。
与MPEG-1、MPEG-2相比,MPEG-4具有如下独特的优点:
(1) 基于内容的交互性
MPEG-4提供了基于内容的多媒体数据访问工具,如索引、超级链接、上下载、删除等。利用这些工具,用户可以方便地从多媒体数据库中有选择地获取自己所需的与对象有关的内容,并提供了内容的操作和位流编辑功能,可应用于交互式家庭购物,淡入淡出的数字化效果等。MPEG-4提供了高效的自然或合成的多媒体数据编码方法。它可以把自然场景或对象组合起来成为合成的多媒体数据。
(2)高效的压缩性
MPEG-4基于更高的编码效率。同已有的或即将形成的其它标准相比,在相同的比特率下,它基于更高的视觉听觉质量,这就使得在低带宽的信道上传送视频、音频成为可能。同时MPEG-4还能对同时发生的数据流进行编码。一个场景的多视角或多声道数据流可以高效、同步地合成为最终数据流。这可用于虚拟三维游戏、三维电影、飞行仿真练习等
(3)通用的访问性
MPEG-4提供了易出错环境的鲁棒性,来保证其在许多无线和有线网络以及存储介质中的应用,此外,MPEG-4还支持基于内容的的可分级性,即把内容、质量、复杂性分成许多小块来满足不同用户的不同需求,支持具有不同带宽,不同存储容量的传输信道和接收端。
这些特点无疑会加速多媒体应用的发展,从中受益的应用领域有:因特网多媒体应用;广播电视;交互式视频游戏;实时可视通信;交互式存储媒体应用;演播室技术及电视后期制作;采用面部动画技术的虚拟会议;多媒体邮件;移动通信条件下的多媒体应用;远程视频监控;通过ATM网络等进行的远程数据库业务等。MPEG-4主要应用如下:
(1)应用于因特网视音频广播
由于上网人数与日俱增,传统电视广播的观众逐渐减少,随之而来的便是广告收入的减少,所以现在的固定式电视广播最终将转向基于TCP/IP的因特网广播,观众的收看方式也由简单的遥控器选择频道转为网上视频点播。视频点播的概念不是先把节目下载到硬盘,然后再播放,而是流媒体视频(streaming video),点击即观看,边传输边播放。
现在因特网中播放视音频的有:Real Networks公司的 Real Media,微软公司的 Windows Media,苹果公司的 QuickTime,它们定义的视音频格式互不兼容,有可能导致媒体流中难以控制的混乱,而MPEG-4为因特网视频应用提供了一系列的标准工具,使视音频码流具有规范一致性。因此在因特网播放视音频采用MPEG-4,应该说是一个安全的选择。
(2)应用于无线通信
MPEG-4高效的码率压缩,交互和分级特性尤其适合于在窄带移动网上实现多媒体通信,未来的手机将变成多媒体移动接收机,不仅可以打移动电视电话、移动上网,还可以移动接收多媒体广播和收看电视。
(3)应用于静止图像压缩
静止图像(图片)在因特网中大量使用,现在网上的图片压缩多采用JPEG技术。MPEG-4中的静止图像(纹理)压缩是基于小波变换的,在同样质量条件下,压缩后的文件大小约是JPEG压缩文件的十分之一。把因特网上使用的JPEG图片转换成MPEG-4格式,可以大幅度提高图片在网络中的传输速度。
(4)应用于电视电话
传统用于窄带电视电话业务的压缩编码标准,如H261,采用帧内压缩、帧间压缩、减少象素和抽帧等办法来降低码率,但编码效率和图像质量都难以令人满意。MPEG-4的压缩编码可以做到以极低码率传送质量可以接受的声像信号,使电视电话业务可以在窄带的公用电话网上实现。
(5)应用于计算机图形、动画与仿真
MPEG-4特殊的编码方式和强大的交互能力,使得基于MPEG-4的计算机图形和动画可以从各种来源的多媒体数据库中获取素材,并实时组合出所需要的结果。因而未来的计算机图形可以在MPEG-4语法所允许的范围内向所希望的方向无限发展,产生出今天无法想象的动画及仿真效果。
(6)应用于电子游戏
MPEG-4可以进行自然图像与声音同人工合成的图像与声音的混合编码,在编码方式上具有前所未有的灵活性,并且能及时从各种来源的多媒体数据库中调用素材。这可以在将来产生象电影一样的电子游戏,实现极高自由度的交互式操作。
(三)H.264
H.264是ITU-T的VCEG(视频编码专家组)和ISO/IEC的MPEG(活动图像编码专家组)的联合视频组(JVT:joint video team)开发的一个新的数字视频编码标准,它既是ITU-T的H.264,又是ISO/IEC的MPEG-4的第10 部分。1998年1月份开始草案征集,1999年9月,完成第一个草案,2001年5月制定了其测试模式TML-8,2002年6月的 JVT第5次会议通过了H.264的FCD板。2003年3月正式发布。
H.264和以前的标准一样,也是DPCM加变换编码的混合编码模式。但它采用回归基本的简洁设计,不用众多的选项,获得比H.263++好得多的压缩性能;加强了对各种信道的适应能力,采用网络友好的结构和语法,有利于对误码和丢包的处理;应用目标范围较宽,以满足不同速率、不同分辨率以及不同传输(存储)场合的需求;它的基本系统是开放的,使用无需版权。
在技术上,H.264标准中有多个闪光之处,如统一的VLC符号编码,高精度、多模式的位移估计,基于4×4块的整数变换、分层的编码语法等。这些措施使得H.264算法具有很的高编码效率,在相同的重建图像质量下,能够比H.263节约50%左右的码率。H.264的码流结构网络适应性强,增加了差错恢复能力,能够很好地适应IP和无线网络的应用。 H.264的算法在概念上可以分为两层:视频编码层(VCL:Video Coding Layer)负责高效的视频内容表示,网络提取层(NAL:Network Abstraction Layer)负责以网络所要求的恰当的方式对数据进行打包和传送。在VCL和NAL之间定义了一个基于分组方式的接口,打包和相应的信令属于NAL的一部分。这样,高编码效率和网络友好性的任务分别由VCL和NAL来完成。
VCL层包括基于块的运动补偿混合编码和一些新特性。与前面的视频编码标准一样,H.264没有把前处理和后处理等功能包括在草案中,这样可以增加标准的灵活性。
NAL负责使用下层网络的分段格式来封装数据,包括组帧、逻辑信道的信令、定时信息的利用或序列结束信号等。例如,NAL支持视频在电路交换信道上的传输格式,支持视频在Internet上利用RTP/UDP/IP传输的格式。NAL包括自己的头部信息、段结构信息和实际载荷信息,即上层的VCL数据。(如果采用数据分割技术,数据可能由几个部分组成)。 H.264支持1/4或1/8像素精度的运动矢量。在1/4像素精度时可使用6抽头滤波器来减少高频噪声,对于1/8像素精度的运动矢量,可使用更为复杂的8抽头的滤波器。在进行运动估计时,编码器还可选择增强内插滤波器来提高预测的效果。
在H.264的运动预测中,一个宏块(MB)可以按图2被分为不同的子块,形成7种不同模式的块尺寸。这种多模式的灵活和细致的划分,更切合图像中实际运动物体的形状,大大提高了运动估计的精确程度。在这种方式下,在每个宏块中可以包含有1、2、4、8或16个运动矢量。
在H.264中,允许编码器使用多于一帧的先前帧用于运动估计,这就是所谓的多帧参考技术。例如2帧或3帧刚刚编码好的参考帧,编码器将选择对每个目标宏块能给出更好的预测帧,并为每一宏块指示是哪一帧被用于预测。 H.264与先前的标准相似,对残差采用基于块的变换编码,但变换是整数操作而不是实数运算,其过程和DCT基本相似。这种方法的优点在于:在编码器中和解码器中允许精度相同的变换和反变换,便于使用简单的定点运算方式。也就是说,这里没有反变换误差。 变换的单位是4×4块,而不是以往常用的8×8块。由于用于变换块的尺寸缩小,运动物体的划分更精确,这样,不但变换计算量比较小,而且在运动物体边缘处的衔接误差也大为减小。为了使小尺寸块的变换方式对图像中较大面积的平滑区域不产生块之间的灰度差异,可对帧内宏块亮度数据的16个4×4块的DC系数(每个小块一个,共16个)进行第二次4×4块的变换,对色度数据的4个4×4块的DC系数(每个小块一个,共4个)进行2×2块的变换。
H.264为了提高码率控制的能力,量化步长的变化的幅度控制在12.5%左右,而不是以不变的增幅变化。变换系数幅度的归一化被放在反量化过程中处理以减少计算的复杂性。为了强调彩色的逼真性,对色度系数采用了较小量化步长。 在先前的H.26x系列和MPEG-x系列标准中,都是采用的帧间预测的方式。在H.264中,当编码Intra图像时可用帧内预测。对于每个4×4块(除了边缘块特别处置以外),每个像素都可用17个最接近的先前已编码的像素的不同加权和(有的权值可为0)来预测,即此像素所在块的左上角的17个像素。显然,这种帧内预测不是在时间上,而是在空间域上进行的预测编码算法,可以除去相邻块之间的空间冗余度,取得更为有效的压缩。
如图4所示,4×4方块中a、b、...、p为16 个待预测的像素点,而A、B、...、P是已编码的像素。如m点的值可以由(J+2K+L+2)/ 4 式来预测,也可以由(A+B+C+D+I+J+K+L)/ 8 式来预测,等等。按照所选取的预测参考的点不同,亮度共有9类不同的模式,但色度的帧内预测只有4类模式。 H.264 草案中包含了用于差错消除的工具,便于压缩视频在误码、丢包多发环境中传输,如移动信道或IP信道中传输的健壮性。
为了抵御传输差错,H.264视频流中的时间同步可以通过采用帧内图像刷新来完成,空间同步由条结构编码(slice structured coding)来支持。同时为了便于误码以后的再同步,在一幅图像的视频数据中还提供了一定的重同步点。另外,帧内宏块刷新和多参考宏块允许编码器在决定宏块模式的时候不仅可以考虑编码效率,还可以考虑传输信道的特性。
除了利用量化步长的改变来适应信道码率外,在H.264中,还常利用数据分割的方法来应对信道码率的变化。从总体上说,数据分割的概念就是在编码器中生成具有不同优先级的视频数据以支持网络中的服务质量QoS。例如采用基于语法的数据分割(syntax-based data partitioning)方法,将每帧数据的按其重要性分为几部分,这样允许在缓冲区溢出时丢弃不太重要的信息。还可以采用类似的时间数据分割(temporal data partitioning)方法,通过在P帧和B帧中使用多个参考帧来完成。
在无线通信的应用中,我们可以通过改变每一帧的量化精度或空间/时间分辨率来支持无线信道的大比特率变化。可是,在多播的情况下,要求编码器对变化的各种比特率进行响应是不可能的。因此,不同于MPEG-4中采用的精细分级编码FGS(Fine Granular Scalability)的方法(效率比较低),H.264采用流切换的SP帧来代替分级编码。
四、H.264的性能比较
TML-8为H.264的测试模式,用它来对H.264的视频编码效率进行比较和测试。测试结果所提供的PSNR已清楚地表明,相对于MPEG-4(ASP:Advanced Simple Profile)和H.263++(HLP:High Latency Profile)的性能,H.264的结果具有明显的优越性。
H.264的PSNR比MPEG-4(ASP)和H.263++(HLP)明显要好,在6种速率的对比测试中,H.264的PSNR比MPEG-4(ASP)平均要高2dB,比H.263(HLP)平均要高3dB。6个测试速率及其相关的条件分别为:32 kbit/s速率、10f/s帧率和QCIF格式;64 kbit/s速率、15f/s帧率和QCIF格式;128kbit/s速率、15f/s帧率和CIF格式;256kbit/s速率、15f/s帧率和QCIF格式;512 kbit/s速率、30f/s帧率和CIF格式;1024 kbit/s速率、30f/s帧率和CIF格式。

E. 急求图像压缩编码方法!!!

以下是几种格式的专业解释:

HDTV

一,HDTV的概念

要解释HDTV,我们首先要了解DTV。DTV是一种数字电视技术,是目前传统模拟电视技术的接班人。所谓的数字电视,是指从演播室到发射、传输、接收过程中的所有环节都是使用数字电视信号,或对该系统所有的信号传播都是通过由二进制数字所构成的数字流来 完成的。数字信号的传播速率为每秒19.39兆字节,如此大的数据流传输速度保证了数字电视的高清晰度,克服了模拟电视的先天不足。同时,由于数字电视可以允许几种制式信号的同时存在,因此每个数字频道下又可分为若干个子频道,能够满足以后频道不断增多的 需求。HDTV是DTV标准中最高的一种,即High Definision TV,故而称为HDTV。

二,HDTV中要求音、视频信号达到哪些标准?

HDTV规定了视频必须至少具备720线非交错式(720p,即常说的逐行)或1080线交错式隔行(1080i,即常说的隔行)扫描(DVD标准为 480线),屏幕纵横比为16:9。音频输出为5.1声道(杜比数字格式),同时能兼容接收其它较低格式的 信号并进行数字化处理重放。

HDTV有三种显示格式,分别是:720P(1280×720P,非交错式),1080 i(1920×1080i,交错式),1080P(1920×1080i,非交错式),其中网络上流传的以720P和1080 i最为常见,而在微软WMV-HD站点上1080P的样片相对较多。

三,如何收看HDTV节目?

目前有两种方式可欣赏到HDTV节目。一种是在电视上实时收看HDTV,需要满足两个条件,首先是电视可接收到HDTV信号,这需要额外添加相关的硬件,其次是电视符合HDTV标准,主要是指电视的分辨率和接收端口而言。
另一种是在电脑上通过软件播放。目前我国只有极少部分地区可接收到HDTV数字信号,而且HDTV电视的价格仍高高在上,不是普通消费者所能承受的。因此,在网络中找寻HDTC源,下载后在个人电脑上播放,成了大多数HDTV迷们的一个尝鲜方法。

四,哪些是可用于电脑播放的HDTV文件?

网络中流传的HDTV主要以两类文件的方式存在,一类是经过MPEG-2标准压缩,以.tp和.ts为后缀的视频流文件,一类是经过WMV-HD (Windows Media Video High Definition)标准压缩过的.wmv文件,还有少数文件后缀为.avi或.mpg,其性质与.wmv是完全一样的。

HDTV文件都比较大,即使是经过重新编码过后的.wmv文件也非同小可。以一部普通电影的时间长度来计算,.wmv文件将会有4G以上,而同样时间长度的.tp和.ts文件能达到8G以上,有的甚至达到20多G。因此,除了通过文件后缀名,还可以通过文 件大小来判断是否为HDTV文件。

五,如何在个人电脑上播放HDTV节目?

对于.wmv文件,只要系统安装了Windows Media Player 9 或更高版本,就可以正常播放,一些播放软件的最新版本已经开始支持WMV-HD,如WINDVD6等,也可以直接使用这些软件播放HDTV。有些HDTV文件在压缩过程中采用了其它标准的编码格式,就需要安装对应的解码器,遇到Windows Media Player 9不能正常播放时,可以再安装ffdshow,它带有各种最常用的解码器。

播放以.tp和.ts为后缀的视频流文件要稍微麻烦一点,因为文件中分别包含有AC3音频信息和MPEG-2视频信息。好在现下有已经不少专门播放.tp 和.ts文件的软件问世了,Moonlight-Elecard MPEG Player 就是其中一款比较常见的支持HDTV播放的软件,目前最新的版本为2.x。安装完后,也可以运行其它播放软件来调用Moonlight- Elecard MPEG Player的解码器进行播放。

六,如何鉴别HDTV的显示格式?

目前我们无法仅从文件名称、大小上来判定一个HDTV文件的显示格式是720P还是1080i,或是1080P,但是有不少软件可以在播放时显示影片的图像信息,如WINDVD、zplay等,在软件的控制面板中选择对应的选项就可以看到详细的信息。

七,为什么我只能看到图像,却听不到声音?

这是因为未安装AC3音频解码器,导致HDTV文件中的音频信息不能被正确识别的原因。解决的方法是下载并安装对应的音频解码器,常用的有 AC3Filter,这些音、视频解码器只需安装一次即可,播放HDTV文件时系统会自动调用,而不必每次播 放的时候都打开其控制界面。

八,为什么我播放HDTV时会出现丢帧现象?

在家用电脑上播放HDTV,对其硬件配置要求较高,主要是与CPU、显存、内存紧紧相关,如果这三样中有一样性能过低,就会产生一些播放问题。播放 HDTV时会出现丢帧现象是显存容量不够造成的,尤其是在播放1080 i格式HDTV的时候,1920×1080的像素量,需要足够大的显存才能满足其数据吞吐,因此显存至少需要64M以上,建议128M。由于是2D显示,所以对显卡核心的运算能力要求反而不是很高。

九,为什么我播放HDTV时会经常出现画面和语音停顿的现象?

一些采用了WMV-HD重新编码的HDTV文件,因为有着较高的压缩率,在播放时就需要非常高的CPU运算能力来进行实时解码,一般来说P4 2.0G/AMD 2000 以上及同级别的CPU可达到这个要求。同时,由于HDTV的数据流较大,需要足够的内存来支持,推荐在256M以上。如果你的电脑满足不了这样的配置,就可能会在播放过程中产生画面与语音不同步、画面经常停顿、爆音等现象。严重的话甚至无法顺利观看。如果 这种现象不太严重,则可以通过优化系统和一些小技巧来改善。

十,如何优化系统以保证顺利地播放HDTV?

除非你的电脑硬件配置的确很强,否则就很可能需要对系统进行一些优化,以便可以顺利地播放HDTV。首先是在播放HDTV前关闭所有没有用的后台程序或进程,尽量增加系统的空闲资源为播放HDTV服务;其次是选择一款占用系统资源较低的软件来播放HDTV 。Windows Media Player、WINDVD等软件占用系统资源较多,在硬件配置本就不高的系统上会影响HDTV的播放效果,这时可以选择使用BSPlayer。 BSPlayer是一款免费软件,最大的特点就是占用系统资源很小,尤其在播放HDTV文件时,与其它几个资源占用大户相比效果更为明显。另外,运行播放软件后立即打开任务管理器(仅在Windows 2000/XP中有效),将播放软件的进程级别设置为最高,这样也可以为HDTV的播放调用更多的系统资源。除此之外,安装更高版本的 DirectX,也能更好地支持HDTV的播放。

十一,还有什么其它的技巧?

如果你的PC可以流利地播放HDTV,那么你唯一会感到遗憾的,可能就是抱怨显示器太小和音箱太不够劲了。音箱的问题没有好的方法可以解决,必竟PC音箱和家庭影院的音箱两者是不可同比的,然而我们可以通过调高显示器的分辨率来提高画面的清晰度和细节感。 现在主流的显示器为17寸纯平CRT(因为改变标准分辨率只会给LCD带来负面影响,因此这种方法只针对普通的CRT显示器),中低档的17寸显示器很难达到1600×1200以上的分辨率,即使达到了其水平扫描率也在60Hz以下,但是请不要忘了,电视 信号的水平扫描率也就是在这个水平上。720P的水平扫描率为60Hz,1080i则有50Hz和60Hz两种,分别为我国和美国地区的标准。也就是说,即使你在显示器水平扫描率为60Hz的状态下全屏观看HDTV或DVD等其它视频,你是感觉不到晃眼的 ,这主要是由于人眼对于动态和静态物体的感应不同造成的。因此你可以在观看HDTV的时候,放心地将显示器水平扫描率设为60Hz,进而将分辨率调高,平时使用再调回标准分辨率即可。

存放HDTV文件的硬盘分区必须转换为NTFS格式,因为一部HDTV电影通常是几个4.3GB的视频文件组成(为了方便刻录在DVD上面),而FAT32是无法管理2GB以上的文件的,因此务必转换分区格式。

H.264

JVT(Joint Video Team,视频联合工作组)于2001年12月在泰国Pattaya成立。它由ITU-T和ISO两个国际标准化组织的有关视频编码的专家联合组成。JVT的工作目标是制定一个新的视频编码标准,以实现视频的高压缩比、高图像质量、良好的网络适应性等目标。目前JVT的工作已被ITU-T接纳,新的视频压缩编码标准称为H.264标准,该标准也被ISO接纳,称为AVC(Advanced Video Coding)标准,是MPEG-4的第10部分。
H.264标准可分为三档:
基本档次(其简单版本,应用面广);
主要档次(采用了多项提高图像质量和增加压缩比的技术措施,可用于SDTV、HDTV和DVD等);
扩展档次(可用于各种网络的视频流传输)。
H.264不仅比H.263和MPEG-4节约了50%的码率,而且对网络传输具有更好的支持功能。它引入了面向IP包的编码机制,有利于网络中的分组传输,支持网络中视频的流媒体传输。H.264具有较强的抗误码特性,可适应丢包率高、干扰严重的无线信道中的视频传输。H.264支持不同网络资源下的分级编码传输,从而获得平稳的图像质量。H.264能适应于不同网络中的视频传输,网络亲和性好。

H.261是最早出现的视频编码建议,目的是规范ISDN网上的会议电视和可视电话应用中的视频编码技术。它采用的算法结合了可减少时间冗余的帧间预测和可减少空间冗余的DCT变换的混合编码方法。和ISDN信道相匹配,其输出码率是p×64kbit/s。p取值较小时,只能传清晰度不太高的图像,适合于面对面的电视电话;p取值较大时(如 p>6),可以传输清晰度较好的会议电视图像。H.263 建议的是低码率图像压缩标准,在技术上是H.261的改进和扩充,支持码率小于64kbit/s的应用。但实质上H.263以及后来的H.263 和H.263 已发展成支持全码率应用的建议,从它支持众多的图像格式这一点就可看出,如Sub-QCIF、QCIF、CIF、4CIF甚至16CIF等格式。
MPEG-1标准的码率为1.2Mbit/s左右,可提供30帧CIF(352×288)质量的图像,是为CD-ROM光盘的视频存储和播放所制定的。MPEG-l标准视频编码部分的基本算法与H.261/H.263相似,也采用运动补偿的帧间预测、二维DCT、VLC游程编码等措施。此外还引入了帧内帧(I)、预测帧(P)、双向预测帧(B)和直流帧(D)等概念,进一步提高了编码效率。在MPEG-1的基础上,MPEG-2标准在提高图像分辨率、兼容数字电视等方面做了一些改进,例如它的运动矢量的精度为半像素;在编码运算中(如运动估计和DCT)区分“帧”和“场”;引入了编码的可分级性技术,如空间可分级性、时间可分级性和信噪比可分级性等。近年推出的MPEG-4标准引入了基于视听对象(AVO:Audio-Visual Object)的编码,大大提高了视频通信的交互能力和编码效率。 MPEG-4中还采用了一些新的技术,如形状编码、自适应DCT、任意形状视频对象编码等。但是MPEG-4的基本视频编码器还是属于和H.263相似的一类混合编码器。
总之,H.261建议是视频编码的经典之作,H.263是其发展,并将逐步在实际上取而代之,主要应用于通信方面,但H.263众多的选项往往令使用者无所适从。MPEG系列标准从针对存储媒体的应用发展到适应传输媒体的应用,其核心视频编码的基本框架是和H.261一致的,其中引人注目的MPEG-4的“基于对象的编码”部分由于尚有技术障碍,目前还难以普遍应用。因此,在此基础上发展起来的新的视频编码建议H.264克服了两者的弱点,在混合编码的框架下引入了新的编码方式,提高了编码效率,面向实际应用。同时,它是两大国际标准化组织的共同制定的,其应用前景应是不言而喻的。
JVT的H.264
H.264是ITU-T的VCEG(视频编码专家组)和ISO/IEC的MPEG(活动图像编码专家组)的联合视频组(JVT:joint video team)开发的一个新的数字视频编码标准,它既是ITU-T的H.264,又是ISO/IEC的MPEG-4的第10 部分。1998年1月份开始草案征集,1999年9月,完成第一个草案,2001年5月制定了其测试模式TML-8,2002年6月的 JVT第5次会议通过了H.264的FCD板。2003年3月正式发布。
H.264和以前的标准一样,也是DPCM加变换编码的混合编码模式。但它采用“回归基本”的简洁设计,不用众多的选项,获得比H.263 好得多的压缩性能;加强了对各种信道的适应能力,采用“网络友好”的结构和语法,有利于对误码和丢包的处理;应用目标范围较宽,以满足不同速率、不同分辨率以及不同传输(存储)场合的需求;它的基本系统是开放的,使用无需版权。
在技术上,H.264标准中有多个闪光之处,如统一的VLC符号编码,高精度、多模式的位移估计,基于4×4块的整数变换、分层的编码语法等。这些措施使得H.264算法具有很的高编码效率,在相同的重建图像质量下,能够比H.263节约50%左右的码率。H.264的码流结构网络适应性强,增加了差错恢复能力,能够很好地适应IP和无线网络的应用。
H.264的技术亮点
(1) 分层设计
H.264的算法在概念上可以分为两层:视频编码层(VCL:Video Coding Layer)负责高效的视频内容表示,网络提取层(NAL:Network Abstraction Layer)负责以网络所要求的恰当的方式对数据进行打包和传送。在VCL和NAL之间定义了一个基于分组方式的接口,打包和相应的信令属于NAL的一部分。这样,高编码效率和网络友好性的任务分别由VCL和NAL来完成。
VCL层包括基于块的运动补偿混合编码和一些新特性。与前面的视频编码标准一样,H.264没有把前处理和后处理等功能包括在草案中,这样可以增加标准的灵活性。
NAL负责使用下层网络的分段格式来封装数据,包括组帧、逻辑信道的信令、定时信息的利用或序列结束信号等。例如,NAL支持视频在电路交换信道上的传输格式,支持视频在Internet上利用RTP/UDP/IP传输的格式。NAL包括自己的头部信息、段结构信息和实际载荷信息,即上层的VCL数据。(如果采用数据分割技术,数据可能由几个部分组成)。
(2) 高精度、多模式运动估计
H.264支持1/4或1/8像素精度的运动矢量。在1/4像素精度时可使用6抽头滤波器来减少高频噪声,对于1/8像素精度的运动矢量,可使用更为复杂的8抽头的滤波器。在进行运动估计时,编码器还可选择“增强”内插滤波器来提高预测的效果。
在H.264的运动预测中,一个宏块(MB)可以按图2被分为不同的子块,形成7种不同模式的块尺寸。这种多模式的灵活和细致的划分,更切合图像中实际运动物体的形状,大大提高了运动估计的精确程度。在这种方式下,在每个宏块中可以包含有1、2、4、8或16个运动矢量。
在H.264中,允许编码器使用多于一帧的先前帧用于运动估计,这就是所谓的多帧参考技术。例如2帧或3帧刚刚编码好的参考帧,编码器将选择对每个目标宏块能给出更好的预测帧,并为每一宏块指示是哪一帧被用于预测。
(3) 4×4块的整数变换
H.264与先前的标准相似,对残差采用基于块的变换编码,但变换是整数操作而不是实数运算,其过程和DCT基本相似。这种方法的优点在于:在编码器中和解码器中允许精度相同的变换和反变换,便于使用简单的定点运算方式。也就是说,这里没有“反变换误差”。变换的单位是4×4块,而不是以往常用的8×8块。由于用于变换块的尺寸缩小,运动物体的划分更精确,这样,不但变换计算量比较小,而且在运动物体边缘处的衔接误差也大为减小。为了使小尺寸块的变换方式对图像中较大面积的平滑区域不产生块之间的灰度差异,可对帧内宏块亮度数据的16个4×4块的DC系数(每个小块一个,共16个)进行第二次4×4块的变换,对色度数据的4个4×4块的DC系数(每个小块一个,共4个)进行2×2块的变换。
H.264为了提高码率控制的能力,量化步长的变化的幅度控制在12.5%左右,而不是以不变的增幅变化。变换系数幅度的归一化被放在反量化过程中处理以减少计算的复杂性。为了强调彩色的逼真性,对色度系数采用了较小量化步长。
(4) 统一的VLC
H.264中熵编码有两种方法,一种是对所有的待编码的符号采用统一的VLC(UVLC :Universal VLC),另一种是采用内容自适应的二进制算术编码(CABAC:Context-Adaptive Binary Arithmetic Coding)。CABAC是可选项,其编码性能比UVLC稍好,但计算复杂度也高。UVLC使用一个长度无限的码字集,设计结构非常有规则,用相同的码表可以对不同的对象进行编码。这种方法很容易产生一个码字,而解码器也很容易地识别码字的前缀,UVLC在发生比特错误时能快速获得重同步。
图3显示了码字的语法。这里,x0,x1,x2,…是INFO比特,并且为0或1。图4列出了前9种码字。如:第4号码字包含INFO01,这一码字的设计是为快速再同步而经过优化的,以防止误码。
(5) 帧内预测
在先前的H.26x系列和MPEG-x系列标准中,都是采用的帧间预测的方式。在H.264中,当编码Intra图像时可用帧内预测。对于每个4×4块(除了边缘块特别处置以外),每个像素都可用17个最接近的先前已编码的像素的不同加权和(有的权值可为0)来预测,即此像素所在块的左上角的17个像素。显然,这种帧内预测不是在时间上,而是在空间域上进行的预测编码算法,可以除去相邻块之间的空间冗余度,取得更为有效的压缩。
如图4所示,4×4方块中a、b、...、p为16 个待预测的像素点,而A、B、...、P是已编码的像素。如m点的值可以由(J+2K+L+2)/ 4 式来预测,也可以由(A B C D I J K L)/ 8 式来预测,等等。按照所选取的预测参考的点不同,亮度共有9类不同的模式,但色度的帧内预测只有1类模式。
(6) 面向IP和无线环境
H.264 草案中包含了用于差错消除的工具,便于压缩视频在误码、丢包多发环境中传输,如移动信道或IP信道中传输的健壮性。
为了抵御传输差错,H.264视频流中的时间同步可以通过采用帧内图像刷新来完成,空间同步由条结构编码(slice structured coding)来支持。同时为了便于误码以后的再同步,在一幅图像的视频数据中还提供了一定的重同步点。另外,帧内宏块刷新和多参考宏块允许编码器在决定宏块模式的时候不仅可以考虑编码效率,还可以考虑传输信道的特性。
除了利用量化步长的改变来适应信道码率外,在H.264中,还常利用数据分割的方法来应对信道码率的变化。从总体上说,数据分割的概念就是在编码器中生成具有不同优先级的视频数据以支持网络中的服务质量QoS。例如采用基于语法的数据分割(syntax-based data partitioning)方法,将每帧数据的按其重要性分为几部分,这样允许在缓冲区溢出时丢弃不太重要的信息。还可以采用类似的时间数据分割(temporal data partitioning)方法,通过在P帧和B帧中使用多个参考帧来完成。
在无线通信的应用中,我们可以通过改变每一帧的量化精度或空间/时间分辨率来支持无线信道的大比特率变化。可是,在多播的情况下,要求编码器对变化的各种比特率进行响应是不可能的。因此,不同于MPEG-4中采用的精细分级编码FGS(Fine Granular Scalability)的方法(效率比较低),H.264采用流切换的SP帧来代替分级编码。
H.264的性能测试
TML-8为H.264的测试模式,用它来对H.264的视频编码效率进行比较和测试。测试结果所提供的PSNR已清楚地表明,相对于MPEG-4(ASP:Advanced Simple Profile)和H.263 (HLP:High Latency Profile)的性能,H.264的结果具有明显的优越性,如图5所示。
H.264的PSNR比MPEG-4(ASP)和H.263 (HLP)明显要好,在6种速率的对比测试中,H.264的PSNR比MPEG-4(ASP)平均要高2dB,比H.263(HLP)平均要高3dB。6个测试速率及其相关的条件分别为:32 kbit/s速率、10f/s帧率和QCIF格式;64 kbit/s速率、15f/s帧率和QCIF格式;128kbit/s速率、15f/s帧率和CIF格式;256kbit/s速率、15f/s帧率和QCIF格式;512 kbit/s速率、30f/s帧率和CIF格式;1024 kbit/s速率、30f/s帧率和CIF格式。
实现难度
对每个考虑实际应用的工程师而言,在关注H.264的优越性能的同时必然会衡量其实现难度。从总体上说,H.264性能的改进是以增加复杂性为代价而获得的。目前全球也只有中国杭州海康威视数字技术有限公司在安防领域实现了H.264的实际应用,这一次我们走到了世界的前端!

1080p

1080P是标准层面上的HDTV或者硬件层面上FULL HD的最高标准之一,而FULL HD就是能够完全显示1920*1080像素或者说物理分辨率达到1920*1080的平板电视机。需要注意的是,FULL HD和先前很多厂家宣传的1080P并不是同样的概念。
但是我们走进卖场会发现大多数品牌商家都打着1080P的旗帜对外宣传,多少对我们的选购产生了阻碍.其实目前市场中的大多数平板电视都不是FULL HD,所谓的1080P只是支持1080P信号的接收并通过计算演变在屏幕上显示,大多数大屏幕平板电视都为1366*768,等离子中的部分产品更低,要达到FULL HD的概念,就必须屏幕达到1920*1080的物理分辨率以及至少30Hz的刷新率.

WAF

We Are Family 的简称 [我们是一家人]
WAF是韩国的一个影视制作小组,他们制作的DVDRIP是目前网上除了HDTV之外质量最好的,清晰度和音质都是上乘之作。
WAF的作品有以下特点:
1:严格控制每CD的容量,每CD的容量大小一般不超过0.05M(大家见过不少CD1是702M,CD2却是698M的现象吧)。
2:经过控制的容量,利于刻盘,(有些小组制作的容量经常可以超过702M,一CD盘的容量,这时候超刻技术就受重视了^_^)
3:分割片子时注意场景转换,极少造成一段场景有分裂感(例如4CD的《特洛伊》和4CD的《黑鹰》)。
4:每个片子压制的尺寸都以OAR为准,即导演原始版。
5:尺寸统一,几乎都是800线。(例:WAF20CD DTS版BOB,800*448,见过15CD的HDTVRIP版,居然有两种尺寸!)我不清楚,一部大片为什么大家会忍受得了分辨率为640甚至以下的版本?
6:有极强的负责任的制作态度,发现有瑕疵的一般都会推出修复版.
7:喜欢WAF的DTS和AC3音频和高码率压缩的视频.
8:WAF每部片分割成的CD数一般都比别的小组制作的要多,这是为了保证必要的画质和音质的质量。试想想有个加长版《角斗士》使用DTS音轨,却只分割成2CD,每CD有70多分钟长,不知这样压缩出来的片子画质能好到什么程度?
所以说,WAF小组出品的DVDRip一般都是网上最清晰的版本。

问题补充:

普通家用电视的分辨率是多少?是不是屏幕越大分辨率越高?

电视的NTSC标准为720x480 刷新率为60Hz , PAL为720x576,刷新率为50Hz。 我国电视广播采用 PAL制。

逐行电视接收隔行信号经过差补后可以达到逐行输出,同时75Hz刷新率 ,或者隔行输出,同时100Hz刷新率。

虽然PAL制可达576线,但普通电视的实际可分辨水平线数只有300~500。高清电视理论上可达720P 和1080i,就是说最多逐行720线。所以按理论来说,搞清电视用1024x768的VGA输入也勉强可以表现出来了,但实际因为聚焦不准,文字显示比能显示1024x768的显示器差很多,画面显示则没什么问题。

HDTV是不是没有经过压缩,最原始的视频?

网络中流传的HDTV主要以两类文件的方式存在,一类是经过MPEG-2标准压缩,以.tp和.ts为后缀的视频流文件,一类是经过WMV-HD (Windows Media Video High Definition)标准压缩过的.wmv文件,还有少数文件后缀为.avi或.mpg,其性质与.wmv是完全一样的。

H.264等压缩格式是不是为了方便网上传播?

在技术上,H.264标准中有多个闪光之处,如统一的VLC符号编码,高精度、多模式的位移估计,基于4块的整数变换、分层的编码语法等。这些措施使得H.264得算法具有很高的编码效率,在相同的重建图像质量下,能够比H.263节约50%左右的码率。H.264的码流结构网络适应性强,增加了差错恢复能力,能够很好地适应IP和无线网络的应用。

H.264能以较低的数据速率传送基于联网协议(IP)的视频流,在视频质量、压缩效率和数据包恢复丢失等方面,超越了现有的MPEG-2、MPEG-4和H.26x视频通讯标准,更适合窄带传输。

网上流传的Rip格式是什么意思?DVDRip

DVDRip理解:其实就是一种DVD的备份技术。

DVD我们都知道,目前非常优秀的媒体格式,MPEG2编码的视频;AC3、DTS的音轨。但是我们也知道DVD载体是DVD光盘,D5一张就有4.7G。显然,直接将DVD文件进行网络传送毫无实际价值可言,将这样的文件打包传到服务器上只会占用服务器的硬盘和大量的网络带宽。还没有多少人的网络带宽可以让他毫不动容地去下载一个7、8GB的文件只为了看两个小时电影,更不要说将它们保存下来,DVD刻录机这样的产品目前也不是一般人能拥有的。
这就需要rip了,将DVD的视频、音频、字幕剥离出来,再经过压缩或者其他处理,然后重新合成成多媒体文件。在更小的文件尺寸上达到DVD的是视听享受。

F. 数字压缩技术的优点是什么

数字压缩技术,可降低表达一条信息无论是文件、静止图像、电影或声音所需的数字码(1和0的数字串)的数量。数字传输对传输视频信息至关重要,因为数字化的视频信息占用大量的空间。例如,只有4秒钟长的数字化电影会占满100兆字节的硬驱空间。如果不加以压缩,一部标准长度的故事片会充满350多盘普通光盘。为了实现压缩,在从一帧至另一帧的画面中,只录下变化的部分,而不变的(如背景)则只录下一次。目前尚不存在的一项关键技术是所谓的家用信息电器,它可与“信息高速公路”相接,支持所有拟议中的视频和文字应用,并且像电话和电视机一样使用方便。

G. 多媒体的压缩编码

被国际社会广泛认可和应用的通用压缩编码标准大致有如下四种:H.261、JPEG、 MPEG和DVI。
★ H.261:由CCITT(国际电报电话咨询委员会)通过的用于音频视频服务的视频编码解码器(也称Px64标准),它使用两种类型的压缩:一帧中的有损压缩(基于DCT)和用于帧间压缩的无损编码,并在此基础上使编码器采用带有运动估计的DCT和DPCM(差分脉冲编码调制)的混合方式。这种标准与JPEG及MPEG标准间有明显的相似性,但关键区别是它是为动态使用设计的,并提供完全包含的组织和高水平的交互控制。
★ JPEG:全称是Joint Photogragh Coding Experts Group(联合照片专家组),是一种基于DCT的静止图像压缩和解压缩算法,它由ISO(国际标准化组织)和CCITT(国际电报电话咨询委员会)共同制定,并在1992年后被广泛采纳后成为国际标准。它是把冗长的图像信号和其它类型的静止图像去掉,甚至可以减小到原图像的百分之一(压缩比100:1)。但是在这个级别上,图像的质量并不好;压缩比为20:1时,能看到图像稍微有点变化;当压缩比大于20:1时,一般来说图像质量开始变坏。
★ MPEG:是Moving Pictures Experts Group(动态图像专家组)的英文缩写,实际上是指一组由ITU和ISO制定发布的视频、音频、数据的压缩标准。它采用的是一种减少图像冗余信息的压缩算法,它提供的压缩比可以高达200:1,同时图像和音响的质量也非常高。通常有三个版本:MPEG-1、MPEG-2、MPEG-4以适用于不同带宽和数字影像质量的要求。它的三个最显着优点就是兼容性好、压缩比高(最高可达200:1)、数据失真小。
★ DVI:其视频图像的压缩算法的性能与MPEG-1相当,即图像质量可达到VHS的水平,压缩后的图像数据率约为1.5Mb/s。为了扩大DVI技术的应用,Intel公司推出了DVI算法的软件解码算法,称为Indeo技术,它能将为压缩的数字视频文件压缩为五分之一到十分之一。

H. 什么是无损压缩它相对于mp3格式有那些优点

所谓无损压缩格式,是利用数据的统计冗余进行压缩,可完全回复原始数据而不引起任何失真,但压缩率是受到数据统计冗余度的理论限制,一般为2:1到5:1.这类方法广泛用于文本数据,程序和特殊应用场合的图像数据(如指纹图像,医学图像等)的压缩。由于压缩比的限制,仅使用无损压缩方法是不可能解决图像和数字视频的存储和传输的所有问题.经常使用的无损压缩方法有 Shannon-Fano 编码,Huffman 编码,游程(Run-length)编码,LZW(Lempel-Ziv-Welch)编码和算术编码等。
所谓无损压缩格式,顾名思义,就是毫无损失地将声音信号进行压缩的音频格式。常见的像MP3、WMA等格式都是有损压缩格式,相比于作为源的WAV文件,它们都有相当大程度的信号丢失,这也是它们能达到10%的压缩率的根本原因。而无损压缩格式,就好比用Zip或RAR这样的压缩软件去压缩音频信号,得到的压缩格式还原成WAV文件,和作为源的WAV文件是一模一样的!但是如果用Zip或RAR来压缩WAV文件的话,必须将压缩包解压后才能播放。而无损压缩格式则能直接通过播放软件实现实时播放,使用起来和MP3等有损格式一模一样。总而言之,无损压缩格式就是能在不牺牲任何音频信号的前提下,减少WAV文件体积的格式。 无损压缩的优势:
1、100%的保存、没有任何信号丢失
2、音质高,不受信号源的影响3、转换方便

I. 声音压缩编码有那些标准 Mp3属于哪种压缩编码标准

音频编码的分类如下:
(1)基于音频数据的统计特性进行编码,其典型技术是波形编码.其目标是使重建语音波形保持原波形的形状.PCM(脉冲编码调制)是最简单最基本的编码方法.它直接赋予抽样点一个代码,没有进行压缩,因而所需的存储空间较大.为了减少存储空间,人们寻求压缩编码技术.利用音频抽样的幅度分布规律和相邻样值具有相关性的特点,提出了差值量化(DPCM),自适应量化(APCM)和自适应预测编码(ADPCM)等算法,实现了数据的压缩.波形编码适应性强,音频质量好,但压缩比不大,因而数据率较高.
(2)基于音频的声学参数,进行参数编码,可进一步降低数据率.其目标是使重建音频保持原音频的特性.常用的音频参数有共振峰,线性预测系数,滤波器组等.这种编码技术的优点是数据率低,但还原信号的质量较差,自然度低. 将上述两种编码算法很好地结合起来,采用混合编码的方法.这样就能在较低的码率上得到较高的音质.如码本激励线性预测编码(CELP),多脉冲激励线性预测编码(MPLPC)等.
(3)基于人的听觉特性进行编码:从人的听觉系统出发,利用掩蔽效应,设计心理声学模型,从而实现更高效率的数字音频的压缩.其中以MPEG标准中的高频编码和DolbyAC-3最有影响.

MP3原本用于表述MPEG1 Layer 3,但是日常应用中已经发展至包含Layer 1, Layer 2以及Fraunhofer Institute所扩展的MPEG 2.5。MP3是得到最高认知度的编解码器之一,在互联网编解码器中具有最大的用户群。但是为达到近CD品质音频,对某些难应付的内容需要高于192kbps速率。

J. 语音压缩编码基本概念

    通常把低于 64kbit/s 速率的语音编码方法称为语音压缩编码技术。

    常见的话音压缩编码方法有:

   仅由前邻样值进行预测称为一阶预测;由多个过去样值进行预测称为多阶预测,预测表达式如下:
一阶预测:

多阶预测:

显然多阶预测的精度要高一些,但复杂度也高。

1)基本原理
    差值脉冲编码调制 DPCM,是利用语音信号的相关性,对相邻样值的差值进行编码。

其中, 为 时刻的样值, 为前邻时刻的样值。
    对相邻样值的差值进行编码,实际是对 样值 与过去的样值为基础得到的 当前样值的估值(预测值) 之间的差值进行量化编码的。

2)DPCM的编码速率
    样值差值的动态范围比样值本身的动态范围小得多,则量化电平较少,在保证话音质量要求下,可降低编码速率。相比8位码的1路数码率为64kbit/s的PCM编码,DPCM相对差值编4位码,编码速率为32kbit/s。

    为了容易实现,常采用固定预测器。输入信号与预测信号的差值大,从而造成 误差增大,话音质量受影响 。故为了提高DPCM方式的质量选择采用 自适应 措施。

    在DPCM的基础上增加 自适应预测 自适应量化

   将输入的音频信号的频带分成若干个连续的频段,每个频带称为子带,然后针对各个子带中的音频信号采用不同的编码方案以降低码率,保证编码质量,但复杂度偏高。比如对于低频段采用较多的编码位数,对于高频段采用较少的编码位数,整体上降低码率。
   子带编码是波形编码和频域编码的结合,是属于混合编码。

   将信号分为若干个子带进行编码有以下两个优点:

   子带编码中,编码所需要的总速率 I 为

其中, 为第 k 个子带的抽样频率,每个样值采用 位比特编码。
比如若设等带宽子带宽编码的编码速率为



若各子带样值编码比特数的平均值为R
则有:

例如,一个4个子带的SBC系统,子带分别为[0 800],[800 1600],[1600 2400],[2400 3200],即为等带宽子带编码且每个子带的带宽为800Hz,如果忽略同步的边带信息,子带的比特分配分别为3,2,1,0 比特/样值(即每个子带的编码位数 ),则SBC编码系统总的传输速率为

阅读全文

与压缩编码方法的优点相关的资料

热点内容
长沙好玩的解压项目 浏览:140
专属学情分析报告是什么app 浏览:562
php工程部署 浏览:831
android全屏透明 浏览:730
阿里云服务器已开通怎么办 浏览:801
光遇为什么登录时服务器已满 浏览:300
PDF分析 浏览:482
h3c光纤全工半全工设置命令 浏览:139
公司法pdf下载 浏览:379
linuxmarkdown 浏览:349
华为手机怎么多选文件夹 浏览:681
如何取消命令方块指令 浏览:347
风翼app为什么进不去了 浏览:776
im4java压缩图片 浏览:360
数据查询网站源码 浏览:148
伊克塞尔文档怎么进行加密 浏览:888
app转账是什么 浏览:161
php的基本语法 浏览:792
对外汉语pdf 浏览:518
如何用mamp本地web服务器 浏览:871