① 压缩编码
在介绍图象的压缩编码之前,先考虑一个问题:为什么要压缩?其实这个问题不用我回答,你也能想得到。因为图象信息的数据量实在是太惊人了。举一个例子就明白:一张A4(210mm×297mm) 幅面的照片,若用中等分辨率(300dpi)的扫描仪按真彩色扫描,其数据量为多少?让我们来计算一下:共有(300×210/25.4) ×(300×297/25.4)个象素,每个象素占3个字节,其数据量为26M字节,其数据量之大可见一斑了。
如今在Internet上,传统基于字符界面的应用逐渐被能够浏览图象信息的WWW(World Wide Web)方式所取代。WWW尽管漂亮,但是也带来了一个问题:图象信息的数据量太大了,本来就已经非常紧张的网络带宽变得更加不堪重负,使得World Wide Web变成了World Wide Wait。
总之,大数据量的图象信息会给存储器的存储容量,通信干线信道的带宽,以及计算机的处理速度增加极大的压力。单纯靠增加存储器容量,提高信道带宽以及计算机的处理速度等方法来解决这个问题是不现实的,这时就要考虑压缩。
压缩的理论基础是信息论。从信息论的角度来看,压缩就是去掉信息中的冗余,即保留不确定的信息,去掉确定的信息(可推知的),也就是用一种更接近信息本质的描述来代替原有冗余的描述。这个本质的东西就是信息量(即不确定因素)。
压缩可分为两大类:第一类压缩过程是可逆的,也就是说,从压缩后的图象能够完全恢复出原来的图象,信息没有任何丢失,称为无损压缩;第二类压缩过程是不可逆的,无法完全恢复出原图象,信息有一定的丢失,称为有损压缩。选择哪一类压缩,要折衷考虑,尽管我们希望能够无损压缩,但是通常有损压缩的压缩比(即原图象占的字节数与压缩后图象占的字节数之比,压缩比越大,说明压缩效率越高)比无损压缩的高。
图象压缩一般通过改变图象的表示方式来达到,因此压缩和编码是分不开的。图象压缩的主要应用是图象信息的传输和存储,可广泛地应用于广播电视、电视会议、计算机通讯、传真、多媒体系统、医学图象、卫星图象等领域。
压缩编码的方法有很多,主要分成以下四大类:(1)象素编码;(2)预测编码;(3)变换编码;(4)其它方法。
所谓象素编码是指,编码时对每个象素单独处理,不考虑象素之间的相关性。在象素编码中常用的几种方法有:(1)脉冲编码调制(Pulse Code Molation,简称PCM);(2)熵编码(Entropy Coding);(3)行程编码(Run Length Coding);(4)位平面编码(Bit Plane Coding)。其中我们要介绍的是熵编码中的哈夫曼(Huffman)编码和行程编码(以读取.PCX文件为例)。
所谓预测编码是指,去除相邻象素之间的相关性和冗余性,只对新的信息进行编码。举个简单的例子,因为象素的灰度是连续的,所以在一片区域中,相邻象素之间灰度值的差别可能很小。如果我们只记录第一个象素的灰度,其它象素的灰度都用它与前一个象素灰度之差来表示,就能起到压缩的目的。如248,2,1,0,1,3,实际上这6个象素的灰度是248,250,251,251,252,255。表示250需要8个比特,而表示2只需要两个比特,这样就实现了压缩。
常用的预测编码有Δ调制(Delta Molation,简称DM);微分预测编码(Differential Pulse Code Molation,DPCM),具体的细节在此就不详述了。
所谓变换编码是指,将给定的图象变换到另一个数据域(如频域)上,使得大量的信息能用较少的数据来表示,从而达到压缩的目的。变换编码有很多,如(1)离散傅立叶变换(Discrete Fourier Transform,简称DFT);(2)离散余弦变换(Discrete Cosine Transform,简称DCT);(3)离散哈达玛变换(Discrete Hadamard Transform,简称DHT)。
其它的编码方法也有很多,如混合编码(Hybird Coding)、矢量量化(Vector Quantize,VQ) 、LZW算法。在这里,我们只介绍LZW算法的大体思想。
值得注意的是,近些年来出现了很多新的压缩编码方法,如使用人工神经元网络(Artificial Neural Network,简称ANN)的压缩编码算法、分形(Fractl)、小波(Wavelet) 、基于对象(Object Based)的压缩编码算法、基于模型(Model –Based)的压缩编码算法(应用在MPEG4及未来的视频压缩编码标准中)。
② 什么是:图像处理
几十年前,美国在太空探索中拍回了大量月球照片,但是由于环境所限,照片非常不清楚。在运用图像处理手段后,这些照片中的重要信息得以清晰再现,引起了巨大轰动。这也促进了图像处理/信号处理技术的蓬勃发展。数字图像处理在今天是非常热门的技术之一。它也许就是可以改变人们生活方式的技术。 但在网络上,不少人对图像处理还有些误解,一提起图像处理,大家就想起PhotoShop,就象一说多煤体,就想到Authorware,Director一样。PhotoShop是非常优秀的软件,乃至于它几乎成为事实上的工业标准。然而,它所具有的功能,也只能是图像处理中的一部份而已。图像处理有许多分支,先抛开序列图像和立体图像不说,图像处理比较重要的部份有:图像编码/图像压缩,图像增强,图像复原,图像识别/图像理解等。 搞这一行,主要的基础是数学,基本上是一天到晚和算法打交道。但是这一门学问涉及到的知识很广也很杂,比如 图像编码的编码理论基础是信息论,抽象数学。图像识别需要随机过程,信号处理的知识。不少课题还需要更加专门的知识,如小波变换,神经网络,分形。当然,高等数学和矩阵理论/线性代数是绝对的基础。然而图像处理需要的这些知识并不要求有很大的深度,就是全然不懂这些东西,也可以做出很好的程序来。因为从工程角度来看不一定要很严密的数学论证。此外,这是一门应用性很强的学问,就有它的一些特点,要适应计算机的发展。比如说,付立叶变换是图像处理常用的方法,到目前为止,库利-图基快速付立叶变换一直是主要算法,它使运算需要的乘法数目大为降低,加法数目虽然增加很多,但对于大部份CPU来说,总的运算速度提升非常大。但是, Intel的CPU现在加入了MMX指令,具有并行,信号处理功能,用MMX指令,乘法和加法用时是一样的,所以在MMX指令面前,快速算法反而更慢,同时也就产生了新的适应MMX的快速算法。再有,图像处理的另一个特点,也是他的难点,就是采用方法的优劣和被处理对象的内容高度相关。也就是说,很难找到适用于各种情况的通用方法。因此,图像处理按照处理的对象类别还可以分出遥感图像处理,医学图像处理等等。 有许多学科和图像处理有关系,如: 计算机图形学:图形(Graph)和图像(Image)本身关系就比较密切,这两者的区别也很显着,一个是用点,线,面描述东西,多用几何手段。另一个基本上只和像素点打交道。图形领域比较有名的语言应该首推OpenGL,有名的软件就更多了,各种CAD软件好多。 模式识别:图像处理的最重要目的之一就是识别,这也是图像技术非常重要的原因。我们常常遇到一些如指纹鉴别,人脸识别 等需求,自然要和模式识别打交道。 人工智能:可以说,图像处理,模式识别,人工智能是三位一体的学科。目前,图像识别技术遇到很大困难,就是自动化程度做不高,也可以说是智能程度不够。例如,人眼可以很容易从人群中找到自己要寻找的目标。但对于计算机来说,就连判断一幅图像中是否有人存在这样看似简单的问题都很难解决。人工智能在近二十年里发展得很缓慢,日本的智能计算机计划以失败告终。也没有多少人承认深蓝计算机国际象棋的胜利是人工智能的结果。神经网络一度燃起了许多希望,但目前还尚需努力。 计算机视觉:这可能是图像处理的较高境界了,从图像中获取信息,并对信息进行加工抽象,这门学问比较难。
③ 多媒体数据可以被压缩的主要原因是数据之间存在冗余和相关性
多媒体数据可以被压缩的主要原因是数据之间存在冗余和相关性。
数据压缩的原理:
事实上,多媒体信息存在许多数据冗余。
例如:
(1)一幅图像中的静止建筑背景、蓝天和绿地,其中许多像素是相同的如果逐点存储,就会浪费许多空间,这称为空间冗余。
(2)在电视和动画的相邻序列中,只有运动物体有少许变化,仅存储差异部分即可,这称为时间冗余。此外还有结构冗余、视觉冗余等,这就为数据压缩提供了条件。
总之,压缩的理论基础是信息论。从信息的角度来看,压缩就是去除掉信息中的冗余,即去除掉确定的或可推知的信息,而保留不确定的信息,也就是用一种更接近信息本质的描述来代替原有的冗余的描述,这个本质的东西就是信息量。
(3)图像压缩编码的理论基础是信息论扩展阅读
数据压缩的应用:
(1)一种非常简单的压缩方法是行程长度编码,这种方法使用数据及数据长度这样简单的编码代替同样的连续数据,这是无损数据压缩的一个实例。
这种方法经常用于办公计算机以更好地利用磁盘空间、或者更好地利用计算机网络中的带宽。对于电子表格、文本、可执行文件等这样的符号数据来说,无损是一个非常关键的要求,因为除了一些有限的情况,大多数情况下即使是一个数据位的变化都是无法接受的。
(2)对于视频和音频数据,只要不损失数据的重要部分一定程度的质量下降是可以接受的。通过利用人类感知系统的局限,能够大幅度得节约存储空间并且得到的结果质量与原始数据质量相比并没有明显的差别。
这些有损数据压缩方法通常需要在压缩速度、压缩数据大小以及质量损失这三者之间进行折衷。
(3)有损图像压缩用于数码相机中,大幅度地提高了存储能力,同时图像质量几乎没有降低。用于DVD的有损MPEG-2编解码视频压缩也实现了类似的功能。
在有损音频压缩中,心理声学的方法用来去除信号中听不见或者很难听见的成分。人类语音的压缩经常使用更加专业的技术,因此人们有时也将“语音压缩”或者“语音编码”作为一个独立的研究领域与“音频压缩”区分开来。
不同的音频和语音压缩标准都属于音频编解码范畴。例如语音压缩用于因特网电话,而音频压缩被用于CD翻录并且使用 MP3 播放器解码。
参考资料来源
网络-数据压缩
④ 建设数字图书馆的主要技术是什么
从计算机领域的研究角度出发,数字图书馆的研究和开发的若干关键技术如下。
1.数字图书馆系统结构模型:
数字图书馆是一个相当复杂的系统,必须有统一、规范和系统化的模型作为研究和开发数字图书馆的理论指导和前提。对数字图书馆模型的研究,根据建模侧重点不同,可以将系统模型分为:结构模型、框架模型、动态模型、过程模型和功能模型。这五种模型各有所长,如何将其有机地结合和统一,形成对数字图书馆的相对完整刻画,还需要做许多的研究工作。
2.数字图书馆资源管理:
数字图书馆研究和建设的迅速发展,系统资源和信息资源已经显得非常重要,如何更加有效、合理地管理和利用有限的系统资源(cpu线程、i/o进程、缓冲区和网络处理)和信息资源满足数字图书馆的各种需求,是资源管理研究的主要内容。其中包括资源管理的机制和策略、管理模型和优化算法等。目前针对这个问题已经提出的解决方法:服务质量概念以及利用qos机制来解决该问题的方法;基于元调度方法“装箱”方案;基于数字图书馆的三层模型和多媒体协商、cpu调度、缓冲区分配和差错控制等方法。
3.分布式多媒体同步:
在数字图书馆的通信中有时不仅要求实时、等时地传输多媒体数据,而且要求各种媒体对象间保持时间和空间的同步约束。实时性、等时性和同步性是多媒体通信的基本特点,也是实现多媒体通信的关键技术和基础。同步性要求各种媒体在传输后仍然保持原来时间和空间上的制约关系。目前国际上关于多媒体同步模型的研究可分为时间线模型、层次模型和参考点模型三类。各种媒体信息时态关系的研究也是多媒体同步中重要组成部分。目前多媒体同步模型的研究比较深入,人们提出了不少模型,但还没有一种比较完善的、能够满足数字图书馆通信要求的分布式多媒体同步模型。
4.多媒体数据库:
多媒体数据库技术是以有效管理大量多媒体数据和相关信息为目标的数据库系统,它是开发数字图书馆的关键技术之一,是多媒体、图像处理和识别、人工智能和数据库技术相结合的产物。数字图书馆的媒体资源内容的组织方式将与传统的方式不同。其内容将按照用户需求挑选的高价值知识内容,经过分类、编辑、整理、加工,变成受教育者易于接受的形式。它是一种有很大增值的有序的知识库,会出现新的知识产权关系。数字图书馆将资源分为元数据和对象数据。对象数据是指数字化的文本、图像、声音、影像等,元数据则是那些描述和管理对象数据的数据。对象数据呈分布式存放在各地的资源点内,元数据则有必要集中在数字图书馆中心的超大规模服务器上,用户查询时,中心调度系统通过元数据调度各对象数据库数据以提供服务。
5.基于内容的信息检索:
基于内容的检索技术是多媒体数据库的重要组成部分,是目前数字图书馆研究的热点关键技术之一。所谓基于内容的检索是指根据媒体对象的语义和上下文联系进行检索。其特点在于:从媒体内容中提取信息特征。即对图像、视频、音频进行分析和特征提取,利用这些内容建立特征矢量作为索引进行检索;是一种基于媒体多维特征进行的近似性匹配,是一种信息检索技术。该技术将支持从数字图书馆的多媒体数据库中以用户可以接受的响应速度查询到所要求的信息。
6.数据压缩:
该技术是信息科学的关键技术及基础理论问题,同时也是建设数字图书馆系统的关键技术。压缩编码的理论基础是信息论。从信息论的角度看, 压缩就是去掉信息中的冗余,即保留不确定的信息,去除确定的信息(可推知的),也就是用一种更接近信息本质的描述来代替原有冗余的描述。编码方法可以分成三类:(1)考虑图像信源的统计特性。采用预测编码方法、变换编码方法、矢量量化编码方法、子带-小波编码法、神经网络编码法等。(2)考虑人眼视觉特性。采用基于方向滤波的图像编码法、基于图像轮廓-纹理的编码法。(3)考虑图像传递的景物特征采用分形编码方法、基于模型的编码方法。
7.网络:
在数字图书馆系统中,多媒体信息的存取、查询、检索和表现要求具有服务质量(qos)保证的通信网络。qos包括网络的吞吐量、带宽、允许的延迟、抖动和差错率等参数。设计一种综合的协议体系结构和高效、大容量、宽频带网络并从工程上实现满足qos要求的通信网络是建立数字图书馆系统的基础和关键。
⑤ 图像数据压缩的主要依据有哪些
虽然表示图像需要大量的数据,但图像数据是高度相关的,或者说存在冗余(Rendancy)信息,去掉这些冗余信息后可以有效压缩图像,同时又不会损害图像的有效信息。
数字图像的冗余表现为以下几种形式:空间冗余、时间冗余、视觉冗余、信息熵冗余、结构冗余和知识冗余。
(1)空间冗余:图像内部相邻像素之间存在较强的相关性所造成的冗余。
(2)时间冗余:视频图像序列中的不同帧之间的相关性所造成的冗余。
(3)视觉冗余:是指人眼不能感知或不敏感的那部分图像信息。
(4)信息熵冗余:也称编码冗余,如果图像中平均每个像素使用的比特数大于该图像的信息熵,则图像中存在冗余,这种冗余称为信息熵冗余。
(5)结构冗余:是指图像中存在很强的纹理结构或自相似性。
(6)知识冗余:是指有些图像还包含与某些先验知识有关的信息。
图像数据的这些冗余信息为图像压缩编码提供了依据。
例如,利用人眼对蓝光不敏感的视觉特性,在对彩色图像编码时,就可以用较低的精度对蓝色分量进行编码。图像编码的目的就是充分利用图像中存在的各种冗余信息,特别是空间冗余、时间冗余以及视觉冗余,以尽量少的比特数来表示图像。利用各种冗余信息,压缩编码技术能够很好地解决在将模拟信号转换为数字信号后所产生的带宽需求增加的问题,它是使数字信号走上实用化的关键技术之一。
⑥ 计算机中的音频和视频的编码方式
音频信号的编码方式大致分为三大类:
(1) 波形编码,如PCM、APC、SDC、ATC
(2) 分析合成方法,如LPC
(3) 混合编码方法
常用的编码方式是PCM——脉冲调制。脉冲编码调制(PCM)是把模拟信号变换为数字信号的一种调制方式,即把连续输入的模拟信号变换为在时域和振幅上都离散的量,然后将其转化为代码形式传输或存储。
音频信号压缩编码的主要依据是人耳的听觉特性,主要有两点:
1.人的听觉系统中存在一个听觉阈值电平,低于这个电平的声音信号人耳听不到 .
2.人的听觉存在屏蔽效应。当几个强弱不同的声音同时存在时,强声使弱声难以听到,并且两者之间的关系与其相对频率的大小有关 .
3.对声音波形采样后,相邻样值之间存在着很强的相关性。
声音编码算法就是通过这些特性来去掉更多的冗余数据,来达到压缩数据的目的。
视频信号的压缩与编码
采样、量化后的信号转换成数字符号才能进行传输,这一过程称为编码。
视频压缩编码的理论基础是信息论。信息压缩就是从时间域、空间域两方面去除冗余信息,将可推知的确定信息去掉。
视频编码技术主要包括MPEG与H.261标准,编码技术主要分成帧内编码和帧间编码。前者用于去掉图像的空间冗余信息,后者用于去除图像的时间冗余信息。
呃,还好以前的课件还留着,稍稍拷了点过来。。
⑦ 实现视频图像数据压缩的主要理论依据是什么
实现视频图像数据压缩的主要理论依据是香农提出的信息论。
随着计算机技术和网络通信技术的飞速发展,实时可视化通信、多媒体通信、网络电视、视频监控等业务越来越受到大家的关注。这样,图像压缩技术就成为急需解决的问题。
数字图像需要大量数据来表示,因此必须对其进行数据压缩,但在压缩的过程中,也会对传输介质、传输方法和存储介质等提出较高要求。常用的图像数据压缩方法主要有哈夫曼编码、行程编码、算术编码、离散余弦变换编码以及混合编码等。
图像压缩是图像存储、处理和传输的基础,它是用尽可能少的数据来进行图像的存储和传输。图像数据是可以被压缩的,支持这一理论的依据,允许图像编码有一定的失真;图像数据的冗余性。
大多数情况下,并不要求经压缩后的图像和原图完全相同,而允许有少量失真,只要这些失真不被人眼察觉就可以接受。这给压缩比的提高提供了有利的条件,可允许的失真愈多,可实现的压缩效率就愈高。
因为图像数据具有可压缩性,有大量的所谓统计性质的多余度,从而产生生理视觉上的多余度,去掉这部分图像数据并不影响视觉上的图像质量,甚至去掉一些图像细节对于实际图像的质量也无致命的影响。
⑧ 衡量数据压缩方法的指标有哪些
衡量数据压缩方法的指标:压缩比、速度、效果。
数据压缩是指在不丢失信息的前提下,缩减数据量以减少存储空间,提高其传输、存储和处理效率的一种技术方法。或按照一定的算法对数据进行重新组织,减少数据的冗余和存储的空间。数据压缩包括有损压缩和无损压缩。
数据压缩分为两类,有三种分法:
1、即时压缩和非即时压缩
即时压缩是将语音信号转化为数字信号,同时进行压缩,然后即时通过Internet传送出去。即时压缩一般应用在影像、声音数据的传送中。
非即时压缩是在需要的情况下才进行,没有即时性。非即时压缩一般不需要专门的设备,直接在计算机中安装并使用相应的压缩软件即可。
2、数字压缩和文件压缩
数字压缩是专指一些具有时间性的数据,这些数据常常是即时采集、即时处理或传输的。
文件压缩是专指对将要保存在磁盘等物理介质的数据进行压缩,如一篇文章数据、一段音乐数据、一段程序编码数据等的压缩。
3、无损压缩与有损压缩
无损压缩利用数据的统计冗余进行压缩,所以无损压缩的压缩比一般比较低。这类方法广泛应用于文本数据、程序和特殊应用场合的图像数据等需要精确存储数据的压缩。
有损压缩方法利用了人类视觉、听觉对图像、声音中的某些频率成分不敏感的特性,允许压缩的过程中损失一定的信息。有损压缩广泛应用于语音、图像和视频数据的压缩。
拓展资料:数据压缩的应用:
一种非常简单的压缩方法是行程长度编码,这种方法使用数据及数据长度这样简单的编码代替同样的连续数据,这是无损数据压缩的一个实例。这种方法经常用于办公计算机以更好地利用磁盘空间、或者更好地利用计算机网络中的带宽。对于电子表格、文本、可执行文件等这样的符号数据来说,无损是一个非常关键的要求,因为除了一些有限的情况,大多数情况下即使是一个数据位的变化都是无法接受的。
对于视频和音频数据,只要不损失数据的重要部分一定程度的质量下降是可以接受的。通过利用人类感知系统的局限,能够大幅度地节约存储空间并且得到的结果质量与原始数据质量相比并没有明显的差别。这些有损数据压缩方法通常需要在压缩速度、压缩数据大小以及质量损失这三者之间进行折中。
有损图像压缩用于数码相机中,大幅度地提高了存储能力,同时图像质量几乎没有降低。用于DVD的有损MPEG-2编解码视频压缩也实现了类似的功能。
在有损音频压缩中,心理声学的方法用来去除信号中听不见或者很难听见的成分。人类语音的压缩经常使用更加专业的技术,因此人们有时也将“语音压缩”或者“语音编码”作为一个独立的研究领域与“音频压缩”区分开来。不同的音频和语音压缩标准都属于音频编解码范畴。例如语音压缩用于因特网电话,而音频压缩被用于CD翻录并且使用MP3播放器解码。
理论压缩的理论基础是信息论(它与算法信息论密切相关)以及率失真理论,这个领域的研究工作主要是由Claude Shannon奠定的,他在二十世纪四十年代末期及五十年代早期发表了这方面的基础性的论文。Doyle和Carlson在2000年写道数据压缩“有所有的工程领域最简单、最优美的设计理论之一”。密码学与编码理论也是密切相关的学科,数据压缩的思想与统计推断也有很深的渊源。
许多无损数据压缩系统都可以看作是四步模型,有损数据压缩系统通常包含更多的步骤,例如它包括预测、频率变换以及量化。
⑨ 什么是计算机视频处理技术
视频处理技术
和一般的业务不同,视频是流特性业务,数据量很大。例如,数字电视图像中的SIF格式、NTSC制式、彩色、4∶4∶4采样,每帧的数据量为2028Kb,每秒的数据流量可达60.8Mb;CCIR格式、PAL制式、4∶4∶4采样的彩色视频的数据流量可达148.8Mbps。实验表明,176×144的YUV原始视频在10Mbps的LAN上传送速率是3帧/秒左右。可见,未压缩的视频在Internet上传输的效果是无法容忍的,而且会很容易地将Internet资源吞没,造成网络拥塞甚至崩溃。因此,IP视频通信的第一步就是视频压缩。
视频压缩编码的理论基础是信息论。压缩就是从时域、空域两方面去除冗余信息,即将可推知的确定信息去掉。编码方法大致可分为三类:
1.考虑到图像信源的统计特性采用的预测编码方法、变换编码方法、矢量量化编码方法、子带-小波编码方法及神经网络编码方法等;
2.考虑到视觉特性采用的基于方向滤波的图像编码方法、基于图像轮廓/纹理的编码方法;
3.考虑到图像传递的景物特征,采用的分形编码、基于模块的编码方法。
在IP视频通信应用中,编码方法的选择不但要考虑到压缩比、信噪比,还要考虑到算法的复杂性。太复杂的编码算法可能会产生较高的压缩比,但也会带来较大的计算开销,软件实现时会影响通信的实时性。目前,在众多视频编码算法中,影响最大并被广泛应用的算法是MPEG和H.26x。
※MPEG编码
MPEG是国际标准化组织ISO/IEC下的一个制定动态视频压缩编码标准的组织,它为视频压缩编码技术的标准化、实用化做出了巨大贡献。如针对CD-ROM的1.5Mbps传输率的MPEG-1、针对HDTV的6Mbps以上传输速率的MPEG-2都已成功地得到应用,并创造了巨大的商业价值。MPEG-4是针对视频会议、可视电话的甚低速率编码标准,它融入了基于内容的检索与编码,可对压缩数据内容直接访问;即将于2001年制定完毕的MPEG-7标准被称为"多媒体内容描述接口",这种标准化的描述可以加到任何类型的媒体信息上。不管视频信息的表达形式或压缩形式如何,具有这种标准化描述的多媒体数据均可被检索。因此,MPEG-7的应用领域主要是数字化图书馆和广播式媒体。
※H.263编码
H.261编码是一种帧间预测减少时域冗余、变换编码减少空域冗余的混合编码方法,具有压缩比高、算法复杂度低等优点,得到较为广泛的应用。Mbone的重要应用工具之一IVS的视频编码采用的就是H.261编码算法。在H.261的基础上,1996年ITU-T推出了H.263编码标准。H.263在许多方面对H.261进行了改进和扩充,如在编码算法复杂度增加很少的基础上,H.263能提供更好的图像质量、更低的速率,十分适合于IP视频会议、可视电话应用。目前,H.263编码是IP视频通信采用最多的一种编码方法,并已被许多多媒体通信终端标准所吸收, 如:ITU-TH.310(B-ISDN)、H.320(ISDN)、H.324(PSTN)、H.323(LAN、 WAN、Internet)。
随着计算机性能的快速提高,对于可视电话和视频会议等应用(一般使用QCIF图像),纯软件编码器(codec)即可以满足应用要求。我们实现的H.263纯软件编码器在主频为166MHz的主机上编码帧率可达60帧/秒以上,平均图像质量(用信噪比表示)大于38dB。
1998年ITU-T推出的H.263+是H.263建议的第二版,它提供了12个新的可协商模式和其他特征,进一步提高了压缩编码性能。如H.263只有5种视频源格式,H.263+允许使用更多的源格式,图像形状和时钟频率也有多种选择,拓宽了应用范围;另一重要的改进是可扩展性,它允许多显示率、多速率及多分辨率,增强了视频信息在易误码、易丢包异构网络环境下的传输。另外,H.263+的图像分段依赖性也可以是受限的,以减少差错传播。H.263+对H.263中的不受限运动矢量模式进行了改进,加上12个新增的可选模式,不仅提高了编码性能,而且增强了应用的灵活性
希望可以用到
⑩ 图像压缩原理
1、为什么要对图像数据进行压缩?其压缩原理是什么?
答:(1)数字图像如果不进行压缩,数据量是比较大的,例如一幅分辨率为1024×768的静态真彩色图像,其数据量为1024×768×24=2.25(MB)。这无疑对图像的存储、处理、传送带来很大的困难。事实上,在图像像素之间,无论在行方向还是列方向,都存在一定的相关性。也就是说,在一般图像中都存在很大的相关性,即冗余度。静态图像数据的冗余包括:空间冗余、时间冗余、结构冗余、知识冗余和视觉冗余、图像区域的相同性冗余、纹理的统计冗余等。图像压缩编码技术就是利用图像数据固有的冗余性和相干性,将一个大的图像数据文件转换为较小的同性质的文件。
(2)其压缩原理: 空间冗余、时间冗余、结构冗余、和视觉冗余。
2、图像压缩编码的目的是什么?目前有哪些编码方法?
答:(1)视频经过数字化处理后易于加密、抗干扰能力强、可再生中继等诸多优点,但是由于数字化的视频数据量十分巨大,不利于传输和存储。若不经压缩,数字视频传输所需的高传输率和数字视频存储所需的巨大容量,将成为推广数字电视视频通信的最大障碍,这就是进行视频压缩编码的目的。
(2)目前主要是预测编码,变换编码,和统计编码三种编码方法。
3、某信号源共有7个符号,概率分别为0.2,0.18,0.1,0.15,0.07,0.05,0.25,试进行霍夫曼编码,并解释是否进行了压缩,压缩比为多少?
0000 0001 000 00 111 110 10
0.05 0.07 0.1 0.2 0.18 0.15 0.25
0.05×4+0.07×4+0.1×3+0.2×2+0.18×3+0.15×3+0.25×2=2.67