数据压缩的概念和目的_压缩算法原理

A. 请问压缩文件是起什么作用紧急！~

1、节省磁盘空间。

2、可以把多个文件压缩成一个压缩包，此功能在发送邮件时用出比较大，因为邮件附件多个文件通常要一个个的上传，把多个文件压缩成一个压缩包后就可以完成一次上传了。

3、可以把一个大文件分解压缩成多个小压缩包，此功能在文件拷贝中作用比较大。

(1)数据压缩的概念和目的扩展阅读：

压缩原理以及深层作用

把文件的二进制代码压缩，把相邻的0,1代码减少，比如有000000,可以把它变成6个0 的写法60,来减少该文件的空间。

由于计算机处理的信息是以二进制数的形式表示的，因此压缩软件就是把二进制信息中相同的字符串以特殊字符标记来达到压缩的目的。

为了有助于理解文件压缩，请在脑海里想象一幅蓝天白云的图片。对于成千上万单调重复的蓝色像点而言，与其一个一个定义“蓝、蓝、蓝……”长长的一串颜色，还不如告诉电脑：“从这个位置开始存储1117个蓝色像点”来得简洁，而且还能大大节约存储空间。这是一个非常简单的图像压缩的例子。

B. 图像压缩原理

1、为什么要对图像数据进行压缩？其压缩原理是什么？
答：（1）数字图像如果不进行压缩，数据量是比较大的，例如一幅分辨率为1024×768的静态真彩色图像，其数据量为1024×768×24=2.25（MB）。这无疑对图像的存储、处理、传送带来很大的困难。事实上，在图像像素之间，无论在行方向还是列方向，都存在一定的相关性。也就是说，在一般图像中都存在很大的相关性，即冗余度。静态图像数据的冗余包括：空间冗余、时间冗余、结构冗余、知识冗余和视觉冗余、图像区域的相同性冗余、纹理的统计冗余等。图像压缩编码技术就是利用图像数据固有的冗余性和相干性，将一个大的图像数据文件转换为较小的同性质的文件。
（2）其压缩原理: 空间冗余、时间冗余、结构冗余、和视觉冗余。
2、图像压缩编码的目的是什么？目前有哪些编码方法？
答：（1）视频经过数字化处理后易于加密、抗干扰能力强、可再生中继等诸多优点，但是由于数字化的视频数据量十分巨大，不利于传输和存储。若不经压缩，数字视频传输所需的高传输率和数字视频存储所需的巨大容量，将成为推广数字电视视频通信的最大障碍，这就是进行视频压缩编码的目的。
（2）目前主要是预测编码，变换编码，和统计编码三种编码方法。
3、某信号源共有7个符号，概率分别为0.2,0.18,0.1,0.15,0.07,0.05,0.25,试进行霍夫曼编码，并解释是否进行了压缩，压缩比为多少？

0000 0001 000 00 111 110 10
0.05 0.07 0.1 0.2 0.18 0.15 0.25
0.05×4＋0.07×4＋0.1×3＋0.2×2＋0.18×3＋0.15×3＋0.25×2=2.67

C. 文件压缩的概念是什么

一个较大的文件经压缩后，产生了另一个较小容量的文件。而这个较小容量的文件，我们就叫它是这些较大容量的（可能一个或一个以上的文件）的压缩文件。目前压缩技术可分为通用无损数据压缩与有损压缩两大类，但不管是采用何种技术模型，其本质内容都是一样的，即都是通过某种特殊的编码方式将数据信息中存在的重复度、冗余度有效地降低，从而达到数据压缩的目的。

D. 图像数据压缩的目的是什么

电脑里的数据压缩其实类似于美眉们的瘦身运动，不外有两大功用。第一，可以节省空间。拿瘦身美眉来说，要是八个美眉可以挤进一辆出租车里，那该有多省钱啊！第二，可以减少对带宽的占用。例如，我们都想在不到 100Kbps 的 GPRS 网上观看 DVD 大片，这就好比瘦身美眉们总希望用一尺布裁出七件吊带衫，前者有待于数据压缩技术的突破性进展，后者则取决于美眉们的恒心和毅力

E. 文件压缩的目的是什么目前常用的压缩软件有哪些其特点有何异同

压缩原理

计算机处理的信息是以二进制数的形式表示的，因此压缩软件就是把二进制信息中相同的字符串以特殊字符标记来达到压缩的目的。为了有助于理解文件压缩，请您在脑海里想象一幅蓝天白云的图片。对于成千上万单调重复的蓝色像点而言，与其一个一个定义“蓝、蓝、蓝……”长长的一串颜色，还不如告诉电脑：“从这个位置开始存储1117个蓝色像点”来得简洁，而且还能大大节约存储空间。这是一个非常简单的图像压缩的例子。其实，所有的计算机文件归根结底都是以“1”和“0”的形式存储的，和蓝色像点一样，只要通过合理的数学计算公式，文件的体积都能够被大大压缩以达到“数据无损稠密”的效果。总的来说，压缩可以分为有损和无损压缩两种。如果丢失个别的数据不会造成太大的影响，这时忽略它们是个好主意，这就是有损压缩。有损压缩广泛应用于动画、声音和图像文件中，典型的代表就是影碟文件格式MPEG、音乐文件格式MP3和图像文件格式JPG。

压缩原理
很多人都惊异于压缩技术的神奇，一个文件被压缩成一半大小，何以能无损还原呢？

早期使用的压缩技术都基于统计模型，到20世纪80年代初基于字典压缩的新技术才慢慢推广开来。

数据压缩包含了非常多的软件和硬件技术，这些技术各不相同，但是大多数压缩软件都是基于LZ77、LZ88算法并加以修正而成，而LZ77是字典压缩的起源。大家都知道一个文本文件是由一些单词组成，而且必定有重复现象发生，例如我们这里经常出现的“压缩软件”一词，压缩的原理就是在文件的头部做一个类似字典的东西，把“压缩软件”这个词放在“字典”中，并为这个词指定一个占较少字节数的编码，而文章中的“压缩软件” 一词均用此编码代替，以达到压缩的目的。当然压缩软件在实际运作中并非如此简单，还要使用一些看了就头痛的演算方法，在此就不一一细述。也许有人会问，文本文件可用字典技术，那其它文件怎么办呢。这就无须操心了，因为对于压缩软件来说，一个文件中的“数据压缩”一词和“@#￥%^” 是一样的，关键在于冗余码(重复部分)的多少。

压缩常识
按压缩方式分:有所谓的“透明压缩”和“打包压缩”。

“透明压缩”一般针对.exe和.com文件，直接压缩。成功的话，文件体积变小，功能不变，运行速度还可能更快。但是，这种压缩方法的对象面很窄。如果压缩失败，还会造成文件不可用。所以，这一类程序总是强烈要求用户在压缩前将文件备份。

“打包压缩”就是现在常提到的压缩软件使用的压缩法。它把一个或多个文件压缩成一个文件——压缩包。要使用压缩后的文件，必须先解压将文件复原。它的特点是风险小，适用于减小不常用的文件所占空间和传输数据。当然，按照压缩算法，我们还可以将压缩分成很多种。

一般我们在谈到压缩时，会提到许多相关术语，下面我们就提出一些常见的术语进行解释。

压缩格式:压缩文件时使用的压缩编码方法不同，压缩生成的文件结构就不同，这种压缩文件结构就称压缩格式。

压缩比率:文件压缩后占用的磁盘空间与原文件的比率称压缩比率。在常用的压缩格式中，RAR格式压缩比率较高，ZIP格式较低。但ZIP格式的文件操作速度较快。

解压:将压缩文件还原为本来的文件格式，也称释放、扩展。

压缩包:一般将通用压缩格式的文件称为压缩包，如ZIP格式压缩文件。这种文件可以在压缩工具的管理下对包中压缩的文件进行管理，如查看、删除、添加等。

打包:将文件压缩成通用压缩格式的压缩包文件称为打包，也指将文件压缩添加到压缩包。

多卷压缩:将压缩的文件包分成几个压缩文件称为多卷压缩，一般是为了将压缩文件储存在多个软磁盘上或方便网上传输。

自解压文件:将文件压缩生成可执行的文件，然后在没有压缩工具的帮助下，通过执行压缩的文件，就可将自己的源文件解压还原出来。

压缩文件格式
目前流行着多种压缩文件格式，下面我们就来看看到底有哪些吧！

ZIP:目前最流行的压缩文件格式(在Internet上，ZIP文件已经取得了绝对胜利。在日常操作中，除专门的压缩软件之外，许多文件管理程序，如Windows Commander等也都支持ZIP格式)。我们可利用WinZip对ZIP文件进行解压、释放等操作，还可以用它来处理ARJ、ARC、CAB、LZH等多种不同格式的压缩文件，从而大大地方便了用户的操作。

RAR:是一种高效快速的文件压缩格式，但不被大多数文件压缩程序支持，WinRAR是在Windows下处理RAR格式文件的最好工具。

ARJ:由DOS下曾经红极一时的压缩软件ARJ压缩而成的文件格式，它具有功能强大、压缩率高等优点。到了现在的Windows时代，它已经没有了往日的辉煌。

CAB:是Windows 98新增的一种特殊压缩文件格式，主要用于对有关软件安装盘中的文件进行压缩，其特点是压缩率非常高(可能是目前最高的)，但一经压缩就不能再进行任何增加、删除、替换等修改，也就是说它的压缩包具有“只读”属性。我们也可使用WinZip对CAB压缩包进行操作。

??_:软件安装盘所采用的一种压缩文件方式，如*.ex_、*.dl_、*.d3_等，它们一般由系统直接解压并完成安装工作，无须用户操心。当然，我们也可使用DOS的EXPAND命令对*.??_文件进行释放操作。

UU/UUE:汉字编码方式，它们原本是Unix系统中使用的一种编码方式，后来被改写到DOS中，我们在传送中文邮件时只须事先使用该方式进行编码，此后就能顺利通过只能处理7位编码的邮件服务器，从而解决了汉字的传输问题。

ACE:一种新式的压缩程序，压缩比很高。

另外，MP3、MPEG、JPG等音频、视频、图像格式的文件也都采用了压缩技术，从理论上来说它们也应该算压缩文件，不过它们所采用的压缩方式并不相同，这里简单地介绍一下:

JPEG:JPEG 全名为 Joint Photographic Experts Group，它是一个在国际标准组织(ISO)下从事静态影像压缩标准制定的委员会。它制定出了第一套国标静态影像压缩标准:ISO 10918-1 就是我们俗称的JPEG了。由于JPEG优良的品质，使得它在短短的几年内就获得极大的成功，目前网站上80%的影像都是采用JPEG的压缩标准。

JPEG 2000:正式名称为“ISO 15444”，同样是由JPEG 组织负责制定。JPEG 2000与传统 JPEG 最大的不同，在于它放弃了JPEG所采用的以离散余弦转换为主的区块编码方式，而改以小波转换为主的多解析编码方式。其压缩率比 JPEG高约30%左右，同时支持有损和无损压缩，无损压缩对保存一些重要图片十分有用。

MP3:这个大家应该都认识它了，MP3全称是MPEG 1 Layer 3，是一种高性能的声音压缩编码方案，它可以做出超小“体积”的音乐文件，大小只是原始音频数据的1/10到1/12。但人耳听起来，效果却没有太大差异。它一出世就几乎占领了电脑音乐领域，由于MP3的出现，过去在因特网上半小时才能下载完的一首歌曲，现在以MP3格式仅需短短的几分钟就可以“搞定”。

MPEG:MPEG是Moving Pictures Experts Group(动态图像专家组)的缩写。
现在使用的有4个版本:MPEG-1、MPEG-2、MPEG-3、MPEG-4。

压缩工具

WinRAR 3.6 beta 4 官方简体中文注册版

http://dll.51ct.cn/new/wrar36b4sc.Regged.exe

7-Zip v5.0 SP1 简体中文版‘号称有着现今最高压缩比的压缩软件’

http://dll.51ct.cn/soft/7z50%20PRO%20chs%20sp1.exe

7-Zip是一款号称有着现今最高压缩比的压缩软件，它不仅支持独有的7z文件格式，而且还支持各种其它压缩文件格式，其中包括ZIP, RAR, CAB, GZIP, BZIP2和TAR。此软件压缩的压缩比要比普通ZIP文件高30-50%。因此，它可以把经WinZip压缩的文件再压缩2-10%。

此5.0版本更加拥有强大的〈安装程序制作功能〉。经过全新编程。语言及界面更加友好!下载页面有详细介绍!并且此软件内已附带一款精美的《一键通档案》。它可以说明一切问题!

UHARC GUI v3.06 绿色修正汉化版‘世界上压缩比最高的软件’

http://soft.51ct.cn:81//soft/ha_uharcgui306_cnnnc.zip

称得上是世界上压缩比最高的软件。我压Longhorn4008+Longhorn4015(差不多1.15G),压缩后大小为698Mb！几乎减掉了一半，文件越大压缩比越高

UHARC GUI 称得上是世界上压缩比最高的软件，他的超强压缩比可以让RAR,7Z 汗颜，支持创建自解压缩包。

安装说明：直接安装即可。

汉化说明：
此汉化版完全汉化了 UHARC GUI 还汉化 UHARC_04 UHARC_06 NSIS 的提示信息，现在创建的自解压缩包为中文。

F. 数字图像的无损压缩是指

答案是A，解压后重建的图像与原始图像完全相同。

虽然不能完全恢复原始数据，但是所损失的部分对理解原始图像的影响缩小，却换来了大得多的压缩比，即指使用压缩后的数据进行重构，重构后的数据与原来的数据有所不同，但不影响人对原始资料表达的信息造成误解。有损压缩适用于重构信号不一定非要和原始信号完全相同的场合。

图像和声音的压缩（因为其中包含的数据往往多于我们的视觉系统和听党系统所能接收的信息，丢掉一些数据而不至于对声音或者图像所表达的意思产生误解但可大大提高压缩比）。有损压缩广泛应用于语音，图像和视频数据的压缩。

2、无损压缩格式则是利用数据的统计冗余进行压缩，可完全恢复原始数据而不引起任何失真，但压缩率是受到数据统计冗余度的理论限制，一般为2:1到5:1。

这类方法广泛用于文本数据，程序和特殊应用场合的图像数据（如指纹图像，医学图像等）的压缩。即指使用压缩后的数据进行重构（或者叫做还原，解压缩），重构后的数据与原来的数据完全相同;无损压缩用于要求重构的信号与原始信号完全致的场合。

G. 压缩算法原理

哈夫曼
哈夫曼编码是无损压缩当中最好的方法。它使用预先二进制描述来替换每个符号，长度由特殊符号出现的频率决定。常见的符号需要很少的位来表示，而不常见的符号需要很多为来表示。

哈夫曼算法在改变任何符号二进制编码引起少量密集表现方面是最佳的。然而，它并不处理符号的顺序和重复或序号的序列。

2.1 原理
我不打算探究哈夫曼编码的所有实际的细节，但基本的原理是为每个符号找到新的二进制表示，从而通常符号使用很少的位，不常见的符号使用较多的位。

简短的说，这个问题的解决方案是为了查找每个符号的通用程度，我们建立一个未压缩数据的柱状图；通过递归拆分这个柱状图为两部分来创建一个二叉树，每个递归的一半应该和另一半具有同样的权（权是 ∑ N K =1 符号数 k , N 是分之中符号的数量，符号数 k 是符号 k出现的次数）

这棵树有两个目的：

1．编码器使用这棵树来找到每个符号最优的表示方法

2．解码器使用这棵树唯一的标识在压缩流中每个编码的开始和结束，其通过在读压缩数据位的时候自顶向底的遍历树，选择基于数据流中的每个独立位的分支，一旦一个到达叶子节点，解码器知道一个完整的编码已经读出来了。

压缩后的数据流是 24 位（三个字节），原来是 80 位（ 10 个字节）。当然，我应该存储哈夫曼树，这样解码器就能够解码出对应的压缩流了，这就使得该例子中的真正数据流比输入的流数据量大。这是相对较短的数据上的副作用。对于大数据量来说，上面的哈夫曼树就不占太多比例了。

解码的时候，从上到下遍历树，为压缩的流选择从左 / 右分支，每次碰到一个叶子节点的时候，就可以将对应的字节写到解压输出流中，然后再从根开始遍历。

2.2 实现
哈夫曼编码器可以在基本压缩库中找到，其是非常直接的实现。

这个实现的基本缺陷是：

1．慢位流实现

2．相当慢的解码（比编码慢）

3．最大的树深度是 32 （编码器在任何超过 32 位大小的时候退出）。如果我不是搞错的话，这是不可能的，除非输出的数据大于 2 32字节。

另一方面，这个实现有几个优点：

1．哈夫曼树以一个紧密的形式每个符号要求 12 位（对于 8 位的符号）的方式存储，这意味着最大的头为 384 。

2．编码相当容易理解

哈夫曼编码在数据有噪音的情况（不是有规律的，例如 RLE ）下非常好，这中情况下大多数基于字典方式的编码器都有问题。

H. 利用因特网传输文件前,将文件进行压缩的目的是

利用因特网传输文件前，将文件进行压缩的目的是文件变小，传得快。

互联网络上大家常用的FTP文件服务器上的文件大多属于压缩文件，文件下载后必须先解压缩才能够使用；另外在使用电子邮件附加文件功能的时候，最好也能事先对附加文件进行压缩处理。

但不管是采用何种技术模型，其本质内容都是一样的，即都是通过某种特殊的编码方式将数据信息中存在的重复度、冗余度有效地降低，从而达到数据压缩的目的。

(8)数据压缩的概念和目的扩展阅读：

在进行数据备份或大文件交换时，通常采取用压缩软件分卷压缩到软盘上的办法，而在复原的时候则需要用到该压缩软件，否则这些压缩文件便无法复原。WinRAR开了生成分卷自解压文件的先河，制作的分卷压缩文件，离开WinRAR照用不误！

WinRAR提供了将扩展名为.rar的压缩包文件转换为.exe文件功能(也就是创建自解压文件)，使用该功能，可以方便地将以前创建的普通压缩格式转换为自解压文件，这样一来就为用户进行软件的解压缩提供了极大的方便。

I. 压缩文件的目的

还有个因素就是很多的传送文件都是支持rar格式，所以必须要压缩的

J. 图像压缩的图像压缩原理

1.图像压缩的概念
减少表示数字图像时需要的数据量
2.图像压缩的基本原理
图像数据之所以能被压缩，就是因为数据中存在着冗余。图像数据的冗余主要表现为：图像中相邻像素间的相关性引起的空间冗余；图像序列中不同帧之间存在相关性引起的时间冗余；不同彩色平面或频谱带的相关性引起的频谱冗余。数据压缩的目的就是通过去除这些数据冗余来减少表示数据所需的比特数。由于图像数据量的庞大,在存储、传输、处理时非常困难,因此图像数据的压缩就显得非常重要。
信息时代带来了“信息爆炸”，使数据量大增，因此，无论传输或存储都需要对数据进行有效的压缩。在遥感技术中，各种航天探测器采用压缩编码技术，将获取的巨大信息送回地面。
图像压缩是数据压缩技术在数字图像上的应用，它的目的是减少图像数据中的冗余信息从而用更加高效的格式存储和传输数据。
3。图像压缩基本方法
图像压缩可以是有损数据压缩也可以是无损数据压缩。对于如绘制的技术图、图表或者漫画优先使用无损压缩，这是因为有损压缩方法，尤其是在低的位速条件下将会带来压缩失真。如医疗图像或者用于存档的扫描图像等这些有价值的内容的压缩也尽量选择无损压缩方法。有损方法非常适合于自然的图像，例如一些应用中图像的微小损失是可以接受的（有时是无法感知的），这样就可以大幅度地减小位速。
无损图像压缩方法有：
行程长度编码
熵编码法
如 LZW 这样的自适应字典算法
有损压缩方法有：
将色彩空间化减到图像中常用的颜色。所选择的颜色定义在压缩图像头的调色板中，图像中的每个像素都用调色板中颜色索引表示。这种方法可以与抖动(en:dithering)一起使用以模糊颜色边界。
色度抽样，这利用了人眼对于亮度变化的敏感性远大于颜色变化，这样就可以将图像中的颜色信息减少一半甚至更多。
变换编码，这是最常用的方法。首先使用如离散余弦变换（DCT）或者小波变换这样的傅立叶相关变换，然后进行量化和用熵编码法压缩。
分形压缩（en:Fractal compression）。
4.图像压缩的主要目标就是在给定位速（bit-rate）或者压缩比下实现最好的图像质量。但是，还有一些其它的图像压缩机制的重要特性：
可扩展编码 (en:Scalability) 通常表示操作位流和文件产生的质量下降（没有解压缩和再压缩）。可扩展编码的其它一些叫法有渐进编码（en:progressive coding）或者嵌入式位流（en:embedded bitstreams）。尽管具有不同的特性，在无损编码中也有可扩展编码，它通常是使用粗糙到精细像素扫描的格式。尤其是在下载时预览图像（如浏览器中）或者提供不同的图像质量访问时（如在数据库中）可扩展编码非常有用有几种不同类型的可扩展性：
质量渐进（en:Quality progressive）或者层渐进（en:layer progressive）：位流渐进更新重建的图像。
分辨率渐进（en:Resolution progressive）：首先在低分辨率编码图像，然后编码与高分辨率之间的差别。
成分渐进（en:Component progressive）：首先编码灰度数据，然后编码彩色数据。
感兴趣区域编码，图像某些部分的编码质量要高于其它部分，这种方法可以与可扩展编码组合在一起（首先编码这些部分，然后编码其它部分）。
元数据信息，压缩数据可以包含关于图像的信息用来分类、查询或者浏览图像。这些信息可以包括颜色、纹理统计信息、小预览图像以及作者和版权信息。
5.图像压缩目前的标准
经典的视频压缩算法已渐形成一系列的国际标准体系，如H.26x系列建议，H.320系列建议以及MPEG系列建议等。
6.图像压缩效果的评估
压缩方法的质量经常使用峰值信噪比来衡量，峰值信噪比用来表示图象有损压缩带来的噪声。但是，观察者的主观判断也认为是一个重要的、或许是最重要的衡量标准。

导航:首页 > 文件处理 > 数据压缩的概念和目的

数据压缩的概念和目的

与数据压缩的概念和目的相关的资料