压缩原理_文件压缩的原理是什么

‘壹’ 压缩的压缩原理

利用算法将文件有损或无损地处理，以达到保留最多文件信息，而令文件体积变小。压缩文件的基本原理是查找文件内的重复字节，并建立一个相同字节的"词典"文件，并用一个代码表示，比如在文件里有几处有一个相同的词"中华人民共和国"用一个代码表示并写入"词典"文件,这样就可以达到缩小文件的目的软件。由于计算机处理的信息是以二进制数的形式表示的，因此压缩软件就是把二进制信息中相同的字符串以特殊字符标记来达到压缩的目的。为了有助于理解文件压缩，请您在脑海里想象一幅蓝天白云的图片。对于成千上万单调重复的蓝色像点而言，与其一个一个定义“蓝、蓝、蓝……”长长的一串颜色，还不如告诉电脑：“从这个位置开始存储1117个蓝色像点”来得简洁，而且还能大大节约存储空间。这是一个非常简单的图像压缩的例子。其实，所有的计算机文件归根结底都是以“1”和“0”的形式存储的，和蓝色像点一样，只要通过合理的数学计算公式，文件的体积都能够被大大压缩以达到“数据无损稠密”的效果。总的来说，压缩可以分为有损和无损压缩两种。如果丢失个别的数据不会造成太大的影响，这时忽略它们是个好主意，这就是有损压缩。有损压缩广泛应用于动画、声音和图像文件中，典型的代表就是影碟文件格式mpeg、音乐文件格式mp3和图像文件格式jpg。但是更多情况下压缩数据必须准确无误，人们便设计出了无损压缩格式，比如常见的zip、rar等。压缩软件（compression software）自然就是利用压缩原理压缩数据的工具，压缩后所生成的文件称为压缩包（archive），体积只有原来的几分之一甚至更小。当然，压缩包已经是另一种文件格式了，如果你想使用其中的数据，首先得用压缩软件把数据还原，这个过程称作解压缩。常见的压缩软件有winzip、winrar等。

‘贰’ 压缩器的工作原理

压缩器(Compressor)的主要功能是衰减强度超过了给定门限的强信号，减小了信号的动态范同；而扩展器(Expander)则是衰减强度小于给定门限的弱信号，增加了信号的动态范围。显然这里压缩、扩展是对应信号的动态范围改变而言的，因此它们有时被称为“动态范围处理器”。 [2]
从本质上讲，压缩器(Compressor)是一种自动音量控制设备，能够减小声音的动态范围。在现有的录音棚中，压缩器几乎是必要没备。压缩器的面板上有几个重要的控制参数，其中之一是阀值。简单地说，阀值是允许用户自由指定的一个临界电平值，当输入电平高于这个值的时候，压缩器才开始工作。如果输入信号的电平低于阀值，那么压缩器就会自动停止。因此，这里传达出的一个重要信息就是压缩器并不是一直都处于工作状态的(特殊情况除外)。如果输入信号电平过低，将永远不会达到压缩阈值；如果输入信号电平过高，压缩器将严重制约信号的动态范围，影响声音在动态上的表现。压缩比决定压缩器的压缩强度，换句话说它代表的是压缩器将压低多少超过阀值的音频信号。例如，5：1的压缩比意味着，如果输人信号在当前的基础上增加到10倍．那么输出信号的电平相应地只增加到两倍。
另外两个重要的参数分别是建立时问和释放时问。建立时间指的是，当输人信号超过阈值后压缩器由启动到正常压缩状态所用的时间；释放时间指的是，当输人信号下降到阈值之下后压缩器由压缩状态恢复到不工作状态所需要的时间。释放时间是一个至关重要的参数，因为如果将释放时间设置得过大，就会产生泵音效应，尤其当前一个音较响而后一个音较弱时，这种现象尤为明显。

‘叁’ winrar的压缩原理

文件在硬盘中是以0和1的形式存储的。比如说一个文件的内容是11100000000...000001111(中间有一万个零)，你要完全写出来的话，会很长很长，但如果你写“111一万个零1111”来描述它，也能得到同样的信息，但却只有十一个字，这样就减小了文件体积。在具体应用中很少有这样的文件存在,那些文件都相当复杂,根据一定的数学算法,权衡把哪段字节用一个特定的更小字节代替，就可以实现数据最大程度的无损压缩.
.jpg.mp3等文件已经经过了编码压缩或者霍夫曼压缩，没有再压缩的潜力了。

‘肆’ 压缩文件的原理

大概是这样的
计算机都是2进制的
表示为00000111010
压缩就是把前面的00000
压缩
计为多少我忘记了
111也是这样的原理
老师给我们说的

‘伍’ 文件压缩的原理是什么

电脑里文件都是以二进制储存的。压缩原理就是通过特定的算法，将文件转化，而转化以后的文件占用的空间较小。

举个简单得例子（当然这个例子应该有点问题，但是能说明问题）：
原始文件：111110000001
算法：当连续同样的1或者0的个数超过5个，则将其转化成XX1或者XX0得形式；如果不超过5个，保持不变。XX是连续的1或者0的个数，如果连续数量较多，XX得位数可以增加。

于是11111可以表示成5个1，写成二进制就是1011；000000可以表示成6个0，写成二进制就是1100；而1保持不变。

这样，转化以后的文件就变成了101111001

可见，原始文件需要12个存储位置，而转化后的文件只需要9个存储位置。

当然，实际上压缩得算法多种多样，要比这个例子复杂的多。根据文件种类的不同压缩算法也经常不同。

‘陆’ 文件压缩软件的工作原理是什么

计算机处理的信息是以二进制数的形式表示的，因此压缩软件就是把二进制信息中相同的字符串以特殊字符标记来达到压缩的目的。为了有助于理解文件压缩，请您在脑海里想象一幅蓝天白云的图片。对于成千上万单调重复的蓝色像点而言，与其一个一个定义“蓝、蓝、蓝……”长长的一串颜色，还不如告诉电脑：“从这个位置开始存储1117个蓝色像点”来得简洁，而且还能大大节约存储空间。这是一个非常简单的图像压缩的例子。其实，所有的计算机文件归根结底都是以“1”和“0”的形式存储的，和蓝色像点一样，只要通过合理的数学计算公式，文件的体积都能够被大大压缩以达到“数据无损稠密”的效果。总的来说，压缩可以分为有损和无损压缩两种。如果丢失个别的数据不会造成太大的影响，这时忽略它们是个好主意，这就是有损压缩。有损压缩广泛应用于动画、声音和图像文件中，典型的代表就是影碟文件格式MPEG、音乐文件格式MP3和图像文件格式JPG。
压缩原理
很多人都惊异于压缩技术的神奇，一个文件被压缩成一半大小，何以能无损还原呢？
早期使用的压缩技术都基于统计模型，到20世纪80年代初基于字典压缩的新技术才慢慢推广开来。
数据压缩包含了非常多的软件和硬件技术，这些技术各不相同，但是大多数压缩软件都是基于LZ77、LZ88算法并加以修正而成，而LZ77是字典压缩的起源。大家都知道一个文本文件是由一些单词组成，而且必定有重复现象发生，例如我们这里经常出现的“压缩软件”一词，压缩的原理就是在文件的头部做一个类似字典的东西，把“压缩软件”这个词放在“字典”中，并为这个词指定一个占较少字节数的编码，而文章中的“压缩软件”一词均用此编码代替，以达到压缩的目的。当然压缩软件在实际运作中并非如此简单，还要使用一些看了就头痛的演算方法，在此就不一一细述。也许有人会问，文本文件可用字典技术，那其它文件怎么办呢。这就无须操心了，因为对于压缩软件来说，一个文件中的“数据压缩”一词和“@#￥%^”是一样的，关键在于冗余码(重复部分)的多少。
压缩常识
按压缩方式分:有所谓的“透明压缩”和“打包压缩”。
“透明压缩”一般针对.exe和.com文件，直接压缩。成功的话，文件体积变小，功能不变，运行速度还可能更快。但是，这种压缩方法的对象面很窄。如果压缩失败，还会造成文件不可用。所以，这一类程序总是强烈要求用户在压缩前将文件备份。
“打包压缩”就是现在常提到的压缩软件使用的压缩法。它把一个或多个文件压缩成一个文件——压缩包。要使用压缩后的文件，必须先解压将文件复原。它的特点是风险小，适用于减小不常用的文件所占空间和传输数据。当然，按照压缩算法，我们还可以将压缩分成很多种。
一般我们在谈到压缩时，会提到许多相关术语，下面我们就提出一些常见的术语进行解释。
压缩格式:压缩文件时使用的压缩编码方法不同，压缩生成的文件结构就不同，这种压缩文件结构就称压缩格式。
压缩比率:文件压缩后占用的磁盘空间与原文件的比率称压缩比率。在常用的压缩格式中，RAR格式压缩比率较高，ZIP格式较低。但ZIP格式的文件操作速度较快。
解压:将压缩文件还原为本来的文件格式，也称释放、扩展。
压缩包:一般将通用压缩格式的文件称为压缩包，如ZIP格式压缩文件。这种文件可以在压缩工具的管理下对包中压缩的文件进行管理，如查看、删除、添加等。
打包:将文件压缩成通用压缩格式的压缩包文件称为打包，也指将文件压缩添加到压缩包。
多卷压缩:将压缩的文件包分成几个压缩文件称为多卷压缩，一般是为了将压缩文件储存在多个软磁盘上或方便网上传输。
自解压文件:将文件压缩生成可执行的文件，然后在没有压缩工具的帮助下，通过执行压缩的文件，就可将自己的源文件解压还原出来。
压缩文件格式
目前流行着多种压缩文件格式，下面我们就来看看到底有哪些吧！
ZIP:目前最流行的压缩文件格式(在Internet上，ZIP文件已经取得了绝对胜利。在日常操作中，除专门的压缩软件之外，许多文件管理程序，如WindowsCommander等也都支持ZIP格式)。我们可利用WinZip对ZIP文件进行解压、释放等操作，还可以用它来处理ARJ、ARC、CAB、LZH等多种不同格式的压缩文件，从而大大地方便了用户的操作。
RAR:是一种高效快速的文件压缩格式，但不被大多数文件压缩程序支持，WinRAR是在Windows下处理RAR格式文件的最好工具。
ARJ:由DOS下曾经红极一时的压缩软件ARJ压缩而成的文件格式，它具有功能强大、压缩率高等优点。到了现在的Windows时代，它已经没有了往日的辉煌。
CAB:是Windows98新增的一种特殊压缩文件格式，主要用于对有关软件安装盘中的文件进行压缩，其特点是压缩率非常高(可能是目前最高的)，但一经压缩就不能再进行任何增加、删除、替换等修改，也就是说它的压缩包具有“只读”属性。我们也可使用WinZip对CAB压缩包进行操作。
??_:软件安装盘所采用的一种压缩文件方式，如*.ex_、*.dl_、*.d3_等，它们一般由系统直接解压并完成安装工作，无须用户操心。当然，我们也可使用DOS的EXPAND命令对*.??_文件进行释放操作。
UU/UUE:汉字编码方式，它们原本是Unix系统中使用的一种编码方式，后来被改写到DOS中，我们在传送中文邮件时只须事先使用该方式进行编码，此后就能顺利通过只能处理7位编码的邮件服务器，从而解决了汉字的传输问题。
ACE:一种新式的压缩程序，压缩比很高。
另外，MP3、MPEG、JPG等音频、视频、图像格式的文件也都采用了压缩技术，从理论上来说它们也应该算压缩文件，不过它们所采用的压缩方式并不相同，这里简单地介绍一下:
JPEG:JPEG全名为JointPhotographicExpertsGroup，它是一个在国际标准组织(ISO)下从事静态影像压缩标准制定的委员会。它制定出了第一套国标静态影像压缩标准:ISO10918-1就是我们俗称的JPEG了。由于JPEG优良的品质，使得它在短短的几年内就获得极大的成功，目前网站上80%的影像都是采用JPEG的压缩标准。
JPEG2000:正式名称为“ISO15444”，同样是由JPEG组织负责制定。JPEG2000与传统JPEG最大的不同，在于它放弃了JPEG所采用的以离散余弦转换为主的区块编码方式，而改以小波转换为主的多解析编码方式。其压缩率比JPEG高约30%左右，同时支持有损和无损压缩，无损压缩对保存一些重要图片十分有用。
MP3:这个大家应该都认识它了，MP3全称是MPEG1Layer3，是一种高性能的声音压缩编码方案，它可以做出超小“体积”的音乐文件，大小只是原始音频数据的1/10到1/12。但人耳听起来，效果却没有太大差异。它一出世就几乎占领了电脑音乐领域，由于MP3的出现，过去在因特网上半小时才能下载完的一首歌曲，现在以MP3格式仅需短短的几分钟就可以“搞定”。
MPEG:MPEG是MovingPicturesExpertsGroup(动态图像专家组)的缩写。
现在使用的有4个版本:MPEG-1、MPEG-2、MPEG-3、MPEG-4。

‘柒’ 压缩文件是什么原理

压缩的原理：计算机处理信息是以二进制数（0和1）的形式标示的，压缩软件把二进制信息中相同的字符串以特殊字符标记起来压缩的，从而实现缩小文件大小的。
文件的压缩比则根据文件的类型不同有所不同，比如文档类的文件压缩比很大（一个字或者一个词在同一个文件会反复出现），而图形图像的压缩比则比较小（每一个像素点的色素不同是常有的，不同颜色和颜色深浅、对比度的不同、亮度不同等的对应二进制代码是不同的）。
如果原文件被删掉了，只要将压缩文件解压就可以。
回答者

‘捌’ 压缩软件的原理是什么

计算机处理的信息是以二进制数的形式表示的，因此压缩软件就是把二进制信息中相同的字符串以特殊字符标记来达到压缩的目的。为了有助于理解文件压缩，请您在脑海里想象一幅蓝天白云的图片。对于成千上万单调重复的蓝色像点而言，与其一个一个定义“蓝、蓝、蓝……”长长的一串颜色，还不如告诉电脑：“从这个位置开始存储1117个蓝色像点”来得简洁，而且还能大大节约存储空间。这是一个非常简单的图像压缩的例子。其实，所有的计算机文件归根结底都是以“1”和“0”的形式存储的，和蓝色像点一样，只要通过合理的数学计算公式，文件的体积都能够被大大压缩以达到“数据无损稠密”的效果。总的来说，压缩可以分为有损和无损压缩两种。如果丢失个别的数据不会造成太大的影响，这时忽略它们是个好主意，这就是有损压缩。有损压缩广泛应用于动画、声音和图像文件中，典型的代表就是影碟文件格式MPEG、音乐文件格式MP3和图像文件格式JPG。

压缩原理
很多人都惊异于压缩技术的神奇，一个文件被压缩成一半大小，何以能无损还原呢？

早期使用的压缩技术都基于统计模型，到20世纪80年代初基于字典压缩的新技术才慢慢推广开来。

数据压缩包含了非常多的软件和硬件技术，这些技术各不相同，但是大多数压缩软件都是基于LZ77、LZ88算法并加以修正而成，而LZ77是字典压缩的起源。大家都知道一个文本文件是由一些单词组成，而且必定有重复现象发生，例如我们这里经常出现的“压缩软件”一词，压缩的原理就是在文件的头部做一个类似字典的东西，把“压缩软件”这个词放在“字典”中，并为这个词指定一个占较少字节数的编码，而文章中的“压缩软件” 一词均用此编码代替，以达到压缩的目的。当然压缩软件在实际运作中并非如此简单，还要使用一些看了就头痛的演算方法，在此就不一一细述。也许有人会问，文本文件可用字典技术，那其它文件怎么办呢。这就无须操心了，因为对于压缩软件来说，一个文件中的“数据压缩”一词和“@#￥%^” 是一样的，关键在于冗余码(重复部分)的多少。

压缩常识
按压缩方式分:有所谓的“透明压缩”和“打包压缩”。

“透明压缩”一般针对.exe和.com文件，直接压缩。成功的话，文件体积变小，功能不变，运行速度还可能更快。但是，这种压缩方法的对象面很窄。如果压缩失败，还会造成文件不可用。所以，这一类程序总是强烈要求用户在压缩前将文件备份。

“打包压缩”就是现在常提到的压缩软件使用的压缩法。它把一个或多个文件压缩成一个文件——压缩包。要使用压缩后的文件，必须先解压将文件复原。它的特点是风险小，适用于减小不常用的文件所占空间和传输数据。当然，按照压缩算法，我们还可以将压缩分成很多种。

一般我们在谈到压缩时，会提到许多相关术语，下面我们就提出一些常见的术语进行解释。

压缩格式:压缩文件时使用的压缩编码方法不同，压缩生成的文件结构就不同，这种压缩文件结构就称压缩格式。

压缩比率:文件压缩后占用的磁盘空间与原文件的比率称压缩比率。在常用的压缩格式中，RAR格式压缩比率较高，ZIP格式较低。但ZIP格式的文件操作速度较快。

解压:将压缩文件还原为本来的文件格式，也称释放、扩展。

压缩包:一般将通用压缩格式的文件称为压缩包，如ZIP格式压缩文件。这种文件可以在压缩工具的管理下对包中压缩的文件进行管理，如查看、删除、添加等。

打包:将文件压缩成通用压缩格式的压缩包文件称为打包，也指将文件压缩添加到压缩包。

多卷压缩:将压缩的文件包分成几个压缩文件称为多卷压缩，一般是为了将压缩文件储存在多个软磁盘上或方便网上传输。

自解压文件:将文件压缩生成可执行的文件，然后在没有压缩工具的帮助下，通过执行压缩的文件，就可将自己的源文件解压还原出来。

压缩文件格式
目前流行着多种压缩文件格式，下面我们就来看看到底有哪些吧！

ZIP:目前最流行的压缩文件格式(在Internet上，ZIP文件已经取得了绝对胜利。在日常操作中，除专门的压缩软件之外，许多文件管理程序，如Windows Commander等也都支持ZIP格式)。我们可利用WinZip对ZIP文件进行解压、释放等操作，还可以用它来处理ARJ、ARC、CAB、LZH等多种不同格式的压缩文件，从而大大地方便了用户的操作。

RAR:是一种高效快速的文件压缩格式，但不被大多数文件压缩程序支持，WinRAR是在Windows下处理RAR格式文件的最好工具。

ARJ:由DOS下曾经红极一时的压缩软件ARJ压缩而成的文件格式，它具有功能强大、压缩率高等优点。到了现在的Windows时代，它已经没有了往日的辉煌。

CAB:是Windows 98新增的一种特殊压缩文件格式，主要用于对有关软件安装盘中的文件进行压缩，其特点是压缩率非常高(可能是目前最高的)，但一经压缩就不能再进行任何增加、删除、替换等修改，也就是说它的压缩包具有“只读”属性。我们也可使用WinZip对CAB压缩包进行操作。

??_:软件安装盘所采用的一种压缩文件方式，如*.ex_、*.dl_、*.d3_等，它们一般由系统直接解压并完成安装工作，无须用户操心。当然，我们也可使用DOS的EXPAND命令对*.??_文件进行释放操作。

UU/UUE:汉字编码方式，它们原本是Unix系统中使用的一种编码方式，后来被改写到DOS中，我们在传送中文邮件时只须事先使用该方式进行编码，此后就能顺利通过只能处理7位编码的邮件服务器，从而解决了汉字的传输问题。

ACE:一种新式的压缩程序，压缩比很高。

另外，MP3、MPEG、JPG等音频、视频、图像格式的文件也都采用了压缩技术，从理论上来说它们也应该算压缩文件，不过它们所采用的压缩方式并不相同，这里简单地介绍一下:

JPEG:JPEG 全名为 Joint Photographic Experts Group，它是一个在国际标准组织(ISO)下从事静态影像压缩标准制定的委员会。它制定出了第一套国标静态影像压缩标准:ISO 10918-1 就是我们俗称的JPEG了。由于JPEG优良的品质，使得它在短短的几年内就获得极大的成功，目前网站上80%的影像都是采用JPEG的压缩标准。

JPEG 2000:正式名称为“ISO 15444”，同样是由JPEG 组织负责制定。JPEG 2000与传统 JPEG 最大的不同，在于它放弃了JPEG所采用的以离散余弦转换为主的区块编码方式，而改以小波转换为主的多解析编码方式。其压缩率比 JPEG高约30%左右，同时支持有损和无损压缩，无损压缩对保存一些重要图片十分有用。

MP3:这个大家应该都认识它了，MP3全称是MPEG 1 Layer 3，是一种高性能的声音压缩编码方案，它可以做出超小“体积”的音乐文件，大小只是原始音频数据的1/10到1/12。但人耳听起来，效果却没有太大差异。它一出世就几乎占领了电脑音乐领域，由于MP3的出现，过去在因特网上半小时才能下载完的一首歌曲，现在以MP3格式仅需短短的几分钟就可以“搞定”。

MPEG:MPEG是Moving Pictures Experts Group(动态图像专家组)的缩写。
现在使用的有4个版本:MPEG-1、MPEG-2、MPEG-3、MPEG-4。

导航:首页 > 文件处理 > 压缩原理

压缩原理

与压缩原理相关的资料