1. 压缩方法有哪些各有什么优缺点,压缩比是多少呢主要是在linux下代码压缩的rar或zip大部分都是win下
压缩比率很难说,未压缩数据的复杂程度会影响这个比率。
常见压缩算法按压缩比率由大到小排:
paq系 > lzma系 > rar > bzip2 > lz系(gz、zip) > lzo
paq相当费时而且耗内存,有点不值得使用;lzma是目前硬件水平可接受的高压缩比算法(7z就属于此类洐生品);rar没什么好说的,商业算法,我觉得比bzip2费时上还好点;lzo虽然压缩比率不那么历害,但高速、内存需求极少是其亮点,在需要实时压缩、解压的场合非常受欢迎,例如网络通迅、数据库。
linux中最常用tar.gz格式(winrar支持解压)。
命令通常是这样: tar czvf abc.tar.gz name1 name2 ...
解释一下参数czvf
c 建立
v 详细信息
f 输出文件,后面一定跟生成的压缩文件名。
z 用gz压缩
(其它压缩还有:
Z compress压缩,几乎没人用的老旧lz算法
j bzip2压缩
J xz压缩,lzma的改进算法
也可在最后加参数 --lzop 或 --lzip 或 --lzma)
生成tar.gz其实经过两个处理过程的,首先tar将所有文件的信息集合成一个无压缩的tar格式(无需写到磁盘),再用gz压缩算法处理(很像rar的solid选项)。这样的坏处是,如果你只要解压其中一个文件,解压时也要读取压缩文件前面很大部分内容。
2. 那位高人为我讲讲paq压缩算法小弟英语看不太明白谢谢了
PAQ
从维基网络,免费的网络全书
跳转到:导航、搜索
PAQ是一系列的开源的数据压缩archivers协同发展,通过对进化上的排行榜上,几个基准测量压缩率(尽管在昂贵的速度和内存使用)。在这个系列赛的最佳压缩PAQAR得到释放Ratushnyak 4.0亚历山大,2004年7月25日,2004年7月27日(更新数据,对大多数non-text)或PASqDa Skibinski由Przemyslaw发布4.1 2005年7月1日,为大学英语课文。在压缩标准是超越的模式,以WinRK PWCM马尔科姆·泰勒在2005年1月,释放。PWCM(PAQ加权背景混合)是一种独立开发实施PAQ闭源的算法。
算法。
使用一种混合算法PAQ语境。相关背景混在压缩机PPM分为预测和一个算术编码,但不同的是,next-symbol预测计算的概率使用重结合估计从大量的模型,在不同的语境制约。不像PPM,上下文不必相邻。大多数PAQ版本next-symbol收集统计下面的脉络。
n-grams。上下文是最后的n字节的符号(如前预测在PPM)。
整词n-grams,忽视情况,以及在文本文件的角色(有用。
“稀疏的“脉络,例如,第二和第四字节前预测的象征是很有用的二进制格式(一些)。
“模拟”的情境下,由高阶位前8或16位字(用于多媒体文件)。
两个空间的背景(用于图像、表格和表格)。一排排的长度是由寻找步频重复字节的模式。
尽管中会落在字节边界,其实是一种单尺茄一的比特预测的符号。在每一含困首个截然不同的语境中,两项良好,没有,是零,n1,比特数为1位。为了支持最近的历史,一半的数超过2被观察到的时候是相反的。举例来说,如果当前状态相关的背景是,n1)=(没有)和谈数1 12,3观察,然后是更新到(7,4)。
算术编码一点是与空间的比例,其可能性P(1)或P(0)= 1 - P(1)。这个概率加权计算出的数的0和1。
win0i S0 =∑
我
win1i∑S1)
我
S = S0 + S1)
警(0)= S0 /秒
警(1)= S1 /秒
在作业指导书的重量是我'th模型。在早期版本的PAQ囊中,固定在一个特别的方式。在以后的版本进行自适应调整的权重的方向,将减少未来的误差在相同的背景。如果位被编码是y,然后体重调节。
错=(P(1)−y)/(S0S1)。
作业指导书(wi,Sn1i + + n1i - S1(n0i)错了
PAQ推导
PAQ是自由软件的GNU通用公共授权。这使得其他作者用叉子把PAQ压缩引擎和添加新功能,如一个图形用户界面和更好的速度(在昂贵的压缩率)。最明显的PAQ-clones如下:
WinUDA 0.290,基于PAQ6但更快
UDA 0.300,基于PAQ8
PAQ6v2克格勃,基本上是用一个GUI(图形用户接口)
基于PAQ6 Emilcont
3. 数据压缩有没有可能发展到极限
压缩技术并未触及极限。以无损压缩为例,PAQ8PX的性能已实现显着压缩,源文件从2,351 KB减少到179 KB,仅是PAQ8PX中等压缩程度的结果。然而,尽管PAQ8PX展现出强大的压缩能力,其解压时间过长,有待进一步优化。如果解压时间能显着降低,这将是一次压缩算法的重大革新。想象一下,如果网络资源带宽平均减少一半,将带来多大的变化。无损压缩领域包括基于字典式压缩、基于熵的压缩、以及如RLE和PAQ等其他方法。每个方法都追求不同的目标,包括压缩比、性能以及两者之间的平衡。近年来,快速压缩技术如QuickLZ、Snappy、LZF和LZ4等的出现,进一步表明压缩技术仍有巨大的发展空间,极限远未达到。因此,现在谈论压缩技术的极限还为时过早。