Lempel-Ziv压缩算法之原理
在LZ压缩算法的背后是使用RLE算法用先前出现的相同字节序列的引用来替代。
简单的讲,LZ算法被认为是字符串匹配的算法。例如:在一段文本中某字符串经常出现,并且可以通过前面文本中出现的字符串指针来表示。当然这个想法的前提是指针应该比字符串本身要短。
例如,在上一段短语“字符串”经常出现,可以将除第一个字符串之外的所有用第一个字符串引用来表示从而节省一些空间。
一个字符串引用通过下面的方式来表示:
1.唯一的标记
2.偏移数量
3.字符串长度
由编码的模式决定引用是一个固定的或变动的长度。后面的情况经常是首选,因为它允许编码器用引用的大小来交换字符串的大小(例如,如果字符串相当长,增加引用的长度可能是值得的)。
Lempel-Ziv压缩算法之实现
使用LZ77的一个问题是由于算法需要字符串匹配,对于每个输入流的单个字节,每个流中此字节前面的哪个字节都必须被作为字符串的开始从而尽可能的进行字符串匹配,这意味着算法非常慢。
另一个问题是为了最优化压缩而调整字符串引用的表示形式并不容易。例如,必须决定是否所有的引用和非压缩字节应该在压缩流中的字节边界发生。
基本压缩库使用一个清晰的实现来保证所有的符号和引用是字节对齐的,因此牺牲了压缩比率,并且字符串匹配程序并不是最优化的(没有缓存、历史缓冲区或提高速度的小技巧),这意味着程序非常慢。
另一方面,解压缩程序非常简单。
一个提高LZ77速度的试验已经进行了,这个试验中使用数组索引来加速字符串匹配的过程。然而,它还是比通常的压缩程序慢。
‘贰’ zip 的压缩原理与实现
文件压缩原理
我们使用计算机所做的事情大多都是对文件进行处理。每个文件都会占用一定的磁盘空间,我们希望一些文件,尤其是暂时不用但又比较重要不能删除的文件(如备份文件,有点像鸡肋呀),尽可能少的占用磁盘空间。但是,许多文件的存储格式是比较松散的,这样就浪费了一些宝贵的计算机存储资源。这时,我们可以借助压缩工具解决这个问题,通过对原来的文件进行压缩处理,使之用更少的磁盘空间保存起来,当需要使用时再进行解压缩操作,这样就大大节省了磁盘空间。当你要拷贝许多小文件时,通过压缩处理可以提高执行效率。如果小文件很多,操作系统要执行频繁的文件定位操作,需要花费很多的时间。如果先把这些小文件压缩,变成一个压缩文件后,再拷贝时就很方便了。由于计算机处理的信息是以二进制数的形式表示的,因此压缩软件就是把二进制信息中相同的字符串以特殊字符标记来达到压缩的目的。为了有助于理解文件压缩,请您在脑海里想象一幅蓝天白云的图片。对于成千上万单调重复的蓝色像点而言,与其一个一个定义“蓝、蓝、蓝……”长长的一串颜色,还不如告诉电脑:“从这个位置开始存储1117个蓝色像点”来得简洁,而且还能大大节约存储空间。这是一个非常简单的图像压缩的例子。其实,所有的计算机文件归根结底都是以“1”和“0”的形式存储的,和蓝色像点一样,只要通过合理的数学计算公式,文件的体积都能够被大大压缩以达到“数据无损稠密”的效果。总的来说,压缩可以分为有损和无损压缩两种。如果丢失个别的数据不会造成太大的影响,这时忽略它们是个好主意,这就是有损压缩。有损压缩广泛应用于动画、声音和图像文件中,典型的代表就是影碟文件格式mpeg、音乐文件格式mp3和图像文件格式jpg。但是更多情况下压缩数据必须准确无误,人们便设计出了无损压缩格式,比如常见的zip、rar等。压缩软件(compression software)自然就是利用压缩原理压缩数据的工具,压缩后所生成的文件称为压缩包(archive),体积只有原来的几分之一甚至更小。当然,压缩包已经是另一种文件格式了,如果你想使用其中的数据,首先得用压缩软件把数据还原,这个过程称作解压缩。常见的压缩软件有winzip、winrar等
‘叁’ 在.net中,我用AES加密方法对一串字符串进行了加密,得到了一串64位的新字符串,现在我想对这串64位的
首先,MD5不是用来压缩的,MD5值是用来作为message authentication code,本身是不可逆的。其实这也很容易理解,因为md5值只有128 bits,表示的值范围就在0~2^128这个区间内,而要做md5的数据是无穷的,也就是有无数的数据有相同的md5值,当然是不可能恢复原始数据了!
其次,用aes或者des或者任何安全的加密体制加密后得到的字符串,按照密码学安全性定义,应该是伪随机字符串,简单地说就是看起来和随机字符串没有什么区别,没有特殊结构,没有信息冗余,达不到这些要求,就不是一个安全的加密体制。而字符串压缩,就是要提取这种特殊结构或者信息冗余,既然不存在,字符串压缩算法根本不会起作用!这就是为什么平时你压缩文本文件时压缩比很大,因为文本冗余度非常高!而压缩可执行文件或者DLL时,压缩后大小几乎没怎么改观,因为随机程度很高,冗余度很小!
综上所述,用aes加密后的字符串,是不能再进行压缩的!希望我说得够清楚!
‘肆’ 如何将18位的身份证号码,加密压缩位5位的字符串
身份证号是由0至9和x组成的,总共11种可能,所以整个要有
11^18种(约5.559917313*10^18)
然后开5次方根,
大约5611,这就说明每一位至少要有5611种可能!
因为有18位,要变成5位,所以3.6位合一,怎么算呢?
如果开8次方根:220,也是不可以
而Ascii字符只有127个,Unicode虽然有很多但是不是键盘能敲出来的(比如很多汉字、韩文、日文等等,还有符号……)所以不能实现
我只能实现6位,不知可否?
请补充问题,我会作答