函数是压缩的是什么意思_数据流压缩原理和数据压缩Zlib的实现

1. 数据流压缩原理和数据压缩Zlib的实现

压缩的本质就是去冗余，去除信息冗余，使用最短的编码保存最完整的数据信息。所以对于不同的场景，压缩采用的算法也因时制宜，比如视频和图片可以采用有损压缩，而文本数据采用无损压缩。压缩率又取决于信息的冗余度，也就是内容中重复的比例。那些均匀分布的随机字符串，压缩率会降到最低，即香农限

deflate是zip文件的默认算法。它更是一种数据流压缩算法。

LZ77压缩算法采用字典的方式进行压缩，是一种简单但是很高效的数据压缩算法。其方式就是把数据中一些可以组织成短语的字符加入字典。维护三个概念： 短语字典、滑动窗口、向前缓冲区

压缩的逆过程，通过解码标记和保持滑动窗口中的符号来更新解压数据。当解码字符被标记:将标记编码成字符拷贝到滑动窗口中，一步一步直到全部翻译完成

在流式传输中，不定长编码数据的解码想要保持唯一性，必须满足唯一可以码的条件。而异前缀码就是一种唯一可译码的候选，当然这样会增加编码的长度，却可以简化解码。

huffman编码是一种基于概率分布的贪心策略最优前缀码。huffman编码可以有效的压缩数据，压缩率取决于数据本身的信息冗余度

计算数据中各符号出现的概率，根据概率从小到大，从下往上反向构建构造码树，这样最终得到的编码的平均长度是最短的。同时也是唯一可译的

解读：在一开始，每一个字符已经按照出现概率的大小排好顺序，在后续的步骤中，每一次将概率最低的两棵树合并，然后用合并后的结果再次排序（为了找出最小的两棵树）。在gzip源码中并没有专门去排序，而是使用专门的数据结构（比如最小堆或者红黑树）。

使用优先队列实现huffman树，最后基于Huffman树最终实现文件压缩。
具体步骤：

gzip = gzip 头 + deflate 编码的实际内容 + gzip 尾

zlib = zlib 头 + deflate 编码的实际内容 + zlib 尾

压缩之前：初始化各种输入输出缓冲区；
压缩：我们可以不断往这些缓冲区中填充内容，然后由deflate函数进行压缩或者indeflate函数进行解压

总结：在调用deflate函数之前，应用程序必须保证至少一个动作被执行（avail_in或者avail_out被设置），用提供更多数据或者消耗更多的数据的方式。avail_out在函数调用之前千万不能为零。应用程序可以随时消耗被压缩的输出数据

热点内容

算法战书籍发布：2025-03-17 03:03:32 浏览：575

卸载网络服务器是什么意思发布：2025-03-17 03:03:29 浏览：123

菜鸟app的收货地址在哪里发布：2025-03-17 02:56:20 浏览：488

服务器配什么显卡发布：2025-03-17 02:53:24 浏览：369

动态壁纸不动了是怎么回事安卓发布：2025-03-17 02:53:18 浏览：412

申万宏源app哪里看总盈利发布：2025-03-17 02:53:17 浏览：133

单片机测电感电容发布：2025-03-17 02:19:05 浏览：165

android在子线程中更新ui 发布：2025-03-17 02:04:57 浏览：694

算法分析师面试有什么要求发布：2025-03-17 02:04:48 浏览：994

容器算法大全图解发布：2025-03-17 01:53:34 浏览：69

cad后置命令失效发布：2025-03-17 01:53:31 浏览：692

杀手阻击存档文件夹是哪一个发布：2025-03-17 01:53:26 浏览：212

禁书pdf 发布：2025-03-17 01:48:55 浏览：920

没用app语音智能提醒怎么设置发布：2025-03-17 01:24:29 浏览：502

linuxwiki安装发布：2025-03-17 01:21:59 浏览：680

隔墙算法发布：2025-03-17 01:16:47 浏览：174

安卓手机为什么app不通知发布：2025-03-17 01:13:22 浏览：550

申请云服务器购买费用发布：2025-03-17 01:02:29 浏览：115

云服务器镜像下载到本地发布：2025-03-17 01:01:06 浏览：4

电脑文件夹名有横杠发布：2025-03-17 00:44:18 浏览：154

函数是压缩的是什么意思