霍夫曼编码图像压缩_图像压缩原理

‘壹’ 如何计算Huffman编码的编码效率和压缩比

赫夫曼编码的具体方法：先按出现的概率大小排队，把两个最小的概率相加，作为新的概率和剩余的概率重新排队，再把最小的两个概率相加，再重新排队，直到最后变成1。每次相加时都将“0”和“1”赋与相加的两个概率，读出时由该符号开始一直走到最后的“1”，将路线上所遇到的“0”和“1”按最低位到最高位的顺序排好，就是该符号的赫夫曼编码。

例如a7从左至右，由U至U″″，其码字为1000；

a6按路线将所遇到的“0”和“1”按最低位到最高位的顺序排好，其码字为1001…

用赫夫曼编码所得的平均比特率为：Σ码长×出现概率

上例为：0.2×2+0.19×2+0.18×3+0.17×3+0.15×3+0.1×4+0.01×4=2.72 bit

可以算出本例的信源熵为2.61bit，二者已经是很接近了。

哈夫曼编码进行压缩的压缩率是根据平均码长来计算的，压缩率比较低。例如：用三位二进行数进行的等长编码平均长度为3，而根据哈夫曼树编码的平均码长为：

4*0.07+2*0.19+5*0.02+4*0.06+2*0.32+5*0.03+2*0.21+4*0.10=2.61

2.61/3=0.87=87%

其平均码长是等长码的87%，所以平均压缩率为13%。

(1)霍夫曼编码图像压缩扩展阅读：

霍夫曼编码的基本方法先对图像数据扫描一遍，计算出各种像素出现的概率，按概率的大小指定不同长度的唯一码字，由此得到一张该图像的霍夫曼码表。编码后的图像数据记录的是每个像素的码字，而码字与实际像素值的对应关系记录在码表中。

赫夫曼编码是可变字长编码(VLC)的一种。 Huffman于1952年提出一种编码方法，该方法完全依据字符出现概率来构造异字头的平均长度最短的码字，有时称之为最佳编码，一般就称Huffman编码。下面引证一个定理，该定理保证了按字符出现概率分配码长，可使平均码长最短。

‘贰’ 对图像进行霍夫曼编码压缩后如何输出压缩后图像

压缩后的图像就是哈夫曼编码后的01比特流

‘叁’ “RLE适用于图形压缩，霍夫曼编码适用于文本压缩”这句话对吗

错误，RLE适用于文本和图像

‘肆’ 对灰度图像进行霍夫曼编码，用Matlab怎么操作

给你一段程序,自己研究下吧!

clc
clear
close all;
%定义HufData/Len为全局变量的结构体
global HufData;
global Len
disp('计算机正在准备输出哈夫曼编码结果,请耐心等待……');
%原始码字的灰度
a=imread('kids.tif');

%分区画出原始图像和灰度直方图
figure;
subplot(1,2,1)
imshow(a);
%取消坐标轴和边框
axis off
box off
title('MATLAB自带图像','fontsize',13);
subplot(1,2,2);
axis off
box off
imhist(a);
title('图像灰度直方图','fontsize',13);
%图像的灰度统计
GrayStatistics=imhist(a);
GrayStatistics=GrayStatistics';
GrayRatioo=GrayStatistics/sum(GrayStatistics);
GrayRatioNO=find(GrayRatioo~=0);
Len=length(GrayRatioNO);
%初始化灰度集，防止系统随即赋予其垃圾值
GrayRatio=ones(1,Len);

for i=1:Len
GrayRatio(i)=GrayRatioo(i);
end

GrayRatio=abs(sort(-GrayRatio));
%将图像灰度概率赋予结构体
for i=1:Len
HufData(i).value=GrayRatio(i);
end

% 哈夫曼编码/霍夫曼编码
HuffmanCode(Len);
%输出码字

zippedHuffman=1;
for i=1:Len
tmpData=HufData(i).code;
str='';
for j=1:length(tmpData)
str=strcat(str,num2str(tmpData(j)));
zippedHuffman=zippedHuffman+1;
end
disp(strcat('a',num2str(i),'= ',str))
end
i;
%计算计算机一共输出多少个哈夫曼编码/霍夫曼编码
zippedHuffman;
%计算在删去0灰度级压缩之前的原始图像字节容量
unzipped_delete=i*8;

%计算压缩比率
ratio_delete=zippedHuffman/unzipped_delete;

%计算图像的压缩比率
ad=num2str(ratio_delete*100);
str2=strcat(ad,'%');
disp(strcat('哈夫曼编码压缩比率','= ',str2))

%子程序：哈夫曼编码/霍夫曼编码函数HuffmanCode.m
function HuffmanCode(OriginSize)
global HufData;
global Len
for i=1:Len
%%霍夫曼编码树左边纪录为1
HufData(i).left=1;
%%霍夫曼编码树右边纪录为0
HufData(i).right=0;
%%输出码初始化为0
HufData(i).code=[];
%%排序列表初始化
SortList(i).symbol=i;
SortList(i).value=HufData(i).value;
end
%初始化原始消息数目
newsymbol=OriginSize;
for n=OriginSize:-1:2
%将N个消息进行排序
SortList=sortdata(SortList,n);
%将最后两个出现概率最小的消息合成一个消息
newsymbol=newsymbol+1;
HufData(newsymbol).value=SortList(n-1).value+SortList(n).value;
HufData(newsymbol).left=SortList(n-1).symbol;
HufData(newsymbol).right=SortList(n).symbol;
%将消息添加到列队的最后，为N-1个消息重新排序作好准备
SortList(n-1).symbol=newsymbol;
SortList(n-1).value=HufData(newsymbol).value;
end
%遍历霍夫曼树，获得霍夫曼编码/哈夫曼编码
visit(newsymbol,Len,[]);
end

%子程序：冒泡排序法函数sortdata.m
function reData=sortdata(SortList,n)
%根据消息概率进行排序
for k=n:-1:2
for j=1:k-1
min=SortList(j).value;
sbl=SortList(j).symbol;
if(min<SortList(j+1).value)
SortList(j).value=SortList(j+1).value;
SortList(j+1).value=min;
SortList(j).symbol=SortList(j+1).symbol;
SortList(j+1).symbol=sbl;
end
end
end
reData=SortList;
end

%子程序：遍历哈夫曼编码/霍夫曼编码树搜索函数visit.m
function visit(node,n,ocode)
global HufData
if node<=n
%如果没有哈夫曼编码/霍夫曼编码树的子接点直接输出原始码，这里为空码（[]）
HufData(node).code=ocode;
else
if(HufData(node).left>0)
%遍历左分支接点输出1，这里采用子函数嵌套调用
ocode1=[ocode 1];
visit(HufData(node).left,n,ocode1);
end
if(HufData(node).right>0)
%遍历右分支接点输出0，这里采用子函数嵌套调用
ocode2=[ocode 0];
visit(HufData(node).right,n,ocode2);
end
end
end

‘伍’ 图像压缩原理

1、为什么要对图像数据进行压缩？其压缩原理是什么？
答：（1）数字图像如果不进行压缩，数据量是比较大的，例如一幅分辨率为1024×768的静态真彩色图像，其数据量为1024×768×24=2.25（MB）。这无疑对图像的存储、处理、传送带来很大的困难。事实上，在图像像素之间，无论在行方向还是列方向，都存在一定的相关性。也就是说，在一般图像中都存在很大的相关性，即冗余度。静态图像数据的冗余包括：空间冗余、时间冗余、结构冗余、知识冗余和视觉冗余、图像区域的相同性冗余、纹理的统计冗余等。图像压缩编码技术就是利用图像数据固有的冗余性和相干性，将一个大的图像数据文件转换为较小的同性质的文件。
（2）其压缩原理: 空间冗余、时间冗余、结构冗余、和视觉冗余。
2、图像压缩编码的目的是什么？目前有哪些编码方法？
答：（1）视频经过数字化处理后易于加密、抗干扰能力强、可再生中继等诸多优点，但是由于数字化的视频数据量十分巨大，不利于传输和存储。若不经压缩，数字视频传输所需的高传输率和数字视频存储所需的巨大容量，将成为推广数字电视视频通信的最大障碍，这就是进行视频压缩编码的目的。
（2）目前主要是预测编码，变换编码，和统计编码三种编码方法。
3、某信号源共有7个符号，概率分别为0.2,0.18,0.1,0.15,0.07,0.05,0.25,试进行霍夫曼编码，并解释是否进行了压缩，压缩比为多少？

0000 0001 000 00 111 110 10
0.05 0.07 0.1 0.2 0.18 0.15 0.25
0.05×4＋0.07×4＋0.1×3＋0.2×2＋0.18×3＋0.15×3＋0.25×2=2.67

‘陆’ jpeg图片压缩的原理（谈谈怎么个压缩法怎么个有损法）

JPEG压缩过程

JPEG压缩分四个步骤实现：
1.颜色模式转换及采样；
2.DCT变换；
3.量化；
4.编码。
二.
1．颜色模式转换及采样 RGB色彩系统是我们最常用的表示颜色的方式。JPEG采用的是YCbCr色彩系统。想要用JPEG基本压缩法处理全彩色图像，得先把RGB颜色模式图像数据，转换为YCbCr颜色模式的数据。Y代表亮度，Cb和Cr则代表色度、饱和度。通过下列计算公式可完成数据转换。 Y=0.2990R+0.5870G+0.1140B Cb=-0.1687R-0.3313G+0.5000B+128 Cr=0.5000R-0.4187G-0.0813B＋128 人类的眼晴对低频的数据比对高频的数据具有更高的敏感度，事实上，人类的眼睛对亮度的改变也比对色彩的改变要敏感得多，也就是说Y成份的数据是比较重要的。既然Cb成份和Cr成份的数据比较相对不重要，就可以只取部分数据来处理。以增加压缩的比例。JPEG通常有两种采样方式：YUV411和YUV422，它们所代表的意义是Y、Cb和Cr三个成份的数据取样比例。
2.DCT变换 DCT变换的全称是离散余弦变换(Discrete Cosine Transform)，是指将一组光强数据转换成频率数据，以便得知强度变化的情形。若对高频的数据做些修饰，再转回原来形式的数据时，显然与原始数据有些差异，但是人类的眼睛却是不容易辨认出来。压缩时，将原始图像数据分成8*8数据单元矩阵，例如亮度值的第一个矩阵内容如下：
JPEG将整个亮度矩阵与色度Cb矩阵，饱和度Cr矩阵，视为一个基本单元称作MCU。每个MCU所包含的矩阵数量不得超过10个。例如，行和列采样的比例皆为4:2:2，则每个MCU将包含四个亮度矩阵，一个色度矩阵及一个饱和度矩阵。当图像数据分成一个8*8矩阵后，还必须将每个数值减去128，然后一一代入DCT变换公式中，即可达到DCT变换的目的。图像数据值必须减去128，是因为DCT转换公式所接受的数字范围是在-128到+127之间。 DCT变换公式：
x,y代表图像数据矩阵内某个数值的坐标位置f(x,y)代表图像数据矩阵内的数个数值u,v代表DCT变换后矩阵内某个数值的坐标位置F(u,v)代表DCT变换后矩阵内的某个数值 u=0 且 v=0 c(u)c(v)=1/1.414 u>0 或 v>0 c(u)c(v)=1 经过DCT变换后的矩阵数据自然数为频率系数，这些系数以F（0，0）的值最大，称为DC，其余的63个频率系数则多半是一些接近于0的正负浮点数，一概称之为AC。
3、量化图像数据转换为频率系数后，还得接受一项量化程序，才能进入编码阶段。量化阶段需要两个8*8矩阵数据，一个是专门处理亮度的频率系数，另一个则是针对色度的频率系数，将频率系数除以量化矩阵的值，取得与商数最近的整数，即完成量化。当频率系数经过量化后，将频率系数由浮点数转变为整数，这才便于执行最后的编码。不过，经过量化阶段后，所有数据只保留整数近似值，也就再度损失了一些数据内容，JPEG提供的量化表如下：

4、编码 Huffman编码无专利权问题，成为JPEG最常用的编码方式，Huffman编码通常是以完整的MCU来进行的。编码时，每个矩阵数据的DC值与63个AC值，将分别使用不同的Huffman编码表，而亮度与色度也需要不同的Huffman编码表，所以一共需要四个编码表，才能顺利地完成JPEG编码工作。 DC编码 DC是彩采用差值脉冲编码调制的差值编码法，也就是在同一个图像分量中取得每个DC值与前一个DC值的差值来编码。DC采用差值脉冲编码的主要原因是由于在连续色调的图像中，其差值多半比原值小，对差值进行编码所需的位数，会比对原值进行编码所需的位数少许多。例如差值为5，它的二进制表示值为101，如果差值为-5，则先改为正整数5，再将其二进制转换成1的补数即可。所谓1的补数，就是将每个Bit若值为0，便改成1；Bit为1，则变成0。差值5应保留的位数为3，下表即列出差值所应保留的Bit数与差值内容的对照。
在差值前端另外加入一些差值的霍夫曼码值，例如亮度差值为5（101）的位数为3，则霍夫曼码值应该是100，两者连接在一起即为100101。下列两份表格分别是亮度和色度DC差值的编码表。根据这两份表格内容，即可为DC差值加上霍夫曼码值，完成DC的编码工作。
AC编码 AC编码方式与DC略有不同，在AC编码之前，首先得将63个AC值按Zig-zag排序，即按照下图箭头所指示的顺序串联起来。
63个AC值排列好的，将AC系数转换成中间符号，中间符号表示为RRRR/SSSS，RRRR是指第非零的AC之前，其值为0的AC个数，SSSS是指AC值所需的位数，AC系数的范围与SSSS的对应关系与DC差值Bits数与差值内容对照表相似。如果连续为0的AC个数大于15，则用15/0来表示连续的16个0，15/0称为ZRL（Zero Rum Length），而（0/0）称为EOB（Enel of Block）用来表示其后所剩余的AC系数皆等于0，以中间符号值作为索引值，从相应的AC编码表中找出适当的霍夫曼码值，再与AC值相连即可。例如某一组亮度的中间符为5/3，AC值为4，首先以5/3为索引值，从亮度AC的Huffman编码表中找到1111111110011110霍夫曼码值，于是加上原来100（4）即是用来取[5，4]的Huffman编码1111111110011110100，[5，4]表示AC值为4的前面有5个零。由于亮度AC，色度AC霍夫曼编码表比较长，在此省略去，有兴趣者可参阅相关书籍。实现上述四个步骤，即完成一幅图像的JPEG压缩。参考资料[1] 林福宗《图像文件格式（上）——Windows 编程》，清华大学出版社， 1996年[2] 李振辉、李仁各编着，《探索图像文件的奥秘》，清华大学出版社，1996年[3] 黎洪松、成实译《JPEG静止数据压缩标准》，学苑出版社，1996年

希望有点帮助
参考资料：http://www.daima.com.cn/Info/94/Info31445/

‘柒’ 一些图像转换软件 “优化霍夫曼编码”什么意思

是一种编码技术
哈夫曼编码(Huffman Coding)是一种编码方式，哈夫曼编码是可变字长编码(VLC)的一种。 Huffman于1952年提出一种编码方法，该方法完全依据字符出现概率来构造异字头的平均长度最短的码字，有时称之为最佳编码，一般就叫作Huffman编码。以哈夫曼树—即最优二叉树，带权路径长度最小的二叉树，经常应用于数据压缩。在计算机信息处理中，“哈夫曼编码”是一种一致性编码法（又称"熵编码法"），用于数据的无损耗压缩。这一术语是指使用一张特殊的编码表将源字符（例如某文件中的一个符号）进行编码。这张编码表的特殊之处在于，它是根据每一个源字符出现的估算概率而建立起来的（出现概率高的字符使用较短的编码，反之出现概率低的则使用较长的编码，这便使编码之后的字符串的平均期望长度降低，从而达到无损压缩数据的目的）。这种方法是由David.A.Huffman发展起来的。例如，在英文中，e的出现概率很高，而z的出现概率则最低。当利用哈夫曼编码对一篇英文进行压缩时，e极有可能用一个位(bit)来表示，而z则可能花去25个位（不是26）。用普通的表示方法时，每个英文字母均占用一个字节（byte），即8个位。二者相比，e使用了一般编码的1/8的长度，z则使用了3倍多。倘若我们能实现对于英文中各个字母出现概率的较准确的估算，就可以大幅度提高无损压缩的比例。

‘捌’ 现今的图像压缩算法有哪些急...

浅谈图像压缩算法

余科亮

本文仅讨论静止图像的压缩基本算法，图像压缩的目的在于以较少的数据来
表示图像以节约存储费用，或者传输时间和费用。
JPEG压缩算法可以用失真的压缩方式来处理图像，但失真的程度却是肉眼所
无法辩认的。这也就是为什么JPEG会有如此满意的压缩比例的原因。
下面主要讨论，JPEG基本压缩法。
一.JPEG压缩过程

JPEG压缩分四个步骤实现：
1.颜色模式转换及采样；
2.DCT变换；
3.量化；
4.编码。

二.1．颜色模式转换及采样

RGB色彩系统是我们最常用的表示颜色的方式。JPEG采用的是YCbCr色彩系统。
想要用JPEG基本压缩法处理全彩色图像，得先把RGB颜色模式图像数据，转换为
YCbCr颜色模式的数据。Y代表亮度，Cb和Cr则代表色度、饱和度。通过下列计算
公式可完成数据转换。
Y=0.2990R+0.5870G+0.1140B
Cb=-0.1687R-0.3313G+0.5000B+128
Cr=0.5000R-0.4187G-0.0813B＋128
人类的眼晴对低频的数据比对高频的数据具有更高的敏感度，事实上，人类
的眼睛对亮度的改变也比对色彩的改变要敏感得多，也就是说Y成份的数据是比较
重要的。既然Cb成份和Cr成份的数据比较相对不重要，就可以只取部分数据来处
理。以增加压缩的比例。JPEG通常有两种采样方式：YUV411和YUV422，它们所代
表的意义是Y、Cb和Cr三个成份的数据取样比例。

2.DCT变换

DCT变换的全称是离散余弦变换(Discrete Cosine Transform)，是指将一组
光强数据转换成频率数据，以便得知强度变化的情形。若对高频的数据做些修饰，
再转回原来形式的数据时，显然与原始数据有些差异，但是人类的眼睛却是不容
易辨认出来。
压缩时，将原始图像数据分成8*8数据单元矩阵，例如亮度值的第一个矩阵内
容如下：

JPEG将整个亮度矩阵与色度Cb矩阵，饱和度Cr矩阵，视为一个基本单元称作
MCU。每个MCU所包含的矩阵数量不得超过10个。例如，行和列采样的比例皆为4:
2:2，则每个MCU将包含四个亮度矩阵，一个色度矩阵及一个饱和度矩阵。
当图像数据分成一个8*8矩阵后，还必须将每个数值减去128，然后一一代入
DCT变换公式中，即可达到DCT变换的目的。图像数据值必须减去128，是因为DCT
转换公式所接受的数字范围是在-128到+127之间。
DCT变换公式：

x,y代表图像数据矩阵内某个数值的坐标位置
f(x,y)代表图像数据矩阵内的数个数值
u,v代表DCT变换后矩阵内某个数值的坐标位置
F(u,v)代表DCT变换后矩阵内的某个数值
u=0 且 v=0 c(u)c(v)=1/1.414
u>0 或 v>0 c(u)c(v)=1
经过DCT变换后的矩阵数据自然数为频率系数，这些系数以F（0，0）的值最
大，称为DC，其余的63个频率系数则多半是一些接近于0的正负浮点数，一概称
之为AC。
3、量化
图像数据转换为频率系数后，还得接受一项量化程序，才能进入编码阶段。
量化阶段需要两个8*8矩阵数据，一个是专门处理亮度的频率系数，另一个则是
针对色度的频率系数，将频率系数除以量化矩阵的值，取得与商数最近的整数，
即完成量化。
当频率系数经过量化后，将频率系数由浮点数转变为整数，这才便于执行最
后的编码。不过，经过量化阶段后，所有数据只保留整数近似值，也就再度损失
了一些数据内容，JPEG提供的量化表如下：

4、编码
Huffman编码无专利权问题，成为JPEG最常用的编码方式，Huffman编码通常
是以完整的MCU来进行的。
编码时，每个矩阵数据的DC值与63个AC值，将分别使用不同的Huffman编码
表，而亮度与色度也需要不同的Huffman编码表，所以一共需要四个编码表，才
能顺利地完成JPEG编码工作。
DC编码
DC是彩采用差值脉冲编码调制的差值编码法，也就是在同一个图像分量中取
得每个DC值与前一个DC值的差值来编码。DC采用差值脉冲编码的主要原因是由于
在连续色调的图像中，其差值多半比原值小，对差值进行编码所需的位数，会比
对原值进行编码所需的位数少许多。例如差值为5，它的二进制表示值为101，如
果差值为-5，则先改为正整数5，再将其二进制转换成1的补数即可。所谓1的补
数，就是将每个Bit若值为0，便改成1；Bit为1，则变成0。差值5应保留的位数
为3，下表即列出差值所应保留的Bit数与差值内容的对照。

在差值前端另外加入一些差值的霍夫曼码值，例如亮度差值为5（101）的位
数为3，则霍夫曼码值应该是100，两者连接在一起即为100101。下列两份表格分
别是亮度和色度DC差值的编码表。根据这两份表格内容，即可为DC差值加上霍夫
曼码值，完成DC的编码工作。

AC编码
AC编码方式与DC略有不同，在AC编码之前，首先得将63个AC值按Zig-zag排
序，即按照下图箭头所指示的顺序串联起来。

63个AC值排列好的，将AC系数转换成中间符号，中间符号表示为RRRR/SSSS，
RRRR是指第非零的AC之前，其值为0的AC个数，SSSS是指AC值所需的位数，AC系
数的范围与SSSS的对应关系与DC差值Bits数与差值内容对照表相似。
如果连续为0的AC个数大于15，则用15/0来表示连续的16个0，15/0称为ZRL
（Zero Rum Length），而（0/0）称为EOB（Enel of Block）用来表示其后所
剩余的AC系数皆等于0，以中间符号值作为索引值，从相应的AC编码表中找出适
当的霍夫曼码值，再与AC值相连即可。
例如某一组亮度的中间符为5/3，AC值为4，首先以5/3为索引值，从亮度AC
的Huffman编码表中找到1111111110011110霍夫曼码值，于是加上原来100（4）
即是用来取[5，4]的Huffman编码1111111110011110100，[5，4]表示AC值为4的
前面有5个零。
由于亮度AC，色度AC霍夫曼编码表比较长，在此省略去，有兴趣者可参阅相
关书籍。
实现上述四个步骤，即完成一幅图像的JPEG压缩。

参考资料
[1] 林福宗《图像文件格式（上）——Windows 编程》，清华大学出版社，
1996年
[2] 李振辉、李仁各编着，《探索图像文件的奥秘》，清华大学出版社，1996年
[3] 黎洪松、成实译《JPEG静止数据压缩标准》，学苑出版社，1996年

导航:首页 > 文件处理 > 霍夫曼编码图像压缩

霍夫曼编码图像压缩

与霍夫曼编码图像压缩相关的资料