导航:首页 > 源码编译 > 图像处理贝叶斯算法

图像处理贝叶斯算法

发布时间:2023-06-10 22:09:21

㈠ 图像处理

第三章 图像处理

        输出图像的像素值仅仅由输入图像的像素值决定。

        1.1 像素变换

              根据像素产生输出像素,注意,这里的像素可以是多副图片的像素。

        1.2 颜色变换

              彩色图像的各通道间具有很强的相关性。

        1.3 合成和映射

              将前景对象从图像背景中提取出来,被称为抠图;将对象插入另一图像被称为合成。

        1.4 直方图均衡化

            对比度和亮度参数可以提升图像的外观,为了自动调节这两个参数,有两种方法,一种方法是寻找图像中最亮的值和最暗的值,将它们映射到纯白和纯黑,另一种方法是寻找图像的像素平均值,将其作为像素的中间灰度值,然后充满范围尽量达到可显示的值。

        局部自适应直方图均衡化,对于不同的区域采用不同的均衡化方法。缺点是会产生区块效应,即块的边界处亮度不连续,为了消除这一效应,常采用移动窗口,或者在块与块之间的转换函数进行平滑插值。

        1.5 应用:色调调整

        点算子的常用领域是对照片的对比度和色调进行操作。

        与点算子相对应的邻域算子是根据选定像素及周围的像素来决定该像素的 输出。邻域算子不仅用于局部色调调整,还用于图像平滑和锐化,图像的去噪。

        邻域算子的重要概念是卷积和相关,它们都是线性移不变算子,满足叠加原理和移位不变原理。

        填塞,当卷积核超出图像边界时,会产生边界效应。有多种填塞方法,0填塞,常数填塞,夹取填塞,重叠填塞,镜像填塞,延长。

        2.1 可分滤波器

        如果一个卷积运算可以分解为一维行向量卷积和一维列向量卷积,则称该卷积核可分离。2D核函数可以看作一个矩阵K,当且仅当K的第一个奇异值为0时,K可分离。

        2.2 线性滤波器举例

        最简单的滤波器是移动平均或方框滤波器,其次是双线性滤波器(双线性核),高斯滤波器(高斯核),以上均为低通核,模糊核,平滑核。对于这些核函数效果的度量采用傅里叶分析。还有Sobel算子和角点算子。

        2.3 带通和导向滤波器

        Sobel算子是带方向的滤波器的近似,先用高斯核平滑图像,再用方向导数(拉普拉斯算子)作用于图像,得到导向滤波器,导向具有潜在的局部性以及很好的尺度空间特性。导向滤波器常用来构造特征描述子和边缘检测器,线性结构通常被认为是类似边缘的。

        区域求和表是指一定区域内所有像素值的和,又称为积分图像,它的有效计算方法是递归算法(光栅扫描算法),区域求和表用于对其他卷积核的近似,人脸检测中的多尺度特征,以及立体视觉中的差分平方和的计算。

        递归滤波器称为无限脉冲响应(IIR),有时用于二维距离函数和连通量的计算,也可计算大面积的平滑计算。

       

        3.1 非线性滤波器

        中值滤波可以去除散粒噪声,它的另一个优点是保边平滑,即在滤除高频噪声时,边缘不容易被柔化。

        双边滤波器思想的精髓在于,抑制与中心像素值差别较大的像素,而不是抑制固定百分比 的像素。在加权滤波器的基础上,对权重系数进行了控制,即取决于定义域核(高斯核)和值域核(与中心像素值的相似度),两者相乘得到双边滤波器核。

        迭代自适应平滑核各项异性扩散。

        3.2 形态学

        非线性滤波常用于二值图像处理,二值图像中最常见的算子是形态学算子,将二值结构元素与二值图像卷积,根据卷积结果的阈值选择二值输出,结构元素可以是任何形状。

        常见的形态学操作有膨胀,腐蚀,过半,开运算,闭运算。过半使锐利的角变得平滑,开运算和闭运算去除图像中小的点和孔洞,并使图像平滑。

        3.3 距离变换

        距离变换通过使用两遍光栅扫描法,快速预计算到曲线或点集的距离,包括城街距离变换和欧氏距离变换。符号距离变换是基本距离变换的扩展,计算了所有像素到边界像素的距离。

        3.4 连通域

        检测图像的连通量是半全局的图像操作,连通量定义为具有相同输入值的邻接像素的区域,二值或多值图像被分割成连通量形式后,对每个单独区域计算统计量,面积,周长,质心,二阶矩,可用于区域排序和区域匹配。

          傅里叶变换用于对滤波器的频域特征进行分析,FFT能快速实现大尺度核的卷积。

          思想:为了分析滤波器的频率特征,将一个已知频率的正弦波通过滤波器,观察正弦波变弱的程度。傅里叶变换可认为是输入信号为正弦信号s(x),经过滤波器h(x)后,产生的输出响应为正弦信号o(x)=s(x)*h(x),即两者的卷积。傅里叶变换是对每个频率的幅度和相位响应的简单罗列。傅里叶变换不仅可以用于滤波器,还能用于信号和图像。

          傅里叶变换的性质:叠加,平移,反向,卷积,相关,乘,微分,定义域缩放,实值图像,Parseval定理。

      4.1 傅里叶变换对

      常见的傅里叶变换对,连续的和离散的。方便进行傅里叶变换。

        高频成分将在降采样中导致混叠。

      4.2 二维傅里叶变换

        为了对二维图像及滤波器进行处理,提出了二维傅里叶变换,与一维傅里叶变换类似,只不过用向量代替标量,用向量内积代替乘法。

        4.3 维纳滤波器

        傅里叶变换还可用于分析一类图像整体的频谱,维纳滤波器应运而生。假定这类图像位于随机噪声场中,每个频率的期望幅度通过功率谱给出,信号功率谱捕获了空间统计量的一阶描述。维纳滤波器适用于去除功率谱为P的图像噪声的滤波器。

        维纳滤波器的性质,对于低频具有 单位增益,对于高频,具有减弱的效果。

        离散余弦变换(DCT)常用于处理以块为单位的图像压缩,它的计算方法是将以N为宽度的块内的像素与一系列不同频率的余弦值进行点积来实现。

        DCT变换的实质是对自然图像中一些小的区域的最优KL分解(PCA主成分分析的近似),KL能有效对信号去相关。

        小波算法和DCT交叠变种能有效去除区块效应。

        4.4 应用:锐化,模糊,去噪

          锐化和去噪声能有效增强图像,传统的方法是采用线性滤波算子,现在广泛采用非线性滤波算子,例如加权中值和双边滤波器,各向异性扩散和非局部均值,以及变分方法。

          度量图像去噪算法效果时,一般采用峰值信噪比(PNSR),结构相似性(SSIM)索引。

        迄今为止所研究的图像变换输出图像大小均等于输入图像的大小,为了对不同分辨率的图像进行处理,比如,对小图像进行插值使其与电脑的分辨率相匹配,或者减小图像的大小来加速算法的执行或节省存储空间和传输时间。

        由于不知道处理图像所需的分辨率,故由多幅不同的图像构建图像金字塔,从而进行多尺度的识别和编辑操作。改变图像分辨率较好的滤波器是插值滤波器和降采样滤波器。

      5.1 插值

        为将图像变大到较高分辨率,需要用插值核来卷积图像,二次插值常用方法是双线性插值,双三次插值,窗函数。窗函数被认为是品质最高的插值器,因为它既可以保留低分辨率图像中的细节,又可以避免混叠。

        5.2 降采样

        降采样是为了降低图像分辨率,先用低通滤波器卷积图像,避免混叠,再保持第r个样例。常用的降采样滤波器有线性滤波器,二次滤波器,三次滤波器,窗余弦滤波器,QMF-9滤波器,JPEG2000滤波器。

        5.3 多分辨率表示

        通过降采样和插值算法,能够对图像建立完整的图像金字塔,金字塔可以加速由粗到精的搜索算法,以便在不同的尺度上寻找物体和模式,或进行多分辨率融合操作。

        计算机视觉中最有名的金字塔是拉普拉斯金字塔,采用大小为2因子对原图像进行模糊和二次采样,并将它存储在金字塔的下一级。

      5.4 小波变换

        小波是在空间域和频率域都定位一个信号的滤波器,并且是在不同层次的尺度上定义的。小波可以进行多尺度有向滤波和去噪。与常规的金字塔相比,小波具有更好的方向选择性,并提供了紧致框架。

        提升小波被称为第二代小波,很容易适应非常规采样拓扑,还有导向可移位多尺度变换,它们的表述不仅是过完备的,而且是方向选择的。

      5.5 应用:图像融合

        拉普拉斯金字塔的应用,混合合成图像。要产生混合图像,每个原图像先分解成它自己的拉普拉斯金字塔,之后每个带被乘以一个大小正比于金字塔级别的平滑加权函数 。最简单的方法是建立一个二值掩膜图像,根据此图像产生一个高斯金字塔,再将拉普拉斯金字塔和高斯掩膜,这两个带权金字塔的和产生最终图像。

        相对于点操作改变了图像的值域范围,几何变换关注于改变图像的定义域。原先采用的方法是全局参数化2D变换,之后的注意力将转向基于网格的局部变形等更多通用变形。

        6.1 参数变换

        参数化变换对整幅图像进行全局变换,其中变换的行为由少量的参数控制,反向卷绕或反向映射的性能优于前向卷绕,主要在于其能够避免空洞和非整数位置重采样的问题。而且可以用高质量的滤波器来控制混叠。

        图像卷绕问题可形式化为给定一个从目标像素x'到原像素x的映射来重采样一副原图像。类似的反向法应用场合有光流法预测光流以及矫正透镜的径向畸变。

        重采样过程的插值滤波器有,二次插值,三次插值,窗插值,二次插值追求速度,三次插值和窗插值追求视觉品质。

        MIP映射是一种纹理映射的快速预滤波图像工具。   

        MIP图是标准的图像金字塔,每层用一个高质量的滤波器滤波而不是低质量的近似,重采样时,需要预估重采样率r。

        椭圆带权平均滤波器(EWA),各向异性滤波,多通变换。

        有向二位滤波和重采样操作可以用一系列一维重采样和剪切变换来近似,使用一系列一维变换的优点是它们比大的,不可分离的二位滤波核更有效。

        6.2 基于网格扭曲

            为了获得更自由的局部变形,产生了网格卷绕。稀疏控制点,稠密集,有向直线分割,位移场的确定。

        6.3 应用:基于特征的形态学

            卷绕常用于改变单幅图像的外观以形成动画,也可用于多幅图像的融合以产生强大的变形效果,在两幅图像之间进行简单的渐隐渐显会导致鬼影,但采用图像卷绕建立了良好的对应关系,相应的特征便会对齐。

        用一些优化准则明确表达想要变换的目标,再找到或推断出这个准则的解决办法。正则化和变分法,构建一个描述解特性的连续全局能量函数,然后用稀疏线性系统或相关迭代方法找到最小能量解,贝叶斯统计学对产生输入图像的有噪声的测量过程和关于解空间的先验假设进行建模,通常用马尔科夫随机场进行编码。常见示例有散列数据的表面插值,图像去噪和缺失区域恢复,将图像分为前景和背景区域。

      7.1 正则化

        正则化理论试图用模型来拟合严重欠约束解空间的数据。即用一个平滑的表面穿过或是靠近一个测量数据点集合的问题。这样的问题是病态的和不适定的。这样由采样数据点d(xi,yi)恢复完整图像f(x,y)的问题被称为逆问题。

        为了定义平滑解,常在解空间上定义一个范数,对于一维函数,函数一阶导数的平方进行积分,或对函数二阶导数的平方进行积分,这种能量度量是泛函的样例,是将函数映射到标量值的算子,这种方法被称为变分法,用于度量函数的变化(非平滑性)。

        7.2 马尔科夫随机场

        7.3 应用:图像复原

㈡ 遥感图像分类法

图像分类是与图像信息提取和增强不同的遥感图像处理中另一重要的方面,与图像增强后仍需人为解译不同,它企图用计算机做出定量的决定来代替人为视觉判译步骤。因此,分类处理后输出的是一幅专题图像。在此图像中,原来图像中的每一个象元依据不同的统计决定准则被划归为不同的地表覆盖类,由于是一种统计决定,必然伴随着某种错误的概率。因此,在逻辑上的合理要求是,对每一个象元所做的决定,应是使整个被分类面积即对大量单个象元的分类的某个错误判据为最小。

以下是几种常用的遥感图像分类方法:

1.最大似然分类(maximum likelihood classification)

最大似然分类是一种基于贝叶斯判别准则的非线性监督分类方法,需要知道已知的或确定的训练样区典型标准的先验概率P(wi)和条件概率密度函数P(wi,x)。P(wi)通常根据各种先验知识给出或假定它们相等:P(wix)则是首先确定其分布形式,然后利用训练样本估计其参数。一般假设为正态分布,或通过数学方法化为正态分布。其判别函数集为:

Di(x)=P(wix),i=1,2,…,m (2-2)

如果Di(x)≥ Dj(x),则x属于wi类。其中,j≠i,j=1,2,…,m。m为类别数。

从上述最大似然分类的说明看,其关键就在于已知类别的定义,先验概率的确定,参与分类的变量的好坏和结果误差评价。直到现在,最大似然分类至少还有两个缺点:一是事先大量人力已知光谱类的选择和定义:二是需要长时间的计算机分类计算时间。实际上这也使得最大似然分类法遥感应用受到了限制,因此许多人专门研究改进算法以便解决和缩减图像分类的时间,提高分类的精度。Solst和Lillesand(1991)为了解决已知类别定义消耗大量人力的缺点,发展了半自动训练法进行已知光谱类的定义。Fabio Maselli等(1992)利用Skidmore和Tumer提出的非参数分类器计算出各已知类训练集的先验概率,然后将它们插入常规的最大似然分类过程中进行分类。该方法融合了非参数和参数分类过程的优点,提高了分类的精度。

通常情况下,地形会影响到训练集数据,这样训练集光谱数据就偏离了最大似然分类的假设条件正态分布,从而常规的最大似然分类法在地形起伏较大的地区效果并不太好。为了解决这一问题,C.Conese和G.Maracchi和F.Maselli(1993)提出了一种改进的最大似然分类算法,即去掉每一类数据集中与第一主成分相关的信息(地形信息)然后再进行分类。通过试验,这种方法是有效的,分类精度得到了提高。

K.Arai(1993)用光谱和空间信息进行分类改进了最大似然分类方法。该方法简单易行,大大提高了正确分类的概率。C.Conese和Fabio Maselli(1992)用误差矩阵提高最大似然分类面积估计的精度。Irina Kerl(1996)加最大似然分类精度的一种方法,即多概率比较法。他对同一遥感数据的原始波段、主成分和植被指数的22种组合进行了最大似然分类,发现没有一种波段组合的分类能给出图像中所有土地利用类型的精确分类,每一波段组合仅对图像中的一两类土地利用类型分类有效。因此他提出将能有效区分出所要决定的土地利用类型的几个波段组合的分类结果进行组合来进行图像分类,并称这种方法为多概率比较法,这种方法的基础就是图像数据不同波段组合的分类结果之间分类概率大小的比较。应用这种方法提高了分类的精度。

2.最小距离分类(minimum distance classification)

最小距离分类是一种线性判别监督分类方法,也需要对训练区模式样本进行统计分析,是大似然分类法中的一种极为重要的特殊情况。最小距离分类在算法上比较简单,首先需选出要区分类别的训练样区,并且从图像数据中求出各类训练样区各个波段的均值和标准差,然后再计算图像中其他各个象元的灰度值向量到各已知类训练样区均值向量之间的距离。如果距离小于指定的阈值(一般取标准差的倍数),且与某一类的距离最近,就将该象元划归为某类。因此称为最小距离分类。该方法的精度主要取决于已知类训练样区的多少和样本区的统计精度。另外,距离度量的方法不同,分类的结果也不相同,常见的有:

(1)明氏距离(minkowski distance)

中亚地区高光谱遥感地物蚀变信息识别与提取

式中Tij=-Tij

③经过①②步后,随机象元X被划归为正确的类。

另外,通过对参与计算变量的排序和部分一总和逻辑的考虑,可大大降低该算法计算的时间。与最小距离(欧氏距离)和最大似然分类器相比,整体平均分类器所用时间最少,分类精度与最小距离大致相同,对像农田面积和森林这样的名义类型的分类十分有效。

Haluk Cetin(1996)提出了一种分类方法:类间距离频率分布法(interclass distance frequency dis-tribution),这是多光谱数据非参数分类方法的一种。类间距离频率分布过程简单,是一种有力的可视化技术,它图形地显示多光谱数据和类分布。首先选择感兴趣的类,这些类的统计信息从典型的训练样区可获得。利用类的平均测量矢量计算多光谱数据中每个象元的距离,并存放在一个两维数据分布数组中。选择其他类的训练区,训练区数据的分布通过距离计算可获得。通过可视化地检查结果,建立分类查询表(look-up table),然后利用分类查询表进行多光谱图像数据的分类,具体细节请参见原文。

H.N.Srikanta Prakash等(1996)改进了遥感数据凝聚聚类分析,这是一种基于相互近邻概念,用来进行多光谱数据分类的非参数、层次、凝聚聚类分析算法。该方法定义了围绕象元的感兴趣区域(area of interest around each pixel),然后在它内部寻找分类时初始合并操作需要的k最近邻,将象元的特征值、波段值和象元的相对位置值一起考虑,提出了改进的距离量度,这样,大大减少了计算的时间和内存的需求,降低了分类的误差概率。

Steven E.Franklin和Bradley A.Wilson(1992)设计了3阶段分类器进行遥感图像的分类,它由一个基于四叉树的分割算子、一个高斯最小距离均值测试和一个包括辅助地理网数据和光谱曲线测量的最终测试构成。与最大似然分类技术相比,3阶段分类器的总体分类精度得到了提高,减少计算时间,另外仅需最少的训练样区数据(它们在复杂地形区很难获得)。

㈢ 图像分类处理简介

数字图像的恢复、增强,乃至复合处理,归根到底只是改善图像的品质,提高图像的可解译性。但处理系统(计算机)并未对图像上地物的类别作出“判决”(解译)。由计算按一定的判别模式来自动完成这一“判决”,便是图像分类处理的过程。

图像分类处理的最终目标是智能化,使遥感图像处理发展成为一种人工智能系统。广义的分类处理,既包括波谱信息的分类,也包括空间信息的分类。后者一般包括图形识别、边缘和线条信息的检测与提取,以及纹理结构分析等,通常也称图像的空间信息分析。关于这一部分对于地质工作者显然感兴趣的内容,可参阅文献[3]等着作。限于篇幅,这里仅介绍按波谱信息分类的基本概念。

(一)图像分类的依据

一般来说,同一类地物有着相似的波谱,在多波段遥感的数字图像中,可以粗略地用它们在各个波段上的像元值的连线(亨利曲线)来表示(图4-29A);由于受光照条件、环境背景等因素的影响,在实际的多维波谱空间中,它们的像元值向量往往不是一个点,而是呈点群分布(集群),不同地物的点群处在不同的位置(图4-29B);不仅如此,在实际图像中,不同地物的波谱集群还存在有交叉过渡,受图像分辨力的限制,一个像元中可能包括有若干个地物类别,即所谓“混合像元”。因此,对不同集群的区分一般要依据它们的统计特征(统计量)。例如,集群位置用均值向量表示、点群的中心及离散度常用标准差或协方差来量度等等;数字图像常用的几种统计量见表4-4。

图4-29 索尔顿湖和因佩里亚谷地陆地卫星MSS数字图像上主要几种地物的光谱反射比曲线和集群分布

表4-4 数字图像常用的统计量

图像分类处理的实质就是按概率统计规律,选择适当的判别函数、建立合理的判别模型把这些离散的“集群”分离开来,并作出判决和归类。通常的做法是,将多维波谱空间划分为若干区域(子空间),位于同一区域内的点归于同一类。子空间划分的标准可以概括为两类:①根据点群的统计特征,确定它所应占据的区域范围。例如,以每一类的均值向量为中心,规定在几个标准差的范围内的点归为一类;②确定类别之间的边界,建立边界函数或判别函数。不论采取哪种标准,关键在于确定同一类别在多维波谱空间中的位置(类的均值向量)、范围(协方差矩陈)及类与类边界(判别函数)的确切数值。按确定这些数据是否有已知训练样本(样区)为准,通常把分类技术分为监督和非监督两类。

(二)非监督分类

非监督分类是在没有已知类别的训练数据及分类数的情况下,依据图像数据本身的结构(统计特征)和自然点群分布,按照待分样本在多维波谱空间中亮度值向量的相似程度,由计算机程序自动总结出分类参数,进而逐一对像元作归类,通常也称聚类(集群)分析。使用的方法有图形识别、系统聚类、分裂法和动态聚类等。

其中,比较实用的是动态聚类。它是首先根据经验和分类数,选定若干个均值向量,作为“种子”,建立一批初始中心,进行初步概略的分类,然后根据规定的参数(阈值)检验分类结果,逐步修改调整分类中心,再重新分类,并根据各类离散性统计量(如均方差等)和不同类别之间可分离性统计量(如类间标准化距离等),进行类的合并或分裂;此后再修改中心,直至分类结果合理为止。动态聚类中,聚类中心和分类数可以按客观的波谱特征自动调整,分类效果一般比较好,但分类结果的确切含义(类别的属性)需另作分析,从实况调查或已有的地面资料中去确定它们的地物类型。

非监督分类由于事先不需训练样本,故处理速度较快,较客观,并能为监督分类的训练样区选择提供参照,一般在有目的的监督分类之前进行。

(三)监督分类

监督分类一般是先在图像中选取已知样本(训练区)的统计数据,从中找出分类的参数、条件,建立判别函数,然后对整个图像或待分类像元作出判别归类。遥感图像处理中常用的监督分类方法有最小距离法、费歇尔线性判别法、贝叶斯线性和非线性判别法(最大似然法)等。

其中,最小距离法在算法上比较简单:首先在图像显示屏上选出训练样区,并且从图像数据中求出训练样区各个波段的均值和标准差;尔后再去计算其它各像元的亮度值向量到训练样区波谱均值向量之间的距离。如果距离小于指定的阈值(一般取标准差的倍数),且与某一类的距离最近,遂将该像元归为某类。该分类法的精度取决于训练样区(地物类别)的多少和样本区的统计精度。由于计算简便,并可按像元顺序逐一扫描归类,一般分类效果也较好,因而是较常用的监督分类方法。

最大似然法也是常用的监督分类方法之一。它是用贝叶斯判别原则进行分析的一种非线性监督分类。简单地说,它可以假定已知的或确定的训练样区典型标准的先验概率,然后把某些特征归纳到某些类型的函数中,根据损失函数的情况,在损失最小时获得最佳判别。该法分类效果较好,但运算量较大。

监督分类的结果明确,分类精度相对较高,但对训练样本的要求较高,因此,使用时须注意应用条件,某一地区建立的判别式对别的地区不一定完全适用。此外,有时训练区并不能完全包括所有的波谱样式,会造成一部分像元找不到归属。故实际工作中,监督分类和非监督分类常常是配合使用,互相补充的。

图像分类处理目前在农林、土地资源遥感调查中应用较广。对于地质体的分类,由于干扰因素较大,不容易取得十分理想的效果,故在地质应用上尚不很普遍。但最近已陆续出现了一批使用分类技术的遥感地质应用成果,较多的是用经变换(比值、K-L等)处理的图像再作分类处理,用于岩性填图或热液蚀变填图等,是值得重视的发展方向。

阅读全文

与图像处理贝叶斯算法相关的资料

热点内容
dvd光盘存储汉子算法 浏览:758
苹果邮件无法连接服务器地址 浏览:963
phpffmpeg转码 浏览:672
长沙好玩的解压项目 浏览:145
专属学情分析报告是什么app 浏览:564
php工程部署 浏览:833
android全屏透明 浏览:737
阿里云服务器已开通怎么办 浏览:803
光遇为什么登录时服务器已满 浏览:302
PDF分析 浏览:486
h3c光纤全工半全工设置命令 浏览:143
公司法pdf下载 浏览:383
linuxmarkdown 浏览:350
华为手机怎么多选文件夹 浏览:683
如何取消命令方块指令 浏览:350
风翼app为什么进不去了 浏览:779
im4java压缩图片 浏览:362
数据查询网站源码 浏览:151
伊克塞尔文档怎么进行加密 浏览:893
app转账是什么 浏览:163