‘壹’ 图像的特征提取都有哪些算法
常用的图像特征有颜色特征、纹理特征、形状特征、空间关系特征。
一 颜色特征
(一)特点:颜色特征是一种全局特征,描述了图像或图像区域所对应的景物的表面性质。一般颜色特征是基于像素点的特征,此时所有属于图像或图像区域的像素都有各自的贡献。由于颜色对图像或图像区域的方向、大小等变化不敏感,所以颜色特征不能很好地捕捉图像中对象的局部特征。另外,仅使用颜色特征查询时,如果数据库很大,常会将许多不需要的图像也检索出来。颜色直方图是最常用的表达颜色特征的方法,其优点是不受图像旋转和平移变化的影响,进一步借助归一化还可不受图像尺度变化的影响,基缺点是没有表达出颜色空间分布的信息。
(二)常用的特征提取与匹配方法
(1) 颜色直方图
其优点在于:它能简单描述一幅图像中颜色的全局分布,即不同色彩在整幅图像中所占的比例,特别适用于描述那些难以自动分割的图像和不需要考虑物体空间位置的图像。其缺点在于:它无法描述图像中颜色的局部分布及每种色彩所处的空间位置,即无法描述图像中的某一具体的对象或物体。
最常用的颜色空间:RGB颜色空间、HSV颜色空间。
颜色直方图特征匹配方法:直方图相交法、距离法、中心距法、参考颜色表法、累加颜色直方图法。
(2) 颜色集
颜色直方图法是一种全局颜色特征提取与匹配方法,无法区分局部颜色信息。颜色集是对颜色直方图的一种近似首先将图像从 RGB颜色空间转化成视觉均衡的颜色空间(如 HSV 空间),并将颜色空间量化成若干个柄。然后,用色彩自动分割技术将图像分为若干区域,每个区域用量化颜色空间的某个颜色分量来索引,从而将图像表达为一个二进制的颜色索引集。在图像匹配中,比较不同图像颜色集之间的距离和色彩区域的空间关系
(3) 颜色矩
这种方法的数学基础在于:图像中任何的颜色分布均可以用它的矩来表示。此外,由于颜色分布信息主要集中在低阶矩中,因此,仅采用颜色的一阶矩(mean)、二阶矩(variance)和三阶矩(skewness)就足以表达图像的颜色分布。
(4) 颜色聚合向量
其核心思想是:将属于直方图每一个柄的像素分成两部分,如果该柄内的某些像素所占据的连续区域的面积大于给定的阈值,则该区域内的像素作为聚合像素,否则作为非聚合像素。
(5) 颜色相关图
二 纹理特征
(一)特点:纹理特征也是一种全局特征,它也描述了图像或图像区域所对应景物的表面性质。但由于纹理只是一种物体表面的特性,并不能完全反映出物体的本质属性,所以仅仅利用纹理特征是无法获得高层次图像内容的。与颜色特征不同,纹理特征不是基于像素点的特征,它需要在包含多个像素点的区域中进行统计计算。在模式匹配中,这种区域性的特征具有较大的优越性,不会由于局部的偏差而无法匹配成功。作为一种统计特征,纹理特征常具有旋转不变性,并且对于噪声有较强的抵抗能力。但是,纹理特征也有其缺点,一个很明显的缺点是当图像的分辨率变化的时候,所计算出来的纹理可能会有较大偏差。另外,由于有可能受到光照、反射情况的影响,从2-D图像中反映出来的纹理不一定是3-D物体表面真实的纹理。
例如,水中的倒影,光滑的金属面互相反射造成的影响等都会导致纹理的变化。由于这些不是物体本身的特性,因而将纹理信息应用于检索时,有时这些虚假的纹理会对检索造成“误导”。
在检索具有粗细、疏密等方面较大差别的纹理图像时,利用纹理特征是一种有效的方法。但当纹理之间的粗细、疏密等易于分辨的信息之间相差不大的时候,通常的纹理特征很难准确地反映出人的视觉感觉不同的纹理之间的差别。
(二)常用的特征提取与匹配方法
纹理特征描述方法分类
(1)统计方法统计方法的典型代表是一种称为灰度共生矩阵的纹理特征分析方法Gotlieb 和 Kreyszig 等人在研究共生矩阵中各种统计特征基础上,通过实验,得出灰度共生矩阵的四个关键特征:能量、惯量、熵和相关性。统计方法中另一种典型方法,则是从图像的自相关函数(即图像的能量谱函数)提取纹理特征,即通过对图像的能量谱函数的计算,提取纹理的粗细度及方向性等特征参数
(2)几何法
所谓几何法,是建立在纹理基元(基本的纹理元素)理论基础上的一种纹理特征分析方法。纹理基元理论认为,复杂的纹理可以由若干简单的纹理基元以一定的有规律的形式重复排列构成。在几何法中,比较有影响的算法有两种:Voronio 棋盘格特征法和结构法。
(3)模型法
模型法以图像的构造模型为基础,采用模型的参数作为纹理特征。典型的方法是随机场模型法,如马尔可夫(Markov)随机场(MRF)模型法和 Gibbs 随机场模型法
(4)信号处理法
纹理特征的提取与匹配主要有:灰度共生矩阵、Tamura 纹理特征、自回归纹理模型、小波变换等。
灰度共生矩阵特征提取与匹配主要依赖于能量、惯量、熵和相关性四个参数。Tamura 纹理特征基于人类对纹理的视觉感知心理学研究,提出6种属性,即:粗糙度、对比度、方向度、线像度、规整度和粗略度。自回归纹理模型(simultaneous auto-regressive, SAR)是马尔可夫随机场(MRF)模型的一种应用实例。
三 形状特征
(一)特点:各种基于形状特征的检索方法都可以比较有效地利用图像中感兴趣的目标来进行检索,但它们也有一些共同的问题,包括:①目前基于形状的检索方法还缺乏比较完善的数学模型;②如果目标有变形时检索结果往往不太可靠;③许多形状特征仅描述了目标局部的性质,要全面描述目标常对计算时间和存储量有较高的要求;④许多形状特征所反映的目标形状信息与人的直观感觉不完全一致,或者说,特征空间的相似性与人视觉系统感受到的相似性有差别。另外,从 2-D 图像中表现的 3-D 物体实际上只是物体在空间某一平面的投影,从 2-D 图像中反映出来的形状常不是 3-D 物体真实的形状,由于视点的变化,可能会产生各种失真。
(二)常用的特征提取与匹配方法
Ⅰ几种典型的形状特征描述方法
通常情况下,形状特征有两类表示方法,一类是轮廓特征,另一类是区域特征。图像的轮廓特征主要针对物体的外边界,而图像的区域特征则关系到整个形状区域。
几种典型的形状特征描述方法:
(1)边界特征法该方法通过对边界特征的描述来获取图像的形状参数。其中Hough 变换检测平行直线方法和边界方向直方图方法是经典方法。Hough 变换是利用图像全局特性而将边缘像素连接起来组成区域封闭边界的一种方法,其基本思想是点—线的对偶性;边界方向直方图法首先微分图像求得图像边缘,然后,做出关于边缘大小和方向的直方图,通常的方法是构造图像灰度梯度方向矩阵。
(2)傅里叶形状描述符法
傅里叶形状描述符(Fourier shape descriptors)基本思想是用物体边界的傅里叶变换作为形状描述,利用区域边界的封闭性和周期性,将二维问题转化为一维问题。
由边界点导出三种形状表达,分别是曲率函数、质心距离、复坐标函数。
(3)几何参数法
形状的表达和匹配采用更为简单的区域特征描述方法,例如采用有关形状定量测度(如矩、面积、周长等)的形状参数法(shape factor)。在 QBIC 系统中,便是利用圆度、偏心率、主轴方向和代数不变矩等几何参数,进行基于形状特征的图像检索。
需要说明的是,形状参数的提取,必须以图像处理及图像分割为前提,参数的准确性必然受到分割效果的影响,对分割效果很差的图像,形状参数甚至无法提取。
(4)形状不变矩法
利用目标所占区域的矩作为形状描述参数。
(5)其它方法
近年来,在形状的表示和匹配方面的工作还包括有限元法(Finite Element Method 或 FEM)、旋转函数(Turning Function)和小波描述符(Wavelet Descriptor)等方法。
Ⅱ 基于小波和相对矩的形状特征提取与匹配
该方法先用小波变换模极大值得到多尺度边缘图像,然后计算每一尺度的 7个不变矩,再转化为 10 个相对矩,将所有尺度上的相对矩作为图像特征向量,从而统一了区域和封闭、不封闭结构。
四 空间关系特征
(一)特点:所谓空间关系,是指图像中分割出来的多个目标之间的相互的空间位置或相对方向关系,这些关系也可分为连接/邻接关系、交叠/重叠关系和包含/包容关系等。通常空间位置信息可以分为两类:相对空间位置信息和绝对空间位置信息。前一种关系强调的是目标之间的相对情况,如上下左右关系等,后一种关系强调的是目标之间的距离大小以及方位。显而易见,由绝对空间位置可推出相对空间位置,但表达相对空间位置信息常比较简单。
空间关系特征的使用可加强对图像内容的描述区分能力,但空间关系特征常对图像或目标的旋转、反转、尺度变化等比较敏感。另外,实际应用中,仅仅利用空间信息往往是不够的,不能有效准确地表达场景信息。为了检索,除使用空间关系特征外,还需要其它特征来配合。
(二)常用的特征提取与匹配方法
提取图像空间关系特征可以有两种方法:一种方法是首先对图像进行自动分割,划分出图像中所包含的对象或颜色区域,然后根据这些区域提取图像特征,并建立索引;另一种方法则简单地将图像均匀地划分为若干规则子块,然后对每个图像子块提取特征,并建立索引。
‘贰’ 智能汽车tsr是什么意思
【太平洋汽车网】汽车tsr指的是汽车安全系统中的交通标志识别系统,其是利用前置摄像头结合模式,可以识别常见的交通标志,这一功能会提醒驾驶员注意前面的交通标志,以便驾驶员遵守这些标志。TSR功能降低了驾驶员不遵守停车标志等交通法规的可能,避免了违法左转或者其他交通违法行为,从而提高了车主驾车的安全性。
交通标志识别系统一般包括检测和识别两部分。检测一般是利用交通标志的形状和颜色特征,从自然场景中把交通标志提取出来。识别是把检测出来的交通标志的内容识别出来。交通标志识别在规范交通行为、确保安全驾驶等方面具有重要的意义。交通标志通常处于室外复杂的环境条件下,识别的过程中容易受环境光照、方向旋转的影响。
交通标志识别系统是智能交通系统与先进辅助驾驶系统的重要组成部分,提高交通标志检测与识别算法的准确率和实时性是走向实际应用进程中需要解决的关键问题。算法的准确率是交通标志识别研究中一个十分重要的因素,错误的识别结果不仅不能起到辅助驾驶作用,还会导致严重的安全事故。而算法的实时性决定了研究成果能否转化为具有实际应用价值的产品。在汽车数量日益增加、交通安全事故居高不下,要求不断提升汽车的驾驶智能化的现实压力面前,开展以实时应用为目标的交通标志检测与识别技术研究,对于增加驾驶安全具有重大的意义。
交通标志检测是进行交通标志分类的前提,同时还压缩了计算目标的空间,减少后续特征提取算法的运算量,还可以获得更高的识别准确率。在图像的特征提取领域,常见的特征提取与选择方法有:PCA主成分分析法Gabor特征提取算法SIFT特征提取算法SURF特征提取算法Haar小波特征提取算法/类Haar小波特征提取算法不变矩特征提取算法直方图特征提取算法交通标志分类与识别方法主要有:基于各种距离的模板匹配识别方法,基于大量数据样本的机器学习识别方法以及基于粒子群算法、遗传算法等智能算法的识别方法。
(图/文/摄:太平洋汽车网问答叫兽)
‘叁’ 经典图像特征|SIFT HOG LBP Haar
https://blog.csdn.net/lingyunxianhe/article/details/79063547
尺度不变特征转换即SIFT (Scale-invariant feature transform)是一种计算机视觉的算法。它用来 侦测与描述影像中的局部性特征,它在空间尺度中寻找极值点,并提取出其位置、尺度、旋转不变量 。局部影像特征的描述与侦测可以帮助辨识物体,SIFT特征是基于物体上的一些局部外观的兴趣点而与影像的大小和旋转无关。对于光线、噪声、些微视角改变的容忍度也相当高。
SIFT算法的实质是在不同的尺度空间上查找关键点(特征点),并计算出关键点的方向 。SIFT所查找到的关键点是一些十分突出,不会因光照,仿射变换和噪音等因素而变化的点,如角点、边缘点、暗区的亮点及亮区的暗点等。
在一副图像中,局部目标的表象和形状(appearance and shape)能够被梯度或边缘的方向密度分布很好地描述。首先将图像分成小的连通区域,我们把它叫细胞单元。然后采集细胞单元中各像素点的梯度的或边缘的方向直方图。最后把这些直方图组合起来就可以构成特征描述器。
大概过程:
HOG特征提取方法就是将一个image(你要检测的目标或者扫描窗口):
1)灰度化(将图像看做一个x,y,z(灰度)的三维图像);
2)采用Gamma校正法对输入图像进行颜色空间的标准化(归一化);目的是调节图像的对比度,降低图像局部的阴影和光照变化所造成的影响,同时可以抑制噪音的干扰;
3)计算图像每个像素的梯度(包括大小和方向);主要是为了捕获轮廓信息,同时进一步弱化光照的干扰。
4)将图像划分成小cells(例如6*6像素/cell);
5)统计每个cell的梯度直方图(不同梯度的个数),即可形成每个cell的descriptor;
6)将每几个cell组成一个block(例如3*3个cell/block),一个block内所有cell的特征descriptor串联起来便得到该block的HOG特征descriptor。
7)将图像image内的所有block的HOG特征descriptor串联起来就可以得到该image(你要检测的目标)的HOG特征descriptor了。这个就是最终的可供分类使用的特征向量了。
LBP(Local Binary Pattern,局部二值模式)是一种用来描述图像局部纹理特征的算子;它具有旋转不变性和灰度不变性等显着的优点。原始的LBP算子定义为在3*3的窗口内,以窗口中心像素为阈值,将 相邻的8个像素的灰度值与其进行比较,若周围像素值大于中心像素值,则该像素点的位置被标记为1,否则为0。 这样,3*3邻域内的8个点经比较可产生8位二进制数(通常转换为十进制数即LBP码,共256种),即得到该窗口中心像素点的LBP值,并用这个值来反映该区域的纹理信息。
提取的步骤
(1)首先将检测窗口划分为16×16的小区域(cell);
(2)对于每个cell中的一个像素,将相邻的8个像素的灰度值与其进行比较,若周围像素值大于中心像素值,则该像素点的位置被标记为1,否则为0。这样,3*3邻域内的8个点经比较可产生8位二进制数,即得到该窗口中心像素点的LBP值;
(3)然后计算每个cell的直方图,即每个数字(假定是十进制数LBP值)出现的频率;然后对该直方图进行归一化处理。
(4)最后将得到的每个cell的统计直方图进行连接成为一个特征向量,也就是整幅图的LBP纹理特征向量;
Haar特征分为三类: 边缘特征、线性特征、中心特征和对角线特征,组合成特征模板 。特征模板内有白色和黑色两种矩形,并定义该模板的特征值为白色矩形像素和减去黑色矩形像素和。Haar特征值反映了图像的灰度变化情况。例如:脸部的一些特征能由矩形特征简单的描述,如:眼睛要比脸颊颜色要深,鼻梁两侧比鼻梁颜色要深,嘴巴比周围颜色要深等。但矩形特征只对一些简单的图形结构,如边缘、线段较敏感,所以只能描述特定走向(水平、垂直、对角)的结构。通过改变特征模板的大小和位置,可在图像子窗口中穷举出大量的特征。 特征模板称为“特征原型”;特征原型在图像子窗口中扩展(平移伸缩)得到的特征称为“矩形特征”;矩形特征的值称为“特征值”。
矩形特征可位于图像任意位置,大小也可以任意改变,所以矩形特征值是矩形模版类别、矩形位置和矩形大小这三个因素的函数。故类别、大小和位置的变化,使得很小的检测窗口含有非常多的矩形特征,如:在24*24像素大小的检测窗口内矩形特征数量可以达到16万个。这样就有两个问题需要解决了:(1)如何快速计算那么多的特征?—积分图大显神通;(2)哪些矩形特征才是对分类器分类最有效的?
‘肆’ 图像角点特征之Harris、SIFT、SURF、ORB
角点检测(Corner Detection)是计算机视觉系统中用来获得图像特征的一种方法,广泛应用于运动检测、图像匹配、视频跟踪、三维建模和目标识别等领域中。也称为特征点检测。 角点通常被定义为两条边的交点,更严格的说,角点的局部邻域应该具有两个不同区域的不同方向的边界。而实际应用中,大多数所谓的角点检测方法检测的是拥有特定特征的图像点,而不仅仅是“角点”。这些特征点在图像中有具体的坐标,并具有某些数学特征,如局部最大或最小灰度、某些梯度特征等。
这些角点通常在图像中是稳定存在的。角点的微小偏移就能反映出图像帧的相对运动。
Harris角点检测算法就是对角点响应函数R进行阈值处理:R > threshold,即提取R的局部极大值。
特点:具有角度不变性
SIFT克服了Harris的不足,缩放也没影响,具有尺度不变性。
特点:角度不变性,尺度不变性
SURF是SIFT的加速版,它善于处理具有模糊和旋转的图像,但是不善于处理视角变化和光照变化。在SIFT中使用DoG对LoG进行近似,而在SURF中使用盒子滤波器对LoG进行近似,这样就可以使用积分图像了(计算图像中某个窗口内所有像素和时,计算量的大小与窗口大小无关)。总之,SURF最大的特点在于采用了Haar特征以及积分图像的概念,大大加快了程序的运行效率。
特点:角度不变性,尺度不变性
更多
ORB(Oriented FASTand Rotated BRIEF)算法是目前最快速稳定的特征点检测和提取算法,许多图像拼接和目标追踪技术利用ORB特征进行实现。
ORB采用FAST(features from accelerated segment test)算法来检测特征点,采用BRIEF算法来计算一个特征点的描述子。
特点:角度不变性,尺度不变性,计算速度快(ORB是sift的100倍,是surf的10倍)
1、OpenCV版本
‘伍’ haar系数保存
提取图像5个方向的哈尔(haar)特征并将其保存到文件中。
首先通过大量的具有比较明显的haar特征(矩形)的物体图像用模式识别的方法训练出分类器,分类器是个级联的,每级都以大概相同的识别率保留进入下一级的具有物体特征的候选物体,而每一级的子分类器则由许多haar特征构成(由积分图像计算得到,并保存下位置),有水平的、竖直的、倾斜的,并且每个特征带一个阈值和两个分支值,每级子分类器带一个总的阈值。
Haar特征分为三类:边缘特征、线性特征、中心特征和对角线特征,组合成特征模板。特征模板内有白色和黑色两种矩形,并定义该模板的特征值为白色矩形像素和减去黑色矩形像素和。在确定了特征形式后Harr-like特征的数量就取决于训练样本图像矩阵的大小,特征模板在子窗口内任意放置,一种形态称为一种特征,找出所有子窗口的特征是进行弱分类训练的基础。
‘陆’ 什么是haar特征
是哈尔特征(Haar-like features)的简称,用于物体识别的一种数字图像特征。
它们因为与哈尔小波转换极为相似而得名,是第一种即时的人脸检测运算。历史上,直接使用图像的强度(就是图像每一个像素点的RGB值)使得特征的计算强度很大。
帕帕乔治奥等人提出可以使用基于哈尔小波的特征而不是图像强度。维奥拉和琼斯进而提出了哈尔特征。哈尔特征使用检测窗口中指定位置的相邻矩形,计算每一个矩形的像素和并取其差值。然后用这些差值来对图像的子区域进行分类。
哈尔特征变换的特点:
(1) 具有尺度和位移两个特性;
(2) 变换范围窄;
(3) 其变换特性与图像中的边界或线条的特性十分接近,因此图像中的边缘和线条经哈尔变换后,会产生较大的变换系数,而其它区划的变换系数小。
在小波变换领域中,Haar函数是一种基本正交基,满足:
(1) Ψm,n是正交的;
(2) LP平方空间中任意函数都可以由Ψm,n有限性组合逼近到任意精度。
‘柒’ 图像特征提取的算法
这是实验科学,不是简单的发布在“网络知道”上就可以给出答案的。提问者想的太简单了。当然,这个项目是能做的,但是结果的好坏除了依赖于算法,还要看10万幅图片的图像质量和分类情况。
‘捌’ 第三节、图像特征提取与描述
类似于把颜色空间分段归类。
下图为一个HSV空间下的例子:
解决量化颜色直方图的稀疏的缺点:只有出现过的颜色才会在直方图里分布,相近的颜色聚在一起。避免出现大量bin的像素数量非常稀疏的情况。
考虑相似但不相同的颜色之间的相似度:(各个“零”之间离的远近:二次式方法)
比如A图有5个像素点,颜色为255;B图有5个像素点,颜色为254,;C图有5个像素点,颜色为260。
先高斯去噪(用高斯函数进行滤波),再用一阶导数获取极值。
高斯去噪的原因:极值对噪声特别敏感。
高斯函数的导数:标准差sigma代表边缘提取的尺度。
对x,y求导:两个峰分辨是横向和纵向分布。
梯度的概念:
图上每一个点都可以求出它的梯度。
X方向高斯梯度着重关注纵向边缘,Y方向高斯梯度着重关注横向边缘。重点看人物左边的那一根柱子就可以确定。
sigma代表了边缘提取的模板的尺度,比如如果边界清晰,sigma可以取得较大;如果边界模糊,sigma需要取得较小。
反过来,sigma越小,提取到的边界越清晰。
Harris角点的理解:
人眼对角点的识别通常是在一个局部的小区域或小窗口完成的。如果在各个方向上移动这个特征的小窗口, 窗口内区域的灰度 发生了较大的变化,那么就认为在窗口内遇到了角点。如果这个特定的窗口在图像各个方向上移动时,窗口内图像的灰度没有发生变化,那么窗口内就不存在角点;如果窗口在某一个方向移动时,窗口内图像的灰度发生了较大的变化,而在另一些方向上没有发生变化,那么,窗口内的图像可能就是一条直线的线段。
图中的变动是指: 小观察窗区域内图像灰度的变动 。
对于图像I(x,y)I(x,y),当在点(x,y)(x,y)处平移(Δx,Δy)(Δx,Δy)后的自相似性,可以通过自相关函数给出:
其中,W(x,y)是以点(x,y)为中心的窗口,w(u,v)为加权函数,它既可是常数,也可以是高斯加权函数。
判断Harris角点的方法:
计算并比较特征值。
计算Harris角点的步骤:
举例说明:计算Harris角点的响应值——>阈值化——>获取局部最大值点(左下图中标红点的部分)
FAST角点的概念:
求FAST角点的具体步骤:
斑点又称为拉普拉斯梯度,其定义以及算法如下:
高斯滤波的二阶导数:
高斯算子中sigma对斑点识别的影响:
斑点是什么:边界包围的部分就是斑点,如下图:
大小、方向、明暗不能作为特征描述子。
特征点的应用:
其实不够快,因此在SIFT之后产生了SURF和ORB。
这边只列一些基本的概念吧。
DoG是高斯差分空间。LoG高斯拉普拉斯尺度空间和DoG之间有一个转换关系,为了计算方便我们通常用拉普拉斯空间来替代高斯差分空间。
关键点描述子生成的解释:
(1)找到关键点;
(2)在其附近划一块区域,然后把这块区域转化成一个由梯度所描述的高维向量(即:用合理的特征来描述),以代表这个点周围的所有信息。
LoG:先进行高斯平滑,再进行拉普拉斯滤波以发现边缘和斑块。
拉普拉斯二阶求偏导,运算量很大:用差分代替微分。见下图最下面两张图:左边代表了差分,右边两条曲线是差分和微分的结果对比。
参考文献:
Harrris角点部分参考:https://www.cnblogs.com/ronny/p/4009425.html
‘玖’ 图像特征提取方法
特点:
1、局部特征
2、对旋转,缩放,亮度变化保持不变性
3、高速性
缺点:
1、局部特征
2、对边缘光滑的图像难以准确提取特征点
原理:
1、在尺度空间(例如高斯金字塔)上搜寻keypoints兴趣点(对于尺度和旋转不变)
2、筛选上一步获得的兴趣点
(1)对空间中的极值点进行精确定位
(2)用Hessian矩阵消除边缘效应3、在选定的尺度下,在兴趣点附近构造梯度方向直方图
4、对直方图进行统计,以此来描述此keypoints
总结:
这个方法是通过寻找通过高斯模糊来构造不同尺度下的高斯尺度空间金字塔,通过遍历所有点,找出尺度空间中的极值点(与26个点进行比较,分别是这一层的周围8个点,以及上下两层的9个点)。在初步探查之后,通过对尺度空间下的DoG函数进行拟合,来确定keypoints的精确位置。DoG算子的缺点是有较强的边缘效应,在消除边缘效应之后,得到的就是筛选后的精确keypoints。最后就是对找到的keypoints统计梯度方向直方图,并将其向量化。
简单来说,这个方法由于其旋转及尺度不变性,主要被应用于图片匹配的应用中。
参考链接1
参考链接2
原理:
1、图片预处理:灰度化,亮度空间标准化
2、计算图中每个像素的梯度
3、将图像划分成一个个cell
4、统计每个cell内的梯度直方图
5、将每几个cell组成一个block,将该block内的所有cell的的梯度特征串起来组成该block内的HoG特征
6、将整张图内的所有block的HoG向量串起来组成此图的HoG特征向量(可归一化)
总结:
这个方法通过设定不同大小的cell以及block作为参数,统计出整张图像的梯度特征(梯度可以反应物体的形状,边缘等特征),通过cell以及block的形式去统计局部特征。该方法配合SVM曾是图像分类任务中最为常用的。
参考链接1
参考链接2
步骤:
1、确定cell大小
2、遍历cell中的像素,将其周围的8个像素与其相比较,若大于中心像素,则对应像素标记为1,否则为0
3、统计cell中的二值直方图,全部串起来组成图像的特征向量
总结:
这个方法通过二值降维的方式,提取出了图像的纹理特征,并且有效的减少了高频噪声的影响。
参考链接
步骤:
1、构建Hessian矩阵,生成所有的边缘点
2、构建尺度空间金字塔
3、keypoints定位,对第一步生成的所有边缘点进行尺度空间中的极值筛选
4、进行SIFT中的精确定位
5、特征点主方向选择,与SIFT不同的是,SURF采用的是Harr算法中的扇形统计
6、统计4*4cell中的梯度值,并整合成特征向量
总结:
这个方法是SIFT的优化算法,通过在第一步构造Hessian矩阵选出边缘点作为第一批keypoints,减少了SIFT中所有点在尺度空间中的极值对比。同时,通过该用Harr的扇形统计并沿主方向统计特征,使得每一个cell中的向量维度由原来的128降到了64 。
参考链接