搜档网
当前位置:搜档网 › 特征点检测算法

特征点检测算法

特征点检测算法
特征点检测算法

特征点检测算法

一、SIFT(Scale Invariant Feature Transform)算法基本原理及主要特征

1、SIFT 算法基本原理

SIFT 算子是图像匹配算法中性能较好的算子,基于SIFT 算法的特征图像配准可大致分为特征的检测、描述和匹配。特征检测是在尺度空间中进行的,首先生成图像尺度空间,然后检测尺度空间中的局部极值点,再通过剔除低对比度点和边缘响应点对局部极值点进行精确定位;在对特征进行描述时,先计算每个极值点的主方向,对极值点为中心的区域进行直方图梯度方向统计,生成特征描述子;最后,通过特征描述子寻找匹配的特征,建立图像之间的联系。

1.1关键点的检测

高斯卷积核是实现尺度变换的唯一线性变换核,一幅图像在尺度空间中可表示为图像和可变高斯核函数的卷积,采用高斯金字塔(LaplacianofGaussian ,LoG )算子表示如下:

(,,)(,,)(,)L x y G x y I x y σσ=?

其中,I(x,y)为输入的二维图像,222()/221

(,,)2x y G x y e σσπσ-+=为可变高斯核函数,σ为可

变核。

图像尺度空间的形成是通过将图像与具有可变核的高斯滤波器进行卷积,从而得到图像的高斯金字塔LoG 。David 指出,高斯金字塔LoG 共分为O 组,每组S+3层,S 为σ与2σ之间的层数,S 一般取2或3。每组的高斯金字塔的形成是通过输入图像与级联滤波器进行卷积得到,下面以S=2为例,对高斯金字塔LoG 的形成过程进行详细说明。

当S=2时,每组的高斯金字塔共有5层,共由四级的级联滤波器得到。对于第一组的高斯金字塔LoG 形成过程如下图所示:

图1-1 级联滤波器的构造

如图所示,输入图像0I 由初始图像I 经高斯核为σ的滤波器得到,输出图像i I (i=1,…,4)由输入图像0I 分别经级联滤波器Ⅰ、Ⅱ、Ⅲ和Ⅳ得到。第一组高斯金字塔LoG 为图1中虚线包括的五幅图像(0,1,...,4)i I i =,每幅图像对应的高斯核为(0,1,...,4)i

k i σ=,表示图像(0,1,...,4)i I i =可看成初始图像I 经核为(0,1,...,4)i k i σ=的高斯函数得到。

第二组高斯金字塔LoG 的每层图像大小都是第一组高斯金字塔LoG 中图像大小的1/4,其输入图像是第一组高斯金字塔LoG 中第S 层图像经采样率为2的采样过程得到。当S 取

2时,第二组高斯金字塔LoG 的输入图像'

0I 为上面提到的图像1I 采样得到的。输入图像'

I 再经过四级的级联滤波器得到输出图像'(0,1,...,4)i I i =,级联滤波器的结构与第一组高斯金字塔LoG 一致,图像'(0,1,...,4)i I i =构成了第二组高斯金字塔LoG 。依此类推,共生成O=4组的高斯金字塔LoG 。

为了有效的在尺度空间检测到稳定的关键,Lowe 构造了差分金字塔DoG (DifferenceofGaussian ),它是通过对相邻层的卷积结果进行差值处理获得的,其表达式如下:

(,,)((,,)(,,))(,)(,,)(,,)D x y G x y k G x y I x y L x y k L x y σσσσσ=-?=-

图1-2给出了第一组、第二组高斯金字塔LoG 和差分金字塔DoG 的构造过程。

图1-2 高斯金字塔LoG 和差分金字塔DoG 的构造过程

如图所示,差分金字塔DoG 是由高斯金字塔LoG 相邻层相减得到的。其中,高斯金字塔LoG 共有O 组,每组共有S+3层图像;差分金字塔DoG 共有O 组,每组共有S+2层图像。每个像素点与周围8个像素点以及相邻尺度的2×9个共26个像素点比较大小,若为极大值点或为极小值点,则该像素点是候选极值点,候选极值点在每组的中间S 层中产生。当S=2时,候选极值点在差分金字塔DoG 的中间2层产生,如图中红色方框所示。

1.2极值点的筛选

经过差分金字塔DoG 中的极值检测之后,需要对候选的极值点进行筛选,得到真正的

极值点。极值点的筛选包括两部分,一个是低对比度点的抑制,另一个是边缘响应点的去除。低对比度点的抑制是指剔除响应值小于给定阈值的点,边缘响应点的去除是指将候选点中的大曲率的边缘点筛选掉。

由于差分金字塔DoG 检测到的极值点的位置坐标均为整数,而实际的特征点不一定位于整数坐标位置上。因此,在进行极值点筛选之前,先要通过三维二次函数对特征点的位置进行精确定位,再通过计算该位置的DoG 响应值及曲率来筛选得到真正的极值点。

差分金字塔DoG 在候选极值点周围的泰勒展开式如下:

200002

1()()()()()2T T D D D X D X X X X X X X X X ??=+-+--?? 其中,X=(x,y,σ)为特征点的位置和尺度信息的向量,X 0为候选特征点的位置和尺度信息的向量,D(X 0)为该点的差分金字塔DoG 值。对上式两边关于(X-X 0)求导并令一阶导数为零,则有:

212?D D X X X

-??=?? 计算差分金字塔DoG 在候选极值点处的一阶和二阶偏导数,通过上式来估计特征点与

候选极值点之间的关系。当X

的x 或y 模值超过0.5时,表明真正的特征点是偏向于周围的另外一点,此时需要对候选极值点的位置进行调整,并重新估计,直到X

的x 或y 模值均在0.5以内为止。

对特征点位置进行精确定位后,将X

代入上述泰勒展开,则有 01??()()2T D D X D X X X

?=+? 当|D X

|<0.3时,候选极值点将作为低对比度点去除。 位于图像边缘处假的特征点在边缘交叉处的主曲率较大,而在垂直方向上主曲率较小,因此可以利用这个性质除去假的特征点。Hessian 矩阵与主曲率存在比例关系,二维 Hessian 矩阵的定义如下:

xx xy xy yy D D H D D ??=????

主曲率大小的判别不需要计算Hessian 矩阵的特征值,通过矩阵的迹和行列式值的比值就可以判别。设矩阵H 的特征值为α和β,且满足αγβ=,γ为比例系数,1γ>,矩阵H 的迹和行列式值计算如下:

()xx yy Tr H D D αβ=+=+

2()()xx yy xy Det H D D D αβ=-=

将特征值的关系带入到矩阵的迹和行列式的比值中得到:

2222

2()()()(1)()Tr H Det H αβγββγαβγβγ

+++=== 以上比值随γ的增大而增大,故应将该比值设定在一定的范围内,Lowe 文章中取10γ=。

1.3 方向描述子的生成

利用关键点邻域像素的梯度分布特性来计算关键点主方向。点坐标为(x ,y)处的梯度幅值和方向分别为:

(,)M x y =

1(,)tan (((,1)(,1))/((1,)(1,)))x y L x y L x y L x y L x y θ-=+--+--

在以特征点为中心的邻域窗口内,采用梯度方向直方图表示其邻域像素的梯度方向统计值。梯度方向范围为0°~360°,其中每10°在直方图中表示一个柱,共有36柱。梯度方向直方图的峰值代表了该特征点处邻域梯度的主方向,即作为该特征点的主方向。当梯度方向直方图中存在主峰值能量80%的以上的峰值时,该峰值所对应的方向作为辅方向。特征点可以有一个主方向和多个辅方向,这样可以提高特征匹配的稳定性,Lowe 指出这些特征点所占的比重约15%左右。

特征点方向分配之后,接着生成特征描述子。以特征点为中心取16×16的窗口(特征点所在的行和列不取),每个小格代表特征点邻域所在尺度空间的一个像素,采用高斯加权(越靠近特征点的像素,梯度方向信息贡献越大)。在4×4的图像小块上计算8个方向的梯度方向直方图,绘制每个梯度方向的累加值,形成一个种子点。

一个特征点由4×4共16个种子点组成,特征描述子由所有子块的梯度方向直方图构成。因此,最终形成128维的SIFT 特征向量就是特征描述符。

图1-3给出了特征描述子的生成过程,左图绿色的方型线框大小为8×8。每个小格代表一个像素点,小格内的带箭头的直线表示像素点的梯度,直线的长度代表梯度的幅值大小,箭头指向代表梯度方向。蓝色圆型线框为进行加权的高斯核函数结构,越靠近特征点权值越大。右图为对每个4×4的子块统计形成种子点的结果,8×8的方型线框共产生4个种子点。

图1-3 SIFT 特征描述子的生成

为减少光照变化的影响,应对特征描述子进行必要的修正。光照变化可以分为线性光照变化和非线性光照变化,对特征描述子进行修正可以减少光照变化的影响。对于线性光照变化,相当于对像素点的灰度值进行了乘性和加性的常数,加性常数通过差分后将消失,乘性常数可以通过对特征描述子进行归一化消除;对于非线性光照变化,会影响梯度的幅度而对梯度的方向影响小,因此考虑先对梯度的幅度进行限幅(阈值常取 0.2),再对限幅后的特征描述子进行归一化。通过实验验证,修正后的特征描述子具有很好的光照不变性。

1.4特征描述子的匹配

特征描述子之间的匹配是通过最近邻(Nearest Neighbor ,NN )来定义的,最近邻是指特征描述子之间的欧氏距离最小。一幅图像中的特征点可能在另一幅图像中找不到匹配点,为此需要通过设置阈值来去除这些特征点。由于有些描述子比其它描述子的区分度更高,因此采用最近邻欧氏距离全局阈值并不能获得很好的效果。一个更为有效的方法是通过比较最近邻欧氏距离与次近邻欧氏距离的比值,因为对于一个可靠的匹配来说,正确匹配的最近邻特征肯定比不正确的最近邻特征要近的多。次近邻匹配可以看成在特征空间中对误匹配密度的估计,同时可以作为特征模糊的特例。通过设置欧氏距离比阈值可以去除一些错误的匹配点,但同时一些正确的匹配也有可能会被剔除。David 将该阈值设置为 0.8,这样在损失 5%的正确匹配点同时将减少 90%的错误匹配点值展。

特征点建立匹配关系之后,下一步就是求解图像之间的变换关系。仿射变换能够很好的表达图像之间的一般变换,并且最少只需要 3 对匹配点就可以求解。

2、SIFT 算法主要特征

(1) SIFT 特征是图像的局部特征,其对旋转、尺度缩放、亮度变化保持不变性,对视角变化、仿射变换、噪声也保持一定程度的稳定性。

(2)独特性好,信息量丰富,适用于在海量特征数据库中进行快速、准确的匹配。

(3)多量性,即使少数的几个物体也可以产生大量SIFT 特征向量。

(4)高速性,经优化的SIFT 匹配算法甚至可以达到实时的要求。

(5)可扩展性,可以很方便的与其他形式的特征向量进行联合。

二、SURF(Speeded Up Robust Features )算法的基本原理及其改进

1、SURF 算法基本原理

基于SURF 特征检测算法是由Bay 等人提出了。这个算法与SIFT 算法的思想非常类似,都是首先检测极值点,后确定特征点的方向,最后生成特征点。与SIFT 算法采不同的是该算法是通过Hessian 矩阵来检测极值点,这样不仅仅拥很好的鲁棒性,而且大大提高了检测特征点的速度。该算法使用了积分图像的方法。

积分图像计算的是某一个矩形区域内的像素和,通过积分图像能快速实现方框状卷积滤波(box type convolution filters)的功能。对于积分图像I 中的点(x,y),如下式所示:

(,)00(,)j y

i x x y i j I I x y ≤≤===∑∑∑ 利用上式,图2-1中任意矩形区域的面积可由散布加减操作得到:

()A D B C =+-+∑

图2-1快速积分得到图像面积

这种方法主要是利用改变图像大小却并不影响计算时间的特性,在对尺度很大的图像进行处理时占有很大优势。

1.1检测尺度空间极值

SURF算法检测特征极值点同样是通过尺度空间技术实现的,主要步骤有以下几个方面:(1)尺度空间金字塔的生成

SURF算法是利用盒子滤波(box filter)的方法来建立多尺度空间,不断将其与原始图像进行卷积操作,这个过程类似于SIFT算法利用二阶高斯函数创立多尺度空间的过程。但是两者之间的根本区别在于使用积分图像的技巧。图2-2是比较了盒子滤波与二阶高斯滤波。

图2-2二阶高斯滤波与盒子滤波的对比

其中,盒子滤波是加过权重的。在x、y方向上的滤波,对于黑色区域赋权-2,白色区域赋权值1,其余区域没有赋权值;在方向上,黑色部分赋权值-1,白色部分赋权值1。

SURF特征提取算法更为快速的主要原因是利用盒子滤波加速卷积的运算。由于SURF 算法不需要对图像在迭代的情况下进行采样,盒子滤波的结构是一块一块的,每块连续区域内都有相同的权值,然后把原始图像与各种大小不同的滤波在不同方向上进行卷积操作,从而产生了多尺度的空间函数D xx,D yy,D xy。此外,由于积分图像大小与计算量无关。所以,建立多尺度空间时,SURF特征检测比SIFT特征检测速度得到了大幅提高。

由9×9的盒子滤波计算出尺度空间金字塔的最底层,对应的是尺度s=1.2的初始尺度层,相当于δ=1.2的高斯二阶偏导滤波。假设最底层为第一层,在第一尺度空间中有4层尺度图像,第一个盒子滤波是9×9的大小,每一组中的盒子滤波都是成等差数列的,公差为6×2n?1个像素递增,其中n为层数。如图2-3所示。

图2-3尺度空间金字塔的构造

(2) 确定候选极值点

建立好尺度空间金字塔后,就是为了求得某一特定尺度下的局部极值。在SURF特征检测算法中,采用了一个非常逼近det(H)的近似表达?(H),使计算量更加的减小,如下式所示:

2(0.9)xx yy xy H D D D ?=-

该点是否为局部极值是通过?(H)的值来判断,如果?(H)的值为正,则为极值,否则不是。然后在3×3×3的立体邻域进行非极值抑制,确定符合条件的候选极值点,并记下它的尺寸和位置。

(3)消除不稳定点

虽然己经得到了极值点,但仍然需要对极值点进行筛选,将一些不稳定的极值点删去。通过在图像空间和尺度空间中极值附近的点插值去掉低对比度的点。其处理方法SIFT 算法相似,区别在于盒子滤波不用考虑边缘点。

1.2 确定特征点方向

SURF 特征点检测通过Haar 小波处理来确定特征点的方向。它分别在水平、垂直方向进行滤波,如图2-4所示。

图2-4 Haar 小波

其中,图2-4 (a) (b)的滤波器计算分别为x 方向的梯度和y 方向的梯度。Haar 小波黑色部分赋权重为1,色部分赋权重为-1。为了保持方向的不变性,每个特征点可以再构造出一个主方向,主要进行以下三个步骤的操作:

(1)计算以特征点为圆心、6δ(δ为样本点所在空间的尺度值)为半径的圆形领域内,所有特征点在x 、y 方向的Haar 小波响应向量(Haar 小波边长取4δ)。并且设定离圆心越近其高斯权值越重,这样可以更好的控制特征点的主方向。

(2)设定一个60°的扇形区域围绕圆心旋转,如图2-5所示。当扇形区域将整个圆域遍历完后可得6个扇形区域。然后计算扇形域内的响应总和,这样就得到了 6个单独局部方向矢量。

(3)在6个局部方向矢量中选择最大的矢量的方向作为主方向。

图2-5圆心角为60°的滑动扇形窗口

1.3 生成特征点描述符

为了使SURF 特征保持良好的旋转不变性需要生成SURF 特征描述符。如图2-6所示,首先将坐标轴旋转到与特征点的主方向一致,然后以特征点为中心确定一个正方形区域,最后把它等分成4×4个子区域。用Haar 滤波器对每个子区域进行处理(Haar 小波模板的尺寸

为2s ×2s ),dx 、dy 分别代表水平和垂直方向的Haar 小波变换响应。为了减少误差需要在dx 和dy 加上一个高斯权值,该高斯函数δ=3.3s 。

图2-6 SURF 特征描述符的生成

使用尺寸为2s 的Haar 小波滤波器对每个子区域在5s ×5s 的范围进行处理,得到特征点的方向dx 和dy 。通过分别对dx 、dy 、|dx|和|dy|求和,可得一个4维向量,如下式所示:

(,,||,||)sub x y x x V d d d d =∑∑∑∑

将4×4块的子区域向量连起来,就可以得到一个4×4×4=64维的向量,该向量即为该特征点的特征描述符。

得到特征描述符之后,利用其对两幅图像进行匹配,匹配的方法与SIFT 算法相同。

2、近五年SURF 算法改进外文文献综述

Linwei Ma 等[1]根据经典的SURF 算法提出了一种更加高效地特征检测算法。该算法中,根据图像的局部对称性来表示和评价图像特征。局部对称性有着尺度和转换不变性,同时对光照变化和局部噪声不敏感。该算法提出的特征描述子可将经典SURF 算法中64维向量的计算减少至16维向量的计算。局部对称性评价的定义是,在一幅强度图像中,每一个特征点和其相邻特征点间的最小距离的和。Linwei Ma 等使用该算法对一些实际图片进行了处理,并与原始SURF 算法进行了比较。

Haiyan Li 等[2]研究了SURF 算法后发现其Haar 描述子不能充分利用特征点领域的信息,为此提出了一种改进的SURF 算法。该算法通过一个3*3的掩膜窗充分利用了子块的领域信息,进而构建出更有识别度的描述子。此外,针对SURF 算法中主方向的确定太过依赖局部区域的问题,Haiyan Li 等人改进了主方向的确定。最后,结合最近距离和最近距离与次近距离的比值来匹配兴趣点。其实验证明其提出的算法具有更好的辨识度。

Zhang Huijuan 等[3]为解决利用SURF 算法匹配图像时间耗时过长,不能达到实时要求的问题,提出了一种改进SURF 的新图像匹配算法。他们用FAST (Features from Accelerated Segment Test)角点检测代替SURF 中的快速Hessian 检测来进行图像匹配。其实验证明利用这种改进的SURF 算法匹配图像可达到实时性的要求并且具有足够的精度。

Kaida Yang 等[4]根据SURF 算法提出了一种受限制的SURF 算法——RSURF 。受限制主要指两方面,一是限制特征点的提取区域,二是限制特征点的数量。他们将这种方法应用在基于视频图像的导弹位置分析和视频图像拼接上,证明了其在保证精度的同时具有很好地实时性。

Wang Dongmei 等[5]为了提高图像匹配的精度,同时降低计算的复杂性,提出了一种基于改进SURF 的快速图像匹配算法。在其算法中,首先确定图像的边缘区域,提取这些区域

的SURF特征;然后根据关键点领域的香农熵去除信息量少的点;之后生成SURF特征向量,根据拟欧氏距离匹配图像;最后利用RANSAC和最小二乘法去除假的匹配点,并确定两幅图像的匹配区域。其实验结果证明了该算法保持了SURF的鲁棒性和稳定性,同时相比SURF 具有较高的精度和较快的运算速度。

Jun Fei Li等[6]为减少传统SURF算法的耗时,提出了一种改变原描述子的改进SURF 算法。该算法用三角和对角描述子来代替Haar小波计算,然后使用基于神经网络的双重匹配方法来减少匹配错误。此外,利用从K-WMeans演变的聚类算法限制了目标区域。其实验证明了其提出的算法相比传统的SURF算法在实际应用中效果更好。

Yanling Liu等[7]在其综述中提到,SURF算法中,在计算图像积分时,如果用一个积分值代替原始图像像素值,不仅可以解决空间,而且不需要访问图像的像素值,因此计算的速度会得到提高。

三、SIFT、SURF的算法实现细节

1、SIFT算法的MA TLAB实现

利用MATLAB实现SIFT算法,其m文件见附件。

其中,可调用mf.m文件进行图片的特征点检测,并进行匹配。调用格式:

mf('1234.jpg','2234.jpg')

图3-1、3-2为分析实例。

图3-1 待匹配图片

图3-2 SIFT算法特征点检测及匹配效果

由图3-2可看出,此MATLAB程序检测到的特征点数量较多,但匹配成功的较少且存在错误。后续可对其进行改进。

2、SURF算法的MATLAB实现

利用MATLAB实现SURF算法,其m文件见附件。

其中,可运行example2.m文件实现SURF算法。待匹配图像如图3-1,匹配结果如图3-3所示。

图3-3 SURF算法匹配结果

从图3-3中可看出,利用此MA TLAB程序实现SURF算法效果一般。

参考文献:

[1] Ma L, Song Z, Zhu G. An improved SURF algorithm based local image symmetry scoring scheme[C]//Image and Signal Processing (CISP), 2014 7th International Congress on. IEEE, 2014: 264-268.

[2] Li H, Xu T, Li J, et al. Face recognition based on improved SURF[C]//Intelligent System Design and Engineering Applications (ISDEA), 2013 Third International Conference on. IEEE, 2013: 755-758.

[3]Huijuan Z, Qiong H. Fast image matching based-on improved SURF algorithm[C]//Electronics, Communications and Control (ICECC), 2011 International Conference on. IEEE, 2011: 1460-1463.

[4]Yang K, Zhao W, Li D, et al. Missile placement analysis based on improved SURF feature matching algorithm[C]//Sixth International Conference on Graphic and Image Processing (ICGIP 2014). International Society for Optics and Photonics, 2015: 94430S-94430S-6.

[5] Dongmei W, Yan S, Ming M. A Fast Image Matching Algorithm Based on Improved SURF[C]//Proceedings of the 2012 Third International Conference on Mechanic Automation and Control Engineering. IEEE Computer Society, 2012: 3643-3647.

[6]Li J F, Wang G, Li Q. Improved SURF Detection Combined with Dual FLANN Matching and Clustering Analysis[C]//Applied Mechanics and Materials. 2014, 556: 2792-2796.

[7]Liu Y, Ma S. Research on Image Based on Improved SURF Feature Matching[C]//Computational Intelligence and Design (ISCID), 2014 Seventh International Symposium on. IEEE, 2014, 1: 581-584.

交通道路标志牌检测与识别综述.

交通道路标志牌检测与识别综述 一、背景综述 随着社会科技不断发展和进步,车辆已经普及到国内大部分家庭。汽车的普及极大方便了人们的出行、生活和工作,同时也不可避免的产生了很多的交通问题。据公安部交通管理局统计,2014年1月至10月,全国共发生道路交通事故426378起,造成87218人死亡、391752人受伤,直接财产损失20.2亿元。交通安全问题成为人们日常生活中最常见的问题之一,受到了政府、科研机构以及汽车生产厂家的高度重视。 解决交通安全问题的途径之一是准确、有效地设立道路交通标志,为驾驶员提供丰富的禁令、警告、指示等信息,从而起到减少交通事故的作用。为了确保交通标志的信息能够及时、准确地传达,交通标志自动识别系统(Traffic Sign Recognition,TSR)受到了各国学者的关注,其主要功能表现在以下几个方面: (1)用于驾驶辅助。交通标志识别的概念最早就是作为驾驶辅助工具被提出的。TSR系统在识别出交通标志后,可对驾驶员进行语音或视频等方式的提醒,甚至可以在必要的时候对车辆驾驶系统直接做出控制,从而确保驾驶安全。 (2)用于交通标志维护。由于交通标志通常放置于室外环境中,受自然环境(如风吹雨淋)及人为因素(如涂抹)影响,难免出现褪色、变形甚至坠落失踪现象,需要进行定期检查维护。通常,这一工作需安排专人专岗,工作量巨大且很难保证实时性和准确性。显然,一个有效的TSR系统是完成这一工作的理想方案。 (3)用于无人驾驶技术。无人驾驶汽车在近年来受到了越来越多的关注。从上世纪90年代起,国内外相继研发出了一系列无人驾驶汽车,其智能化逐渐提高,能够自动规划路线,避让障碍物等。使无人驾驶汽车具备辨认交通标志的能力显然是使其实用化的一个重要步骤。 TSR在计算机领域中是一个非常重要的分支研究领域,而图像检测以及处理是其主要手段,这是一个难度比较大的实景图形识别问题。在车载视觉系统中,如何有效地识别道路交通标志是一个非常重要的研究课题。 TSR包括三个重要模块:图像复原、标志检测、标志分类。交通标志的外观

基于小波变换的图像边缘检测算法

基于小波变换的图像边缘检测算法仿真实 现 学生姓名:XX 指导教师:xxx 专业班级:电子信息 学号:00000000000 学院:计算机与信息工程学院 二〇一五年五月二十日

摘要 数字图像边缘检测是图像分割、目标区域识别和区域形态提取等图像分析领域中十分重要的基础,是图像识别中提取图像特征一个重要方法。 目前在边缘检测领域已经提出许多算法,但是提出的相关理论和算法仍然存在很多不足之处,在某些情况下仍然无法很有效地检测出目标物的边缘。由于小波变换在时域和频域都具有很好的局部化特征,并且具有多尺度特征,因此,利用多尺度小波进行边缘检测既能得到良好的抑制噪声的能力,又能够保持边缘的完备。 本文就是利用此方法在MATLAB环境下来对数字图像进行边缘的检测。 关键词:小波变换;多尺度;边缘检测

Abstract The boundary detection of digital image is not only the important foundation in the field of image segmentation and target area identification and area shape extraction, but also an important method which extract image feature in image recognition. Right now, there are a lot of algorithms in the field of edge detection, but these algorithms also have a lot of shotucuts, sometimes, they are not very effective to check the boundary of the digital image. Wavelet transform has a good localization characteristic in the time domain and frequency domain and multi-scale features, So, the boundary detection of digital image by using multi-scale wavelet can not only get a good ability to suppress noise, but also to maintain the completeness of the edge. This article is to use this method in the environment of MATLAB to detect the boundary of the digital image. Keywords: wavelet transform; multi-scale; boundary detection.

智能视频监控的异常检测

智能视频监控的异常检测 摘要:视频监控在国民经济中发挥着越来越重要的作用,本文在对视频监控技术的构成与发展进行研究分析的基础上,针对智能网络视频监控系统图像采集范围广、通道数量多,难以实时全面兼顾的特点,对硬件故障,图像异常检测、异常分析等若干关键技术进行了深入研究,并建立了带有自动识别报警系统的视频监控设备故障检测系统。 关键词:视频监控;异常检测;报警系统 anomaly detection of intelligent video monitor zhang guimao1,liu xiang2, liu qu2 (1 xinjiang dushanzi tianli high-tech co.,ltd.,karamay 833600,china;2 xinjiang dushanzi petrochemical company,communications company,karamay 833600,china) abstract:video monitor in the national economy is playing an increasingly important role in this paper,the composition of video surveillance technology with the development of research and analysis,based on the intelligent network video surveillance system for image acquisition range,number of channels and more difficult to fully take into account the characteristics of real-time,hardware failure,the image anomaly detection,anomaly analysis,a number of key technologies in-depth study, and the establishment of an

基于单目视觉的路面车辆检测及跟踪方法综述

第24卷 第12期2007年12月 公 路 交 通 科 技 Journal of Highway and Transportation Research and Development Vol 24 No 12 Dec 2007 文章编号:1002 0268(2007)12 0127 05 收稿日期:2006 08 01 基金项目:江苏省科技计划高技术研究项目(BG2005008) 作者简介:胡铟(1973-),男,江西南昌人,博士研究生,研究方向为计算机视觉、目标检测及跟踪 (huyinyx@163 com) 基于单目视觉的路面车辆 检测及跟踪方法综述 胡 铟,杨静宇 (南京理工大学,江苏 南京 210094) 摘要:首先介绍了车辆检测算法的3种基本组成部分:检测、验证、跟踪,然后根据算法的组成重点介绍了车辆检测以及跟踪的几种主要算法。车辆检测算法包括基于特征的方法、基于光流场的方法和基于模型的方法,车辆跟踪算法包括基于区域相关的方法、基于活动轮廓的方法、基于特征的方法和MeanShift 快速跟踪算法。根据试验结果对各种车辆检测和跟踪方法的优点、缺点以及实际应用中不同情况下适用范围的局限性进行了综合分析。最后在结论部分总结展望了文中介绍的几种车辆检测和跟踪方法的应用前景,并提出了在实际应用时的一些建议和将来的主要研究和发展方向。 关键词:智能运输系统;车辆检测;单目视觉;跟踪中图分类号:TP391 4 文献标识码:A Veh icle D etection and Tracking Based on Monocu lar Vision HU Yin,YANG Jing yu (Nanjing Universi ty of Science &Technology,Jiangsu Nanjing 210094,China) Abstract :First,the three component of the vehicle detection algori thm including detection, verification and tracking are discussed Then,the algorithm of detection and tracking are discussed with emphasis on composition The vehicle detection algorithm includes feature based,op tical flow based and model based method The vehicle tracking al gorithm includes region correlation based,active contours based,feature based and mean shift based method The meri t and di sadvantage of these algori th ms is discussed accordin g to the result of experimentation Finally,some suggestions for fu ture research and application are presented Key words :Intelligent Transport Systems;vehicle detection;monocular visi on;trackin g 0 引言 近年来随着计算机视觉技术的发展,计算机视觉 在智能交通系统中得到了广泛的应用,如交通事件及流量的监测 [1] 、路面病害检测以及智能车辆的自动导 航等。作为智能交通系统的一个方面,智能车辆利用检测和智能算法去理解车辆的即时环境,并且提示驾驶员部分或完全控制车辆的行驶。 智能车辆的应用领域可以分为: (1)为驾驶员提供建议或警告(碰撞报警)。(2)部分的控制车辆,可以是持续的驾驶辅助, 如行道线的维持,或者是紧急事件的干预,碰撞的紧急避免措施。 (3)完全的控制车辆(自动驾驶系统)。 在过去的几年中,为了研究改良安全性和防止事故的新技术,许多国家和国际间的项目开始启动。车辆事故的统计数据揭示出其他车辆是驾驶员面临的主要威胁。因此研究对驾驶员发出关于行驶环境和可能与其他车辆碰撞的警告辅助系统受到更多的关注。 利用光学传感器的车辆检测是一个极富挑战性的任务,具体说有如下需要解决的难点问题: (1)车型多样:各种形状,大小,颜色;

基于分化距离的离群点检测算法

基于分化距离的离群点检测算法 作者:刘欢, 吴介军, 苏锦旗, LIU Huan, WU Jie-jun, SU Jin-qi 作者单位:西北工业大学,自动化学院,西安,710072 刊名: 计算机应用研究 英文刊名:APPLICATION RESEARCH OF COMPUTERS 年,卷(期):2010,27(9) 参考文献(11条) 1.FAWCETT T;PROVOST F Adaptive fraud detection 1997(03) 2.HAN J;KAMBER M Data mining,concepts and technique 2001 3.ELIO L;EDGAR A Parallel algorithms for distance-based and density-based outliers 2005 4.MALIK A Local sparsity coefficient-based mining of outliers 2002 5.BREUNIG M;KRIEGEL H P;NG R T LOF:identifying density-based local outliers 2000(02) 6.ANGIULLI F;PIZZUTI C Fast outlier detection in high dimensional spaces 2002 7.杨永铭;王喆孤立点挖掘算法研究[期刊论文]-计算机与数字工程 2008(219) 8.RAMASWAMY S;RASTOGI R;SHIM K Efficient algorithms for mining outliers from large data sets 2000(02) 9.KNORR E;NG R Alogrithms for mining distance-based outliers in large datesets 1998 10.徐翔;刘建伟;罗雄麟离群点挖掘研究[期刊论文]-计算机应用研究 2009(01) 11.张云涛;龚玲数据挖掘原理与技术 2004 本文读者也读过(10条) 1.张忠平.梁永欣.ZHANG Zhong-ping.LIANG Yong-xin基于反k近邻的流数据离群点挖掘算法[期刊论文]-计算机工程2009,35(12) 2.胡彩平.秦小麟.任韧.HU Caiping.QIN Xiaolin.REN Ren局部空间离群点算法的改进及其实现[期刊论文]-中国图象图形学报A2010,15(10) 3.苏锦旗.薛惠锋.吴慧欣基于熵度量的空间邻域离群点查找[会议论文]-2009 4.赵玥基于相邻关系的聚类和离群点检测算法的研究[学位论文]2006 5.靳然然基于离群点挖掘的网络入侵检测方法研究[学位论文]2009 6.庞彦伟.刘政凯.Pang Yan-wei.Liu Zheng-kai一种自动抑制离群点的子空间学习方法[期刊论文]-电子与信息学报2008,30(1) 7.薛安荣.鞠时光.XUE An-Rong.JU Shi-Guang基于空间约束的离群点挖掘[期刊论文]-计算机科学2007,34(6) 8.张卫旭.尉宇.Zhang Weixu.Wei Yu基于密度的局部离群点检测算法[期刊论文]-计算机与数字工程2010,38(10) 9.敏玉芳基于单元格的多密度GMDBSCAN聚类算法[学位论文]2008 10.徐雪松.宋东明.张谞.张宏.刘凤玉.XU Xue-song.SONG Dong-ming.ZHANG Xu.ZHANG Hong.LIU Feng-yu基于局部线性加权的离群点检测方法[期刊论文]-计算机科学2008,35(5) 本文链接:https://www.sodocs.net/doc/9715062482.html,/Periodical_jsjyyyj201009030.aspx

目标跟踪相关研究综述

Artificial Intelligence and Robotics Research 人工智能与机器人研究, 2015, 4(3), 17-22 Published Online August 2015 in Hans. https://www.sodocs.net/doc/9715062482.html,/journal/airr https://www.sodocs.net/doc/9715062482.html,/10.12677/airr.2015.43003 A Survey on Object Tracking Jialong Xu Aviation Military Affairs Deputy Office of PLA Navy in Nanjing Zone, Nanjing Jiangsu Email: pugongying_0532@https://www.sodocs.net/doc/9715062482.html, Received: Aug. 1st, 2015; accepted: Aug. 17th, 2015; published: Aug. 20th, 2015 Copyright ? 2015 by author and Hans Publishers Inc. This work is licensed under the Creative Commons Attribution International License (CC BY). https://www.sodocs.net/doc/9715062482.html,/licenses/by/4.0/ Abstract Object tracking is a process to locate an interested object in a series of image, so as to reconstruct the moving object’s track. This paper presents a summary of related works and analyzes the cha-racteristics of the algorithm. At last, some future directions are suggested. Keywords Object Tracking, Track Alignment, Object Detection 目标跟踪相关研究综述 徐佳龙 海军驻南京地区航空军事代表室,江苏南京 Email: pugongying_0532@https://www.sodocs.net/doc/9715062482.html, 收稿日期:2015年8月1日;录用日期:2015年8月17日;发布日期:2015年8月20日 摘要 目标跟踪就是在视频序列的每幅图像中找到所感兴趣的运动目标的位置,建立起运动目标在各幅图像中的联系。本文分类总结了目标跟踪的相关工作,并进行了分析和展望。

几种常用边缘检测算法的比较

几种常用边缘检测算法的比较摘要:边缘是图像最基本的特征,边缘检测是图像分析与识别的重要环节。基于微分算子的边缘检测是目前较为常用的边缘检测方法。通过对Roberts,Sobel,Prewitt,Canny 和Log 及一种改进Sobel等几个微分算子的算法分析以及MATLAB 仿真实验对比,结果表明,Roberts,Sobel 和Prewitt 算子的算法简单,但检测精度不高,Canny 和Log 算子的算法复杂,但检测精度较高,基于Sobel的改进方法具有较好的可调性,可针对不同的图像得到较好的效果,但是边缘较粗糙。在应用中应根据实际情况选择不同的算子。 0 引言 边缘检测是图像分析与识别的第一步,边缘检测在计算机视觉、图像分析等应用中起着重要作用,图像的其他特征都是由边缘和区域这些基本特征推导出来的,边缘检测的效果会直接影响图像的分割和识别性能。边缘检测法的种类很多,如微分算子法、样板匹配法、小波检测法、神经网络法等等,每一类检测法又有不同的具体方法。目前,微分算子法中有Roberts,Sobel,Prewitt,Canny,Laplacian,Log 以及二阶方向导数等算子检测法,本文仅将讨论微分算子法中的几个常用算子法及一个改进Sobel算法。 1 边缘检测

在图像中,边缘是图像局部强度变化最明显的地方,它主要存在于目标与目标、目标与背景、区域与区域( 包括不同色彩) 之间。边缘表明一个特征区域的终结和另一特征区域的开始。边缘所分开区域的内部特征或属性是一致的,而不同的区域内部特征或属性是不同的。边缘检测正是利用物体和背景在某种图像特征上的差异来实现检测,这些差异包括灰度、颜色或纹理特征,边缘检测实际上就是检测图像特征发生变化的位置。边缘的类型很多,常见的有以下三种: 第一种是阶梯形边缘,其灰度从低跳跃到高; 第二种是屋顶形边缘,其灰度从低逐渐到高然后慢慢减小; 第三种是线性边缘,其灰度呈脉冲跳跃变化。如图1 所示。 (a) 阶梯形边缘(b) 屋顶形边缘 (b) 线性边缘 图像中的边缘是由许多边缘元组成,边缘元可以看作是一个短的直线段,每一个边缘元都由一个位置和一个角度确定。边缘元对应着图像上灰度曲面N 阶导数的不连续性。如果灰度曲面在一个点的N 阶导数是一个Delta 函数,那么就

图像中角点(特征点)提取与匹配算法

角点提取与匹配算法实验报告 1 说明 本文实验的目标是对于两幅相似的图像,通过角点检测算法,进而找出这两幅图像的共同点,从而可以把这两幅图像合并成一幅图像。 下面描述该实验的基本步骤: 1.本文所采用的角点检测算法是Harris 角点检测算法,该算法的基本原理是取以目标像素点为中心的一个小窗口,计算窗口沿任何方向移动后的灰度变化,并用解析形式表达。设以像素点(x,y)为中心的小窗口在X 方向上移动u ,y 方向上移动v ,Harris 给出了灰度变化度量的解析表达式: 2 ,,|,|,,()(x y x y x u y v x y x y I I E w I I w u v o X Y ??= -=++??∑∑ (1) 其中,,x y E 为窗口内的灰度变化度量;,x y w 为窗口函数,一般定义为2 2 2 ()/,x y x y w e σ +=; I 为图像灰度函数,略去无穷小项有: 222222 ,,[()()2]2x y x y x y x y E w u I v I uvI I Au Cuv Bv = ++=++∑ (2) 将,x y E 化为二次型有: ,[]x y u E u v M v ?? =???? (3) M 为实对称矩阵: 2 ,2 x y x x y x y y I I I M w I I I ???= ???????∑ (4) 通过对角化处理得到: 11 ,200x y E R R λλ-??= ??? (5) 其中,R 为旋转因子,对角化处理后并不改变以u,v 为坐标参数的空间曲面的形状,其特征值反应了两个主轴方向的图像表面曲率。当两个特征值均较小时,表明目标点附近区域为“平坦区域”;特征值一大一小时,表明特征点位于“边缘”上;只有当两个特征值均比较大时,沿任何方向的移动均将导致灰度的剧烈变化。Harris 的角点响应函数(CRF)表达式由此而得到: 2 (,)det()(())C RF x y M k trace M =- (6)

图像局部特征点检测算法综述

图像局部特征点检测算法综述 研究图像特征检测已经有一段时间了,图像特征检测的方法很多,又加上各种算法的变形,所以难以在短时间内全面的了解,只是对主流的特征检测算法的原理进行了学习。总体来说,图像特征可以包括颜色特征、纹理特等、形状特征以及局部特征点等。其中局部特点具有很好的稳定性,不容易受外界环境的干扰,本篇文章也是对这方面知识的一个总结。 本篇文章现在(2015/1/30)只是以初稿的形式,列出了主体的框架,后面还有许多地方需要增加与修改,例如2013年新出现的基于非线性尺度空间的KAZE特征提取方法以及它的改进AKATE等。在应用方面,后面会增一些具有实际代码的例子,尤其是基于特征点的搜索与运动目标跟踪方面。 1. 局部特征点 图像特征提取是图像分析与图像识别的前提,它是将高维的图像数据进行简化表达最有效的方式,从一幅图像的M×N×3的数据矩阵中,我们看不出任何信息,所以我们必须根据这些数据提取出图像中的关键信息,一些基本元件以及它们的关系。 局部特征点是图像特征的局部表达,它只能反正图像上具有的局部特殊性,所以它只适合于对图像进行匹配,检索等应用。对于图像理解则不太适合。而后者更关心一些全局特征,如颜色分布,纹理特征,主要物体的形状等。全局特征容易受到环境的干扰,光照,旋转,噪声等不利因素都会影响全局特征。相比而言,局部特征点,往往对应着图像中的一些线条交叉,明暗变化的结构中,受到的干扰也少。 而斑点与角点是两类局部特征点。斑点通常是指与周围有着颜色和灰度差别的区域,如草原上的一棵树或一栋房子。它是一个区域,所以它比角点的噪能力要强,稳定性要好。而角点则是图像中一边物体的拐角或者线条之间的交叉部分。 2. 斑点检测原理与举例 2.1 LoG与DoH 斑点检测的方法主要包括利用高斯拉普拉斯算子检测的方法(LOG),以及利用像素点Hessian矩阵(二阶微分)及其行列式值的方法(DOH)。 LoG的方法已经在斑点检测这入篇文章里作了详细的描述。因为二维高斯函数的拉普拉斯核很像一个斑点,所以可以利用卷积来求出图像中的斑点状的结构。 DoH方法就是利用图像点二阶微分Hessian矩阵:

文献综述

文献综述 前言 近年来,除测绘领域之外,其他行业如机械制造、建筑、医学等,对近景摄影测量技术的需求也越来越大,传统的量测相机显然已经无法满足其要求,而越来越普及的非量测相机正好可以填补这个空缺,利用非量测相机进行摄影测量具有非常远大的应用前景。非量测相机在影像获取方面具有使用简单方便、价格合理,作业效率高、适应性强等优点,但是非量测相机的主距f和像主点在像平面坐标系中的坐标(x0,y0)都是未知的,并且非量测相机存在较大的镜头畸变,因此必须先对其进行检校,然后才能进行后续的像点量测和数据处理。 所谓的相机检校是指借助于像平面上一些点在物方坐标系中的坐标,确定照相机的内、外参数,得到有效的成像模型,以达到在像平面上像素点与三维空间中的点之间建立映射的目的。广义上讲,近景摄影机检校的内容包括: 1.主点位置(x0,y0)与主距(f)的测定; 2.光学畸变系数的测定; 3.压平装置以及像框坐标系的设定; 4.调焦后主距变化的测定与设定; 5.调焦后畸变差变化的测定; 6.摄影机偏心常数的测定; 7.立体摄影机(及立体视觉系统)内方位元素与外方位元素的测定;

8.多台摄影机同步精度的测定。 对于一般相机检校任务,我们主要测定相机的内方位元素(x0,y0,f)和镜头畸变差参数(k1,k2,p1,p2),其主要的检校方法大体可以分为:光学实验室检校(Optical Laboratory Calibration)法;实验场检校(Test Range Calibration)法;作业检校(On the Job Calibration)法;自检校(Self Calibration)法;恒星检校(Stellar Calibration)法。 其中,适用于非量测相机检校的作业检校法是一种在完成某个近景测量任务中同时对相机进行检校的方法。此方法依据物方空间分布合理的一群高质量控制点,在解求待定点物方空间坐标的任务中,同时解求像片内外方位元素、物镜畸变系数。基于直接线性变换(DLT)的相机检校法,也属作业检校法的一种。 直接线性变换(direct linear t ransformation ,简称DL T) 是建立像点坐标和物点坐标直接线性关系的算法。处理时不需要相机内外方位元素的初始值,因而在近景摄影测量中被广泛应用。目前市场上,利用DLT方法进行相机检校的算法,多是在有3维控制信息的情况下,采 用3维DLT方法进行检校较多,而采用2维DLT方法的较少。利用3维控制场进行相机检校,程序虽简单,但高精度3维控制场的建立比较困难。廉价数码相机的广泛应用,促使简便、高精度的检校方法成为近年来研究的主要方向。随着摄影测量和计算机视觉理论的发展,许多学者对相机检校技术进行了深入的研究,检校用的控制场也由3维向2维转变。基于2维DLT相机标定算法的研究已成为近几年相机标定研究的热点。

行为识别国内外现状

1.原始视频的特征提取 (1)光流场 光流场是空间运动物体在观测成像面上像素运动的瞬时速度。它利用图像序列中的像素强度数据的时域变化和相关性来研究图像的灰度在时间上的变化与场景巾物体结构及其运动的关系。光流法通常假设相邻帧的图像差异非常小,从而获取对真实运动场的近似估计【31。它不用预知任何先验知识,即能提供有关运动速度及图像中运动区域的简洁描述,适用于摄像机运动的情形。但光流法易受噪声及光照变化的影响,且计算较为复杂,很难用于实时的视频监控系统。 (2)点轨迹 目标的运动轨迹也可以作为特征,从而大致推断出目标运动所属的行为类别。但图像平面上的轨迹对平移、旋转和缩放等变换比较敏感,因此在大多情形下,此特征显得不够可靠。常用的替代特征表达有轨迹速度、时空曲率等【4,51。运动轨迹的获取比较依赖于精确的跟踪算法。从原始视频中提取点轨迹特征同样容易受到噪声、遮挡及混乱背景等的影响。(3)人体形状表达 在摄像机固定的情形下,假设背景已知,通过背景剪除法可以很容易得到运动人体形状。基于全局、边界及骨架等的描绘子都可以用来表达人体形状。全局方法16,71如剪影、矩等是在整体形状区域内计算描绘子,而边界方法仅考虑形状轮廓【8l,骨架i方法则是用一组lD 骨架曲线代表一个复杂的人体形状,比如中轴变换[91等。 (4)滤波器响应 空时滤波器响应是一个广义上的分类。Zhang等【lo】存时间轴上计算高斯导数,将滤波器响应较高的区域作为运动区域。LaptevI¨1利用一组空时高斯导数滤波器将Harris角点检测扩展应用于三维的视频数据从而检测出空时兴趣点。这类方法大都基于简单的卷积操作,运算快速而简便。当视频分辨率较低的情形下,提取光流或剪影特征较为困难,利用滤波器响应特性可以从视频数据中提取有效的底层特征。 2.低层特征的描述与识别 我们将低层特征的描述与识别方法分为三类①:非参数方法、空时体方法和参数时序法,分别对现有方法进行归类,并作一个简短的综述。 2.1非参数方法 (1)模板匹配法 这类方法需要对每种行为的特征建立相应的模板,将获取的特征数据与模板相匹配,通过计算两者之间的相似度进行识别。Polana和Nelson[4刀将整个序列分解为多个周期行为,利用二维网格特征识别各种行为。Bobick和Davis[391将图像序列转换为运动能量图像(膨酣)和运动历史图像(朋m)模板,MEI反映运动覆盖的范围及强度,而MHI反映运动在时间上的变化情况。Weinland等【拍】提出运动历史体积(MHV)模板,从多个视角重建目标并将其投影到圆柱坐标系,提取Fourier变换特征以描述行为。Wang和Suter[451也将整个行为过程融合为基于轮廓的平均运动形状(MMS)和基于运动前景的平均运动能量(彳^扭)两个模板。模板匹配法计算复杂度低、实现简单,但它本身无法描述动态系统,也不能完全反映数据在空问上的分布属性,具有一定的局限性。而且不同行为之间执行速率的不同、噪声、光照等因素都会影响模板匹配的准确性。 (2)目标建模法 行为可以通过建立人体动态表观模型进行描述。常见的人体模型有棍图模型【109]、2D模型例及3D模型51。3D人体建模是最常用的人体结构表征方法,通过跟踪人体模型中主要

SUSAN检测算法概述

SUSAN检测算法 检测算法概述 概述 概述 SUSAN算法是1997年英国牛津大学的Smith等人提出的一种处理灰度图像的方法。探测算子的基本原理是:与每一图像点相关的局部区域具有相同的亮度。下面介绍SUSAN角点检测准则。 1SUSAN算子 将位于圆形窗口模板中心等待检测的象素点称为核心点。假设图像中无纹理存在,称与核心点具有一样的灰度值的区域为USAN(Univalue Segment Assimilting Nucleus)。 图(1)给出了USAN的三种典型形状: 图(1) 由图(1)可以清楚的看到,当核心点位于USAN区域内时,USAN区域面积最大;当核心点位于边 缘时,USAN区域相当于整个领域面积的一半;当核心点的USAN区域最小时,核心点是角点。利用这个原理,Smith等人提出了最小核心值相似区域 (SUSAN,Smallest Univalue Segment Assimilating Nucleus )的角点检测算法。 SUSAN算子使用的是圆形模板进行角点检测,一般使用的模板的半径为3~4个像素,如图(2)所示。

图(2) SUSAN圆形模板 将模板中的各点亮度与核心点的亮度利用下面的函数进行比较, (1) 在上式中 为图像中像素 的灰度值, t为灰度差别的阈值, 为模板中心的像素, 为其他的像素, C为比较函数。模板中所有的像素都用这个函数进行比较,然后 计算 出函数C的和值n。 (2) 和值n就是USAN(univalue segment assimilating nucleus)区域的像素个数,就是USAN区域的面积,然后把这个面积和几何阈值进行比较,得到最后的响应函数: (3) 上式中,R为响应函数,g为阈值,通常在探测角点时取值为1/2模板的像素个数,当采用7×7的模板时,g=37×1/2。

图像边缘检测算法体验步骤

图像边缘检测算法体验步骤 图像边缘检测算法体验步骤(Photoshop,Matlab)1. 确定你的电脑上已经安装了Photoshop和Matlab2. 使用手机或其他任何方式,获得一张彩色图像(任何格式),建议图像颜色丰富,分辨率比较高,具有比较明显的图像边界(卡通图像,风景图像,桌面图像)3. 将图像保存到一个能够找到的目录中,例如img文件夹(路径上没有汉字)4. 启动Photoshop,打开img文件夹中的图像5. 在工具箱中选择“矩形选择”工具,到图面上选择一个区域(如果分辨率比较高,建议不要太大,否则计算过程比较长)6. 点击下拉菜单【文件】-【新建】,新建一个与矩形选择框同样尺寸的Photoshop图像,不要求保存该图像7. 将该彩色图像转换为亮度图像,即点击下拉菜单【图像】-【模式】-【灰度】,如提示是否合并,选择“Yes”8. 将该单色的亮度图像另存为Windows的BMP文件,点击下拉菜单【文件】-【存储为】,在“存储为”窗口中,为该文件起一个名字,例如test1(保存为test1.bmp)9. 启动Matlab,将当期路径(Current Directory)定位到图像文件夹,例如这里的img文件夹10. 使用imread命令读入该图像,在命令行输入:>> f = imread(test1.bmp);11. 在Matlab中显示该图像,在命令行输入:>> figure, imshow(f)12. 然后,分别使用Matlab图像工具箱中的Edge函数,分别使用Sobel算法,高斯-拉普拉斯(Log)算法和Canny算法得到的边缘图像:在命令行输入:>> g_sobel = edge(f, sobel, 0.05); >> g_log = edge(f, log, 0.003, 2.25); >> g_canny = edge(f, canny, [0.04 0.10], 1.5);13 得到边缘图像计算结果后,显示这些边缘图像: >> figure, imshow(g_sobel) >> figure, imshow(g_log) >> figure, imshow(g_canny)14 可以用不同的图像做对比,后续课程解释算法后,可以变换不同的阈值,得到不同的边缘图像

传感器异常数据处理

异常数据处理方法研究 1异常数据处理概述 1.1 研究背景 近年来,随着海上风力发电技术的日益成熟和陆上风电可开发资源的不断减少,海上风电尤其是近海风电的开发开始加速。风机是海上风电开发的主要形式,而风机基础结构承担着抵抗海上风机结构的竖向、水平荷载和倾覆力矩的作用,其质量关系到海上风机结构的运行安全。作为隐蔽工程,其健康状况受到了社会各界的高度重视,如何对风机基础特别是MW级风机基础的安全运行状况监测成为研究领域的热点。现有的监测技术需要通过设置在风机基础中的数据采集系统自动获取基础的各状态的大量参数,如应力、应变、振动、变形等,采集到的海量原始数据通过通信网络传输到监控中心,经过数据存储,分析处理得到基础的安全运行状况和维修决策等结论。 风机基础监测系统是集结构监测、系统识别及结构评估于一体的综合监测系统,其内容包括几何变形监测、结构响应(应力、应变及振动)监测等。监测系统的质量主要取决于三方面因素:(1)传感器的灵敏性和精度以及数据传输和采集设备的性能;(2)测点的空间分布,即传感器的最优布置问题;(3)异常数据的分析处理。 从目前电子技术的发展来看,成熟、稳定、高性能的传感器已经被应用与监测系统中,而且合理安排传感器位置,以达到信息采集的最优化,也已经有很多研究成果。但由于监测信息格式复杂、信息量大,每天数据量甚至能达到十几GB,如果不能有效地对这些数据进行处理,很多异常数据将不能有效辨识,缺失信息将不能有效弥补,而且监测数据的分析必须建立在准确有效的监测数据之上,低精度和异常的监测数据常常影响数值分析的结果,会影响到系统的功能与特性分析,给后续数据处理带来很大的误差,正常信息不能得到有效利用,故有必要对原始采集数据进行处理。因此监测异常数据处理是三方面中至关重要的一点。 监测系统异常数据处理包含两个方面的内容:(1)异常数据检测,即找出异常信息并确定异常信息所在位置,根据需要将异常数据保存入专门数据库中或直接进行剔除;(2)异常数据修正,即通过插值等方法,参考数据异常点前后的数据,完成该异常数据点的修正,确保采集信息不缺失,保持原始采集数据的连续性。 异常是一个复杂的概念,迄今为止还没有一个统一定义。Hawkins提出的异常定义被大多数人所接受,其定义为:异常是在数据集中与众不同的数据,使人们怀疑这些数据并非随机产生的,而是产生于完全不同的机制。异常数据往往代

Harris角点检测算法编程步骤及示例演示

Harris角点检测算法编程步骤及示例演示 也不说那么多废话了,要介绍啥背景意义之类的,角点检测,顾名思义,就是检测角点,最简单的就是两条线的交点了,还有比如下国际象棋的棋盘格子的交点之类的,反正就是检测这些点。 简单将Harris角点检测算法的思想说下,就是拿一个小窗在图像中移动,通过考察这个小窗口内图像灰度的平均变换值来确定角点。(1)如果窗口内区域图像的灰度值恒定,那么所有不同方向的偏移几乎不发生变化; (2)如果窗口跨越一条边,那么沿着这条边的偏移几乎不发生变化,但是与边垂直的偏移会发生很大的变化; (3)如果窗口包含一个孤立的点或者角点,那么所有不同方向的偏移会发生很大的变化。 下面给出具体数学推导: 设图像窗口平移量为(u,v),产生的灰度变化为E(u,v), 有E(u,v)=sum[w(x,y)[I(x+u,y+v)-I(x,y)]^2],其中w(x,y)为窗口函数, I(x+u,y+v)为平移后的灰度值,I(x,y)为平移前的灰度值。 有泰勒公式展开可得: I(x+u,y+v)=I(x,y)+Ix*u+Iy*v+O(u^2,v^2); Ix,Iy分别为偏微分,在图像中为图像的方向导数. 因此E(u,v)=sum[w(x,y) [Ix*u+Iy*v+O(u^2,v^2)]^2], 可以近似得到E(u,v)=sum[w(x,y) [Ix*u+Iy*v]^2],即 E(u,v)=[u,v][Ix^2,Ix*Iy;Ix*Iy,Iy^2][u,v]T

令M=[Ix^2,Ix*Iy;Ix*Iy,Iy^2],因此最后对角点的检测成了对矩阵M的特征值的分析了,令M其特征值为x1,x2; 当x1>>x2或者x2>>x1,则检测到的是边缘部分; 当x1,x2都很小,图像窗口在所有移动的方向上移动灰度级都无明显变化. 当X1,X2都很大时且相当,检测到的是角点。 编程时用x1,x2不方便,因此定义角点响应函数; R=det(M)-k(trace(M))^2; 其中det(M)为矩阵M的行列式,trace(M)为矩阵M的迹。 下面给出更具数学公式实际编程的步骤: 1.利用水平,竖直差分算子对图像的每个像素进行滤波以求得 Ix,Iy,进而求得M中的四个元素的值。 M=[Ix^2,Ix*Iy;Ix*Iy,Iy^2] 2.对M的四个元素进行高斯平滑滤波,为的是消除一些不必要 的孤立点和凸起,得到新的矩阵M。 3.接下来利用M计算对应每个像素的角点响应函数R,即: R=det(M)-k(trace(M))^2; 也可以使用改进的R: R=[Ix^2*Iy^2-(Ix*Iy)^2]/(Ix^2+Iy^2);里面没有随意给定的参数k,取值应当比第一个令人满意。 4.在矩阵R中,同时满足R(i,j)大于一定阈值threshold和R(i,j)

配准综述

图像配准是对取自不同时间,不同传感器或者不同视角的同一区域的两幅或者多幅图像进行匹配叠加的过程。随着技术手段的不断发展,人们对图像配准的要求也越来越离。包括配准方法的鲁棒性、算法的难易程度、算法的自主性等都是考量算法的指标。图像配准的方法中,有人提出过被广泛认同的四个巧骤: a.特征空间的选择 特征空间是指将运用到配准中元素的集合。特征空间包括很多方面,比如像素值,比如点、线,或者平面甚至是曲面。 b.搜索空间 搜索策略是指一系列配准变换操作的集合。搜索空间是建立在几何形变基础上的。而几何形变一般包括全局的和局部的几何形变。典型的全局变形包括平移,缩放,扭曲等变形以及它们的组合。而局部形变,对变换参数要求比较苛刻,因为某一套变换参数只能作用在局部形变区域,而其余区域需采用插值技术补充。然而,另外的变形区域则需要另外的变换参数去表述。在一般的处理中,我们将变换模型看成是一种先验知识。不然则需要考量所有的变换模型。 c.搜索策略 搜索策略是实施变换的依据。它的存在是为了找寻变换模型的最优解。常用的搜索策略有松弛模型法、牛顿法和共扼梯度法。 d.相似性度量 相似性度量是对采用的变换模型的评价。相似性度量主要是采用参考图像和配准图像之间的共有的特征之间的差异比较的方法来评价配准的情况。这其中的差异可以包括点位的误差,或者是灰度值相关的差异,还可以是在变换域之间的差异值等等。最常见的相似性度量是检测特征的欧氏距离。 上述的几个步骤构成了图像配准的基本框架。许许多多的算法充斥其中产生了种类繁多的配准方法。下面主要介绍下几种典型的配准算法。目前典型的配准算法中大致可分成基于灰度、基于特征和基于模型的方法。 基于灰度的配准算法 基于灰度的算法中,重点是对图像配准的过程上,而不是特征集的选择

异常声音检测识别研究背景意义及现状

异常声音检测识别研究背景意义及现状 1研究背景 (1) 2声音的检测识别的发展和现状 (1) 2.1声音识别技术的发展 (1) 2.2国外研究现状 (2) 2.3国内现状综述 (3) 3研究异常声音识别的意义 (4) 1研究背景 随着人类社会的进步,人们的生活水平有了较大的改善;然而复杂的社会负面因素,酝酿了许多不安全因素并导致了犯罪率的上升。随着城市化进程的加速,不安全因素对国家和人民生命财产安全的威胁日益加重。安全问题已经成为社会关注的焦点。随着信息化和网络化技术的发展,安全监控在国防和社会安全中所起的作用越来越突出。声音信号在日常生活中分布非常广泛,包含信息量大,也是人类交流的基本方式。声音传播媒介多种多样分布非常广泛,同时声音信号的获取也较为方便。公共场所的异常声音能够有效的揭示和表征异常状况以及突发事故,受到人们越来越多的关注。 2声音的检测识别的发展和现状 声音是由物体的振动产生的,并通过传播媒介传播开来。声音检测技术识别可以分为两个主要的方面:一个是语音信号检测识别技术(主要指语音识别技术);另一个是非语音声音信号的检测识别技术。 2.1声音识别技术的发展 语音识别的研究工作大约开始于五十年代,当时AT&T Bell实验室实现了第一个可识别十个英文数字的语音识别系统—Audry系统。 六十年代,计算机的应用推动了语音识别的发展。这时期的重要成果是提出了动态规划(DP)和线性预测分析技术(LP),而后者较好地解决了语音信号模型的问题,对语音识别的发展产生了深远影响。 七十年代,语音识别领域取得了突破。在理论上,LP技术得到进一步发展,动 态时间规整技术(DTW)基本成熟,特别是提出了矢量量化(VQ)和隐马尔可夫模型(HMM)理论。在实践上,实现了基于线性预测倒谱和DTW技术的特定人孤立语音识别系统。 八十年代语音识别研究的重点是连续语音识别,各种连续语音的识别算法Lee 和Rabiner、Myers实验室的:Bell提出的二层动态规划算法NEC被开发,如. 等人提出的分层构造算法,以及帧同步分层构造算法等。同时,研究方向从基于模板匹配技术转向基于统计模型技术,不再追求刻意细化语音特征,而是从整体

相关主题