搜档网
当前位置:搜档网 › 运动估计算法比较

运动估计算法比较

运动估计算法比较
运动估计算法比较

大作业

几种运动估计算法比较

一、实验内容

简要介绍各种运动估计算法,并比较不同运动估计算法的性能,主要考虑各算法的运算速度和精度。

二、实验背景

视频原始图像中存在着大量的信息冗余,如时间冗余、空间冗余、信息熵冗余、谱间冗余、几何结构冗余、视觉冗余和知识冗余等等。运动估计是视频压缩编码中的核心技术之一,采用运动估计和运动补偿技术可以消除视频信号的时间冗余以提高编码效率。如何提高运动估计的效率,使运动估计算法的搜索过程更健壮、更快速、更高效成为目前研究的热点。

运动估计的基本思想是尽可能准确地获得序列图像帧间的运动位移,即运动矢量。因为运动估计越准确,预测补偿的图像质量越高,补偿的残差就越小,补偿编码所需位数越少,需要传输的比特率就越小。利用得到的运动矢量在帧间进行运动补偿。补偿残差经过变换、量化、编码后与运动矢量一起经过熵编码,然后以比特流形式发送出去。

运动估计算法多种多样,大体上可以把它们分成四类:块匹配法、递归估计法、贝叶斯估计法和光流法。其中块匹配运动估计算法因其具有算法简单、便于VLSI实现等优点得到广泛应用。所以本文将重点介绍块匹配运动估计算法,并对各种块匹配算法在计算速度和估计精度上进行简单比较。

三、实验原理

(一)、像素递归技术

像素递归技术是基于递归思想。在连续帧中像素数据的变化是因为物体的移位引起的,郑么如果沿着梯度方向在某个像素周圈的若干像素作迭代运算,运算会最后收敛于一个固定的运动估计矢量,从而预测该像素的位移。

(二)、块匹配运动估计

块匹配运动估计是把图像帧划分为若干互不重叠的块,并以块为单位寻找目标帧中每块在参考帧(上一帧或者其它帧)中最优匹配的块的相对位置,假设图像中每块的大小为M

×N,dxmax为参考块水平方向可搜索最大位移而dymax为参考块垂直方向可搜索最大位移那么基于块匹配的运动估计就是在参考帧(或者其它上一帧)的(M+2dxmax)×(N+2dymax)候选区搜索窗口中找到和目标帧的当前大小为M×N的块的最匹配的块则参考块的运动矢量可用如下的数学公式描述:

R 表示相关性评价函数,f(m,n)表示目标或当前帧图像的灰度值。满足R为最大时的X、Y为运动矢量,用MV表示。

块匹配估计准则是判断块相似程度的依据,因此匹配准则的好坏直接影响了运动估计的精度;另一方面,匹配运算复杂度、数据读取复杂度和内存管理复杂度在很大程度上取决于所采用的块匹配准则。我们这里用到的块匹配准则是:

平均绝对误差函数(Mean of Absolute Error, MAE)

有些文献中MAD演变为绝对差和:

在上述匹配准则中,由于SAD只采用了加法和绝对值计算,便于计算和硬件实现而且它的匹配精度与MAD相差不大。

此外搜索精度还与块的大小、搜索窗的大小、搜索步长有关。

块匹配的方法主要有:三步法(TSS)和二维对数法(TDL)、新三步法(NTSS)、四步法(FSS)、基于菱形的搜索算法(DS)和基于六边形的搜索算法(HEXBS)等。其中全搜索算法是简单也是效果最好的一种匹配算法,通过的全搜索匹配得到的结果是全局最优的,但由于计算量很大,我们在编解码中往往不采用这种方法,而只把他作为与其他算法的一种比较。为了兼顾估算精度和运算速度,人们提出了一系列的快速算法。快速算法通过限制搜索位置的数目来减小计算复杂度,但不利于估计小的运动且搜索容易陷入局部最优。下面我们将详细介绍各种基于块的匹配算法。

快速算法基于一下假设:认为误差函数在整个搜索区域内有唯一极小值点,并假设误差

函数曲面值随偏离最小值点距离是单调递增的。

另外运动矢量还满足中心偏执性。即块的运动矢量基本上都是在一个中心位置集中了绝大部分运动矢量,而且随着运动矢量的位置远离中心其数逐渐减少。通过对常用视频序列的运动矢量分布作了更为详细的统计分析发现,运动矢量以不同的比例集中分布在中心附近的特定区域内。如下图:有大约81.80%的运动矢量分布在中心附近范围2的正方形区域内(25个点),大约77.52%的运动矢量分布在中心附近范围2的菱形区域内(13个点),更有大约74.76%的矢量集中分布在中心附近范围2的十字形区域内(9个点)。

(1)、全搜索运动估计(FS)

全搜索法(Full Search Method, FS )也称为穷尽搜索法,是对(M +2dx )×(N +2dy )搜索范围内所有可能的候选位置计算MAD (i,j)值,从中找出最小MAD ,其对应偏移量即为所求运动矢量。此算法虽计算量大,但最简单、可靠,找到的必为全局最优点。

FS 算法描述如下:从原点出发,按顺时针螺旋方向由近及远,在逐个像素处计算MAD 值,直到遍历搜索范围内听有的点,然后在计算的所有点的MAD 中找到最小值,该点所在位置即对应最佳运动矢量。

但是正因为它是穷尽搜索因此会产生巨大的计算量如[ 7, 7]的搜索区间每个宏块16*16 需计算225个MAD 值,这就直接制约了编码的实时实现。快速算法本质上是一种穷尽搜索法其计算量仍是相当巨大的。

全搜索算法是简单也是效果最好的一种匹配算法,通过的全搜索匹配得到的结果是全局最优的,但由于计算量很大,我们在编解码中往往不采用这种方法,而只把他作为与其他算法的一种比较。

(2)、快速匹配算法

1、三步法:

三步法是应用得相当广泛的一种次优的运动估计搜索算法它的搜索区间一般为[-7,7] 即在候选区中与编码块相同坐标位置处为原点,将参考块在其上下左右距离为7的范围内按照一定规律移动移到一个位置就做匹配计算它总共进行了三步搜索在下一次搜索时步长减半以前一步搜索得到的最优点为中心。下图为三步法的搜索示意图。

算法的中心思想是,采用一种由粗到细的搜索模式,从原点开始,按一定步长取周围8个点构成每次搜索的点群,然后进行匹配计算,利用上一步搜索得到的最小块误差MBD 点作为当前搜索的中心位置,每做一步,搜索的步长减1。

步搜索算法搜索窗选取(-7,+7),最多只需要做25个位置的匹配计算,相对于全搜索来比,大大减少了匹配运算的复杂度,而且数据读取比较规则。

2、新三步法:

TSS 假定运动矢量分布特点是在搜索窗口中均匀分布, 但事实证明运动矢量是偏置中心的,Renxiang Li 等人在TSS 的基础上提出了一种增强运动矢量中心偏置搜索和减小补偿误差的新三步法。

NTSS 是对TSS 的一个改进,对运动量比较小的视频序列如可视电话序列有比较好的性能。对于绝大多数的视频序列,运动矢量的分布都是在中心位置上的概率最大,随着与中心位置的距离的增大,概率会急剧地下降,这也就是前面所说的运动矢量的中心偏移特性。运动量比较小的视频序列的这一特性会更加明显。

NTSS 算法在最好的情况下只需要做17个点的匹配,在最坏的情况下需要做33个点的匹配,由于运动矢量中心偏置在现实视频序列中是普遍存在的,在通常情况下,NTSS 算法需要做33

点匹配的概率比

较小,因此,在低速率视频应用中,如视频电话或视频会议中,NTSS 算法的优点可以得到较好的发挥。

3、四步法:

四步法Four Step Search 4SS 由Po Lai-man Ma Wing-chung 等人提出。FSS 也是基于视频序列图像的运动矢量的中心偏置特征,以原点为中心,在5*5大小的正方形中构造9个检测点的搜索模型。每一步将搜索模型的中心移向MBD 点处,且后两步搜索模式取决于MBD 点的位置。与NTSS 一样,当运动较小时,FSS 也会很快结束搜索过程,只需要2到3步即可。

新三步搜索法考虑了块矢量中心偏置的特性,在初步搜索时对中心周围的位置同时做了匹配运算。在物体做小范围运动时,这种改进很见效,可以大大减少运算量。然而,在物体做大范围运动时,这种改进却带来了额外的运算量,因为新三步算法最多需要做33次运算,而三步算法最多只需要做25次运算。四步搜索法考虑到了块的中心

匹配的特性,同时兼顾了物体的大范围运动。这种改进在物体既有小范围运动又有大范围运动时可以得到较好的性能。实验的结果表明4SS 算法比TSS 算法有更好的性能,与NTSS 算法有相似的性能。但在物体大范图运动时,4SS 算法有更强的鲁棒性。

4、菱形搜索法:

菱形搜索(DS)算法于2000年被提出,经过多次改进,已成为目前快速块匹配运动估计算法中性能最好的算法之一。

搜索模板的形状和大小不但影响整个算法的运行速度,而且也影响它的性能。块匹配的误差实际上是在搜索范围内建立了误差表面函数,全局最小点即对应着最佳运动矢量。由于这个误差表面通常并不是单调的,所以搜索窗口太小,就容易陷入局部最优,例如BBGDS 算法,其搜索窗口仅为

3

×3 ;而搜索窗口太大,又容易产生错误的搜索路径,像TSS算法的第一步。另外,统计数据表明,视频图像进行运动估计时,最优点通常在零矢量周围。

当物体相对静止,运动矢量较小时,DS算法进行的运算要明显少于上述其他算法,我们以4SS算法为例,假设当运动矢量范围为l时,4SS算法需要搜索17各位置,而DS算法最少需要搜索13个位置,最多只需要搜索16个位置。矢量范围加大时,DS算法需要进行搜索的位置数明显要少于4SS算法。实验的结果表明DS算法在性能相当情况下比4SS算法的速度快31%。

5、基于块的梯度下降搜索算法:

基于块的梯度下降搜索法(BBGDS)是1996年由Lurng-Kuo Li 和Ephraim Feig提出的。该算法采用了一个非常偏向于中心位置的搜索模式—步长为1的9点搜索,如图2-7 所示。它不限制搜索的步数,当某一步的最小BDM点位于中心位置或该步已到达搜索窗口的边缘时,则停止搜索。与FSS 的某些搜索步骤一样,BBGDS的每个后续搜索步骤都是增加3个

或5个搜索点。这个算法非常适合于小运

动量的场合。

在每一步搜索过程中,BBGDS 算法使

用了中心匹配块而不是匹配块,降低了陷

入局部最优的可能性。利用梯度下降的方

向来指导搜索方向,对该方向进行重点搜

索,从而减少和避免了不必要的搜索,大

大降低了算法的复杂度。

基于块的梯度下降搜索算法

四、实验步骤

具体实验步骤如下:

读入视频两帧图像,分别采用上述各种运动估计方法计算运动矢量补偿出预测图像,分析比较各种算法性能。

五、实验结果分析

我们取视频的第1和第3帧进行各种运动补偿。实验参数如下:

块大小16x16;搜索范围dmax=7;搜索精度:1像素;视频大小720*400。

运动估计结果:

参考帧 当前帧

预测图像 补偿误差

Matlab 运行时间是:3.963858。 重构图像PSNR 值:38.0220

(二)、三步法运动估计 运动估计结果:

预测图像 补偿误差

Matlab 运行时间是:0.909280。 重构图像PSNR 值:35.4990。

运动估计结果:

预测图像 补偿误差

Matlab 运行时间是:0.900035。 重构图像PSNR 值:37.2834。 (四)、四步法运动估计 运动估计结果:

预测图像 补偿误差

Matlab 运行时间是:0.948070。 重构图像PSNR 值:37.4156。

(五)、菱形法运动估计 运动估计结果:

预测图像 补偿误差

Matlab 运行时间是:1.178112。 重构图像PSNR 值:37.7799。

(六)、基于块的梯度下降搜索算法

运动估计结果:

预测图像补偿误差

Matlab运行时间是:0.853036。重构图像PSNR值:37.6766。

结果分析:

通过实验我们得到各种各种匹配算法的Matlab执行时间、重构图像和重构图像的PSNR 值。Matlab执行时间反映了算法的执行效率;图像重构PSNR反映了图像恢复的质量,反映了算法的估算精度。

各种各种匹配算法的Matlab执行时间、重构图像的PSNR值如下表:

从表中分析和恢复出来的图像,显然全搜素匹配是恢复效果最好的,块匹配运动估计算法中搜索精度最高的是全搜索法,这显然跟全搜索算法对搜索范围内的每一个象素点进行匹配运算以得到一个最优的运动矢量有关,它是全局最优的。但它的计算复杂度太高,matlab 运行时间最长,是其他快速匹配算法的3~4倍,不适合实时应用。

而快速匹配算法是在运算精度和运算速度之间的折中,给中快速匹配算法都大大节省了匹配计算量,但是这是以牺牲计算精度为前提的,我们看到快速算法的重构图像PSNR值不如全搜素大,实际恢复出来的图像质量也不如全搜索在细节上清晰,但肉眼几乎不能分辨。在实际应用中我们可以采用快速算法实现运动估计。

各快速匹配算法之间的性能也是有区别的,我们看到菱形算法、基于块的梯度下降搜索算法和四步法估计精度最接近全搜索的结果,这和运动矢量分布的中心偏置有关,即块的运动矢量基本上都是在一个中心位置集中了绝大部分运动矢量,而且随着运动矢量的位置远离中心其数逐渐减少,提高搜索速度和预测的准确性,所以采取十字搜素算法、菱形算法等更容易快速高效的找到个块的匹配块。

六、参考文献

[1] 蒋晓悦,赵荣椿. 几种块匹配运动估计算法的比较[学术期刊].计算机用研究2004

[2] 陈磊. 视频编码中快速块匹配运动估计算法的研究. [学位论文],2008.05

[3] 佚名. 基于块匹配的视频图像运动估计技术研究.

运动估计算法比较

大作业 几种运动估计算法比较 一、实验内容 简要介绍各种运动估计算法,并比较不同运动估计算法的性能,主要考虑各算法的运算速度和精度。 二、实验背景 视频原始图像中存在着大量的信息冗余,如时间冗余、空间冗余、信息熵冗余、谱间冗余、几何结构冗余、视觉冗余和知识冗余等等。运动估计是视频压缩编码中的核心技术之一,采用运动估计和运动补偿技术可以消除视频信号的时间冗余以提高编码效率。如何提高运动估计的效率,使运动估计算法的搜索过程更健壮、更快速、更高效成为目前研究的热点。 运动估计的基本思想是尽可能准确地获得序列图像帧间的运动位移,即运动矢量。因为运动估计越准确,预测补偿的图像质量越高,补偿的残差就越小,补偿编码所需位数越少,需要传输的比特率就越小。利用得到的运动矢量在帧间进行运动补偿。补偿残差经过变换、量化、编码后与运动矢量一起经过熵编码,然后以比特流形式发送出去。 运动估计算法多种多样,大体上可以把它们分成四类:块匹配法、递归估计法、贝叶斯估计法和光流法。其中块匹配运动估计算法因其具有算法简单、便于VLSI实现等优点得到广泛应用。所以本文将重点介绍块匹配运动估计算法,并对各种块匹配算法在计算速度和估计精度上进行简单比较。 三、实验原理 (一)、像素递归技术 像素递归技术是基于递归思想。在连续帧中像素数据的变化是因为物体的移位引起的,郑么如果沿着梯度方向在某个像素周圈的若干像素作迭代运算,运算会最后收敛于一个固定的运动估计矢量,从而预测该像素的位移。 (二)、块匹配运动估计 块匹配运动估计是把图像帧划分为若干互不重叠的块,并以块为单位寻找目标帧中每块在参考帧(上一帧或者其它帧)中最优匹配的块的相对位置,假设图像中每块的大小为M

运动估计算法简述

运动估计算法简述 标签:搜索运动估计预测矢量算法分类:探索H.2642007-02-03 13:59 马上要做运动估计算法,重点整理了一下这方面的内容。 帧间预测编码可以简单地分为单向预测、双向预测、多帧预测。而H.264 标准采用了多帧预测,参考帧可达5—15帧。 运动补偿采用较多的有运动矢量估计[重叠块运动补偿(OBMC)]、全局运动估计、基于象素点的运动估计、基于区域的运动估计、基于网格的运动估计。1.单向预测原理:将重建帧和参考帧送运动参数估值器(ME)比较得到运动矢量,再将运动矢量和重建帧送到运动补偿预测器中,得预测帧Ft^(x,y)。 Ft^(x,y)=Ft(x+i,y+j) 其中(i,j)即MV 2.基于块匹配算法的运动矢量估计 简单地说就是以块为单位分配运动矢量。在前一帧搜索区(M+2Wx,M+2Wy)内找到与当前帧块相匹配的块,位移d(i,j)即为运动矢量。 常用的块匹配准则有:均方误差(MSE)最小准则,绝对误差均值(MAD)最小准则、NCCF准则。 搜索方法: a.穷尽搜索计算(2Wx+1)×(2Wy+1)个MAD值,全局最优,计算量大。 b.快速搜索 (1)分层的和多分辨率的快速块匹配方法 (2)基于连续消除的快速块匹配方法 (3)固定搜索模式的快速块匹配方法(e.g.三步搜索法) (4)基于时空相关性和视觉特性的快速块匹配方法

3.重叠块运动补偿(OBMC) 为解决方块效应特别是运动矢量估计不准确或物体运动不是简单的平移运动以及一个块中有多个不同物体运动时的问题,采用OBMC方法,即一个像素的预测不仅基于其所属块的MV估计,还基于相邻块的MV估计。 4.运动估计 ?运动表示法: (1)基于块的运动表示法 帧间宏块分割区域大小的选择:大分区,表征MV的选择和区分割类型的比特数较少,但运动压缩的冗余度较高,运动补偿残差在多细节区域能量很高。小分区,运动补偿残差能量较低,但需要较多的表征MV的选择和区分割类型的比特数,运动压缩的冗余度较低。 一般策略:平缓区域大分区,多细节区域小分区。 树状结构运动补偿,宏块和子宏块各4种分割方法。 色度成分均为量度成分水平、垂直尺寸的1/2。 (2)亚像素位置的内插 亚像素运动矢量:亮度精度1/4,色度精度1/8 对亮度成分,用六抽头滤波器对整数像素点内插:左右相邻的6个像素的加权均值得1/2像素点,然后是线性滤波得到1/4像素点。 对色度块以类似方法得到1/4像素点,再次进行线性内插就得到1/8精度MV. (3)运动矢量在时空域的预测方式 空间 (1)运动矢量中值预测 (2)空间域的上层块模式运动矢量(最优) 时间 (1)前帧对应块运动运动矢量预测 (2)时间域的临近参考帧运动矢量预测 (4)匹配误差在时空域上的预测方式 H.264定义的匹配误差函数 J(MV,λMOTION)=SAD(s,c(MV))+λMOTION×R(MV-PMV)。 匹配误差在时空域的预测方式与运动矢量类似 空间 (1)中值预测 (2)上层预测 时间 (1)前帧对应块的预测 (2)时间域的临近参考帧预测(最优) ?运动估计准则分类: (1)MSE最小(2)MAD最小(3)NTD ——子集匹配法大大减少每帧图像的平均搜索时间 ?运动搜索算法 (1)全局搜索算法 (2)分数精度搜索算法 (3)快速搜索算法 1)二位对数搜索法 2)三步搜索法

各种运动检测算法的总结

各种运动检测算法的总结 赵晓梅 2013.11.5 1. 帧差法算法:),1,,(I ),,(I -t y x t y x ,前一帧图片为设当前帧图片为 ,差值图像)1,,(I ),,(I ),,(d --=t y x t y x t y x 输出图像TH t y x d otherwise t y x output >=),,(,1,0{),,(。 2. 对称帧差法:。 、、设连续三帧图片分别为)1,,(I ),,(I )1,,(I +-t y x t y x t y x )1,,(I ),,(I 1--=t y x t y x d 相邻两帧图片做差: ),,(I )1,,(I 2t y x t y x d -+= 2121b b d d 和换为二值图像按照帧差法中的方法转和将差值图像 ),(&),(),(21y x b y x b y x output =。 3. 平均算法: , 计算整段视频的平均帧),(y x u 。 然后将差值图像二值化差值图像),,(),,(I ),,(y x u t y x t y x d -= 4. 单高斯背景模型: 将图像中每一个像素点的颜色值看成是一个随机过程,并假设该点的某一像素值出现的 概率服从高斯分布。 。 、、,分别表示为增加一个变量故以上参数的变量中再参数有不同的值,的,所以不同时刻以上读入,参数是不断更新由于随着新的帧图片的, ,方差为,标准差为处像素的均值为设),,(),,(),,(),(),(),(),(22t y x t y x t y x u t y x y x y x u y x σσσσ

) 1,,()1,,(),,(I ,0,1{),,(-?<--=t y x t y x u t y x otherwise t y x output t σλ中的像素值为时刻,该点在输出图像 下:各参数的初始化方法如 。 init std y x init std y x y x y x u _)0,,(,_)0,,(), 0,,(I )0,,(2===σσ (关于std_init 的含义:通常设置为20,本人猜测是个经验值,后期将尽量 找到设置该值的理论依据。) :各参数的更新方法如下 ) ,,(),,(,)],,(),,(I [)1,,()1(),,(), ,,()1,,()1(),,(22 2 2 t y x t y x t y x u t y x t y x t y x t y x u t y x u t y x u σσασασαα=-?+-?-=?+-?-= (关于α的含义:α是更新速率,该值可以自己随意设置。) 关于参数初始化和更新方法的自己的思考: 1. 初始图像即第一帧图像,所以每一点像素的均值为第一帧图像的像素值。 2. 初始标准差值猜测是个经验值,目前查阅一些资料没有找到设置该值的理论依 据。 3. α是更新速率,与均值和方差的计算方法本身无关。 4. 高斯模型的关键是采用高斯分布作为概率密度函数模型,而不是参数是如何得 来的,所以,我个人为,参数的计算方法只要合理并且效果好就可以,方法不局限于一 种,不过目前还没查找到其他方法。 5. 混合高斯模型算法步骤: (1)像素模型的定义: 每个像素由多个单模型描述:}...,2,1],,{[)(2 ,,,K i m w p P t i t i t i ==σ。K 的值一般在 3~5之间。其中, 11 ,=∑=K i t i w 。 三个参数(权值、均值、方差)确定一个单模型。 (2)像素模型参数的修正 Step1: 如果新像素满足:1,1,--?≤-t i t i t m p σλ,则,新像素与该单模型匹配。如果,存在与新像素匹配的单模型,进入Step2;否则,进入Step3。(λ为常数,实验中取3)。 Step2:完成Step2直接转入Step4。 ① 修正与新像素匹配的单模型的权值,权值增量为)1(w dw -?=α。 ② 修正与新像素匹配的单模型的均值和方差。

快速而有效的块运动估计算法

第!"卷第#期$%%&年#月 计算机研究与发展 ’()*+,-(./(01)23**343,*/567383-(103+289:;!"<+9;# ’=>?$%%&原稿收到日期@$%%%A %B A &%C 修改稿收到日期@$%%%A &%A &% 本课题得到国家D 八六三E 高技术研究发展计划基金资助F "#!A !&B A %&A &%A G G H 快速而有效的块运动估计算法 肖德贵 余胜生 周敬利 F 华中科技大学计算机科学与技术学院武汉 I !%%B I H F J K L 9M N O$#!P >?Q H 摘要 为了提高基于块匹配的运动估计的速度和精度<提出了一种带中心偏置点检测模式的自适应快速块运动 估计算法P 该算法根据图像序列的运动向量基于中心偏置分布的特点和相邻块运动向量间的高度相关性<依据块的不同运动内容来确定其搜索起点R 搜索范围和搜索策略<从而实现块运动向量的快速而有效地估计P 同时<对于大运动块<采用了多候选者方式<进一步提高了搜索精度P 实验结果表明<该算法的搜索速度接近+!44<+I 44 <而搜索精度比它们高<与544相似<接近.4S 0P 关键词 块匹配<运动估计<视频压缩 中图法分类号 21 %G &TU T V WT X YZ U U [\[Z X W]^_\‘a_W [_X Z V W [aT W [_X T ^b _c [W d a e f ,(7?A g =K N A 4i ?>N Mj 5()’K >N A -K F k l m n n o n pq n r s t u v w k l x v y l v z y {|v l m y n o n }~9-M ?-Q 9.L /?0:91/.9Q K 9>?2Q K .L Q K 9>3L 2Q ?-L >M .9-?L 11=-L Q ?Q L >M L M L 4Q K 5?0:91/.9Q K 9>?2Q K .L Q K 9>L :N 9-K Q i .6K Q i 1?>Q ?-A 0K L 2?M 49K >Q ?-A M ?Q ?1Q .9M ?K 2M ?21-K 0?M K >Q i K 24L 4?-P S L 2?M 9>Q i ?1i L -L 1Q ?-K 2Q K 1931?>Q ?-A 0K L 2?M M K 2Q -K 0=Q K 9>93K .L N ?2?7=?>1?28.9Q K 9>5?1Q 9-2L >Mi K N i 19--?:L Q K 9>93L M 9L 1?>Q 0:91/28.9Q K 9>5?1Q 9-2?2Q K .L Q K 9>3L 2Q L >M?33K 1K ?>Q ::0:L M L 4Q K 5?::M ?Q ?-.K >K >N 2?L -1i9-K N K >2<2?L -1i -L >N ?2L >M 2?L -1i .?L 2=-?293M K 33?-?>Q 0:91/2P ,Q Q i ?2L .?Q K .??2Q K .L Q K 9>L 11=-L 1:K 2K .4-95?M 6i ?>.=:Q K A 1L >M K M L Q ?.9M ?K 2L 44:K ?M Q 9Q i 92?0:91/26K Q i :L -N ?M K 24:L 1?.?>Q 2P 2i ?2K .=:L Q K 9>-?2=:Q 22i 96Q i L Q Q i ?2?L -1i K >N 24??M939=-L :N 9-K Q i .K 21:92?Q 9Q i L Q 93+!44L >M+I 44MQ i ?.L Q 1i K >NL 11=-L 1:K 22K .K :L -Q 9Q i L Q 93544L >M 1:92?Q 9Q i L Q 93.4S 0P ‘;<=>*?(0:91/.L Q 1i K >N <.9Q K 9>?2Q K .L Q K 9><5K M ?919.4-?22K 9> @引 言 运动补偿编码已广泛应用于数字视频压缩中< 并已被多种压缩标准采用A &B P 运动补偿编码主要包括运动估计和预测误差编码两部分P 运动估计的方 法有很多<其中基于块匹配的运动估计<由于相对简 单和有效<更是应用广泛P 其基本思想是将图像序列的每一帧划分成子块<对于当前帧中的每一块到前一帧某一给定搜索区域内所有候选块位置<找出与当前块最相似的块<即匹配块<当前块与其匹配块之间的相对位移即为该块的运动向量P C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C C 显然估计块运 万方数据

经典参数估计方法(3种方法)

经典参数估计方法:普通最小二乘(OLS)、最大似然(ML)和矩估计(MM) 普通最小二乘估计(Ordinary least squares,OLS) 1801年,意大利天文学家朱赛普.皮亚齐发现了第一颗小行星谷神星。经过40天的跟踪观测后,由于谷神星运行至太阳背后,使得皮亚齐失去了谷神星的位置。随后全世界的科学家利用皮亚齐的观测数据开始寻找谷神星,但是根据大多数人计算的结果来寻找谷神星都没有结果。时年24岁的高斯也计算了谷神星的轨道。奥地利天文学家海因里希.奥尔伯斯根据高斯计算出来的轨道重新发现了谷神星。高斯使用的最小二乘法的方法发表于1809年他的著作《天体运动论》中。法国科学家勒让德于1806年独立发现“最小二乘法”,但因不为世人所知而默默无闻。勒让德曾与高斯为谁最早创立最小二乘法原理发生争执。1829年,高斯提供了最小二乘法的优化效果强于其他方法的证明,因此被称为高斯-莫卡夫定理。 最大似然估计(Maximum likelihood,ML) 最大似然法,也称最大或然法、极大似然法,最早由高斯提出,后由英国遗传及统计学家费歇于1912年重新提出,并证明了该方法的一些性质,名称“最大似然估计”也是费歇给出的。该方法是不同于最小二乘法的另一种参数估计方法,是从最大似然原理出发发展起来的其他估计方法的基础。虽然其应用没有最小二乘法普遍,但在计量经济学理论上占据很重要的地位,因为最大似然原

理比最小二乘原理更本质地揭示了通过样本估计总体的内在机理。计量经济学的发展,更多地是以最大似然原理为基础的,对于一些特殊的计量经济学模型,最大似然法才是成功的估计方法。 对于最小二乘法,当从模型总体随机抽取n组样本观测值后,最合理的参数估计量应该使得模型能最好地拟合样本数据;而对于最大似然法,当从模型总体随机抽取n组样本观测值后,最合理的参数估计量应该是使得从模型中抽取该n组样本观测值的概率最大。 从总体中经过n次随机抽取得到的样本容量为n的样本观测值,在任一次随机抽取中,样本观测值都以一定的概率出现。如果已经知道总体的参数,当然由变量的频率函数可以计算其概率。如果只知道总体服从某种分布,但不知道其分布参数,通过随机样本可以求出总体的参数估计。 以正态分布的总体为例,每个总体都有自己的分布参数期望和方差,如果已经得到n组样本观测值,在可供选择的总体中,哪个总体最可能产生已经得到的n组样本观测值呢?显然,要对每个可能的正态总体估计取n组样本观测值的联合概率,然后选择其参数能使观测值的联合概率最大的那个总体。将样本观测值联合概率函数称为变量的似然函数。在已经取得样本观测值的情况下,使似然函数取极大值的总体分布参数所代表的总体具有最大的概率取得这些样本观测值,该总体参数即是所要求的参数。通过似然函数极大化以求得总体参数估计量的方法被称为极大似然法。

基于线性搜索的快速运动估计算法

第38卷 第2期2004年2月 西 安 交 通 大 学 学 报 J OU RNAL OF XI′AN J IAO TON G UN IV ERSIT Y Vol.38 №2 Feb.2004基于线性搜索的快速运动估计算法 丁贵广,郭宝龙 (西安电子科技大学机电工程学院,710071,西安) 摘要:为了减小快速运动估计算法的计算复杂度和提高运动补偿的准确性,提出了一种新的块匹配运动估计算法,称为线性正方形搜索算法.该算法采用运动估计的线性搜索策略,对于不重要的搜索区域利用线性搜索技术进行快速搜索以减小算法的计算复杂度,而对于重要搜索区域,即最佳点所在区域,用9点的正方形模块进行精细搜索以提高算法的搜索精度.实验结果证明,该算法与菱形算法相比不仅计算复杂度减小了10%以上,而且视频编码效率可以提高约011dB. 关键词:块匹配算法;运动估计;线性搜索;视频编码 中图分类号:TP391 文献标识码:A 文章编号:0253-987X(2004)02-0136-04 N e w F ast Motion Estimation Algorithm B ased on Line Search Di ng Guiguang,Guo B aolong (School of Electromechanical Engineering,Xidian University,Xi′an710071,China) Abstract:In order to reduce the computational complexity of the fast motion estimation and improve the accuracy of motion compensation,a new block2matching algorithm called line2square search(L SS)algorithm was pro2 posed,in which the strategy of the line search was introduced.The L SS algorithm performed the line search for the unimportant area to reduce the computation complexity.For the important search area in which optimal points were existed,a square search pattern consisted of9checking points was used to carry out the refined search,thus the search accuracy and the prediction quality were https://www.sodocs.net/doc/0d6078111.html,pared with the diamond search algorithm,experimental results showed that the computational complexity could be reduced up to10%and the coding efficiency could be increased about011dB by the L SS algorithm. K eyw ords:block2m atchi ng al gorithm;motion esti m ation;li ne search;vi deo codi ng 对于视频序列图像,由于相邻帧之间存在很大的时间相关性,即时间冗余,所以通过减少时间冗余,可以大幅度提高视频编码的效率.基于块匹配的运动估计算法是一种有效的方法,它已经被许多视频编码标准所采纳[1,2].在块匹配运动估计算法中,全搜索(FS)算法精度最高,但由于它要对搜索区内的每个搜索点进行检测,因此计算复杂度高,软硬件实现困难.后来人们相继提出了许多快速搜索算法,如三步法(TSS)[3]、四步法(FSS)[4]、二维对数法(TDL)[5]、基于块的梯度下降法(BB G DS)[6]、交叉法(CS)[7]和菱形法(DS)[8,9\〗等,它们通过设计不同的搜索模板和搜索策略,在计算复杂度上比FS 减小了许多,但搜索的准确性比不上FS.因此,有必要寻找更加高效的块匹配运动估计算法. 本文在分析运动矢量和绝对差和(Sum of Ab2 solute Difference,SAD)的空间分布特性的基础上,设计了一种新的搜索算法———线性正方形搜索算法(Line2Square Search,L SS).实验结果表明,本文提出的L SS算法在计算复杂度和准确性上都明显优于DS等块匹配算法. 收稿日期:2003-05-05. 作者简介:丁贵广(1976~),男,博士生;郭宝龙(联系人),男,教授,博士生导师. 基金项目:国家自然科学基金资助项目(69975015);教育部优秀青年教师计划资助项目.

运动估计块匹配算法分析与研究

第22卷第3期2006年6月 河北北方学院学报(自然科学版)Journal of Hebei Nort h University (Nat ural Science Edition ) Vol 122No 13J une 2006 收稿日期:20060424 作者简介:乔月圆(19702),男,山西大同人,山西大同大学讲师. 运动估计块匹配算法分析与研究 乔月圆1,冯贵良2,兰安怡2 (11山西大同大学,山西大同037003;21河北北方学院计算机科学系,河北张家口075000) 摘要:视频序列图像存在很强的相关性,采用运动估计和运动补偿技术可以消除时间冗余以提高编码效 率,本文介绍了运动估计的原理以及一些常用的块匹配算法,并对这些算法的优劣性作了分析比较. 关键词:运动估计;块匹配;算法 中图分类号:TP 30116 文献标识码:A 文章编号:167321492(2006)0320067204 The R esearch of B lock Matching Algorithms for Motion Estimation Q IAO Yue 2yuan 1,FEN G Gui 2liang ,L AN An 2yi 2 (11Shanxi Datong University ,Datong ,Shanxi 037003,China ; 21Department of Computer Science ,Hebei North University ,Zhangjiakou ,Hebei 075000,China ) Abstrcat :There is a st rong relativity between video f requency images.To improve t he coding efficien 2cy ,we can remove redundancy information by using motion estimation and compensation techniques.This paper introduces t he t heory of motion estimation and some block matching algorit hms being used f requent 2ly ,and compares t he virt ues and shortcomings between t his algorit hms. K ey w ord :motio n estimation ;block matching ;algorit hms 自然视频序编码的运动估计方法,就是计算当前帧(待编码的图像)的各像素块与其相邻帧(预测图像)的像素块的运动矢量,然后由其构成一个对当前帧的预测帧,求得其最佳预测误差,编码时只须传送预测误差值和运动矢量.由于预测误差的信息量通常会大大少于原图像的信息量,再对其施以适当的统计编码方法,则可以得到比较大的视频数据压缩.而在解码端,根据接收的运动矢量,采用运动补偿,将预测误差与己知的预测图像重合,生成解码.近年来,研究人员提出了很多运动估计块匹配算法,但是每种算法各有其优缺点和适用范围. 1 运动估计的块匹配算法原理 运动估计块匹配法的基本思想是将每一帧图像分割成一系列子块图像,宏块大小为M ×N (一般取16×16).计算当前帧中每一子块与相邻帧中的各子块的误差函数, 把具有最小误差的相邻帧的对应子块 图1 运动估计块基本原理

基于块的全搜索运动估计算法实现实验报告

数字视频处理实验报告 学院:通信与信息工程学院 系班:电信科0901班 姓名: 学号: 时间:2012 年11月23号

一、实验名称:基于块的全搜索运动估计算法实现 二、实验目的: 1、掌握运动估计算法的实现原理。 2、掌握运动估计算法的研究现状及多种计算方法。 3、学习基于块的全搜索运动估计算法,研究分析其Matlab实现 程序过程,并补充完成程序,对实验结果进行分析比较。 三、实验要求 三、实验要求 1、对实验程序motionEstAnalysis.m进行分析,完成主程序流程图。 函数流程图: 2、编写补充完成部分不全程序代码,调试程序使其能正确运行 (1) motionEstES( ) % Computes motion vectors using exhaustive search method(全搜索法计算运动矢量) % % Input % imgP : The image for which we want to find motion vectors(当前图像) % imgI : The reference image(参考图像) % mbSize : Size of the macroblock(宏块尺寸) % p : Search parameter (read literature to find what this means)(搜索参数) % % Ouput % motionVect : the motion vectors for each integral macroblock in imgP (当前图像中每一个积分宏块的运动矢量) % EScomputations: The average number of points searched for a macroblock(每个宏块搜索的平均点数) % % Written by Aroh Barjatya

视频信号的运动估计和运动补偿算法

数字视频实验报告 班级:电信科0801班 学号: 姓名:

实验报告二 一、实验名称:视频信号的运动估计和运动补偿算法 二、实验目的 在视频编码和处理系统中,运动估计和运动补偿技术对降低视频序列时间冗余度、提高编码效率起着非常关键的作用。运动估计的准确程度将直接决定视频编码器的编码效率。它极大地消除了视频序列的帧间相关性。运动估计算法的复杂性将直接决定视频压缩编码系统的复杂性,如何提高运动估计的效率,使运动估计算法的搜索过程更快速、更高效一直是人们研究的热点。掌握运动估计的块匹配算法,以及快速运动估计算法。 三、实验内容: 1、分析基于块匹配的全搜索运动估计算法程序,画出 motionEstAnalysis.m 和 motionEstES.m文件流程图 2、编程补充完成costFuncMAD.m 文件中最小绝对误差计算函数 costFuncMAD()和imgPSNR.m文件中峰值信噪比PSNR计算函数imgPSNR()的程序,最终输出运动矢量场; 3、掌握运动补偿算法,编程实现motionComp.m文件中对目标帧的运 动补偿重构函数 motionComp(); 4、了解多种快速运动估计算法,例如三步法搜索法、二维对数法、

菱形搜索法等。 5、总结实验结果,比较各种搜索算法的性能和所需时间。 四、实验原理 在帧间预测编码中,由于活动图像邻近帧中的景物存在着一定的相关性。因此,可将活动图像分成若干块或宏块,并设法搜索出每个块或宏块在邻近帧图像中的位置,并得出两者之间的空间位置的相对偏移量,得到的相对偏移量就是通常所指的运动矢量,得到运动矢量的过程被称为运动估计。 运动矢量和经过运动匹配后得到的预测误差共同发送到解码端,在解码端按照运动矢量指明的位置,从已经解码的邻近参考帧图像中找到相应的块或宏块,和预测误差相加后就得到了块或宏块在当前帧中的位置。 运动估计的准确程度往往用补偿图像与原图像比较的PSNR来衡量表示。 五、实验程序 1、motionEstAnalysis.m文件流程图

第14章 二维运动估计

第十四章二维运动估计 早期设计的机器视觉系统主要是针对静态场景的,为了满足更高级的应用需求,必须研究用于动态场景分析的机器视觉系统.动态场景分析视觉系统一般需要较大的存储空间和较快的计算速度,因为系统的输入是反应场景动态变化的图像序列,其包含的数据十分巨大.图像动态变化可能由摄象机运动、物体运动或光照改变引起,也可能由物体结构、大小或形状变化引起.为了简化分析,通常我们假设场景变化是由摄象机运动和物体运动引起的,并假设物体是刚性的. 根据摄象机和场景是否运动将运动分析划分为四种模式:摄象机静止-物体静止,摄象机静止-物体运动,摄象机运动-物体静止,摄象机运动-物体运动,每一种模式需要不同的分析方法和算法。摄象机静止-物体静止模式属于简单的静态场景分析.摄像机静止-场景运动是一类非常重要的动态场景分析,包括运动目标检测、目标运动特性估计等,主要用于预警、监视、目标跟踪等场合。摄象机运动—物体静止是另一类非常重要的动态场景分析,包括基于运动的场景分析、理解,三维运动分析等,主要用于移动机器人视觉导航、目标自动锁定与识别等.在动态场景分析中,摄象机运动—物体运动是最一般的情况,也是最难的问题,目前对该问题研究的还很少. 图像运动估计是动态场景分析的基础,现在已经成为计算机视觉新的研究热点。根据所涉及的空间,将图像运动估计分为二维运动估计和三维运动估计,显然,这种划分不是十分严格,因为二维运动参数的求解有时需要三维空间的有关参数引导,而许多三维参数的求解需要以二维参数为基础。本章主要讨论二维运动估计,三维运动估计和分析将在第十五章讨论。 14.1图像运动特征检测 对许多应用来说,检测图像序列中相邻两帧图像的差异是非常重要的步骤.场景中任何可察觉的运动都会体现在场景图像序列的变化上,如能检测这种变化,就可以分析其运动特性.如果物体的运动限制在平行于图像平面的一个平面上,则可以得到物体运动特性定量参数的很好估计.对于三维运动,则只能得到物体空间运动的定性参数估计.场景中光照的变化也会引图像强度值的变化,有时会引起较大的变化.动态场景分析的许多技术都是基于对图像序列变化的检测.检测图像变化可以在不同的层次上进行,如像素、边缘或区域.在像素层次上要对所有可能的变化进行检测,以便在后处理阶段或更高层次上使用. 14.1.1差分图像 检测图像序列相邻两帧之间变化的最简单方法是直接比较两帧图像对应像素点的灰度值.在这种最简单的形式下,帧),,(j y x f 与帧),,(k y x f 之间的变化可用一个二值差分图像),(y x f DP jk 表示: ???>-=其它如果0),,(),,(1),(T k y x f j y x f y x f DP jk (14.1) 式中T 是阈值. 在差分图像中,取值为1的像素点被认为是物体运动或光照变化的结果.这里假设帧与帧之间配准或套准得很好.图14.1和14.2示意了两种图像变化情况,一种是由于光照变化造成的图像变化,另一种是由于物体的运动产生的图像变化.需要指出,阈值在

运动估计算法MATLAB课程设计

课程设计任务书 学生姓名:专业班级: 指导教师:工作单位: 题目: 运动估计算法 初始条件: MATLAB软件平台 要求完成的主要任务: 1.设计任务 设计视频压缩系统中的运动估计算法:全搜索法(FS: Full Search)和三步法(TSS: Three Step Search),比较二种方法的搜索点和每帧的峰值信噪比(PSNR:peak signal to noise ratio) 2.设计要求 编制算法代码;对视频进行运动估计;计算PSNR 时间安排: 答辩时间2013年1月24日。 指导教师签名:年月日 系主任签名:年月日

摘要 (1) 1运动估计算法概念 (2) 1.1 运功估计算法基本思想 (2) 1.2 运动估计算法实验原理 (2) 2 设计原理和方法 (3) 2.1 三步法 (3) 2.2 新三步法 (3) 2.3 全搜索法 (4) 2.4 峰值信噪比 (5) 3 运动估计算法的MATLAB编程 (6) 3.1全搜索法 (6) 3.2三步法 (9) 3.3全搜索法指标 (11) 3.4三步法指标 (11) 3.4仿真结果分析 (11) 4 小结与体会 (11) 参考文献 (11) 附录 (12)

运动估计的基本思想是尽可能准确地获得序列图像帧间的运动位移,即运动 矢量。因为运动估计越准确,预测补偿的图像质量越高,补偿的残差就越小,补偿编码所需位数越少,需要传输的比特率就越小。利用得到的运动矢量在帧间进行运动补偿。补偿残差经过变换、量化、编码后与运动矢量一起经过熵编码,然后以比特流形式发送出去。 在视频编码和处理系统中,运动估计和运动补偿技术对降低视频序列时间冗余度、提高编码效率起着非常关键的作用。运动估计的准确程度将直接决定视频 编码器的编码效率。 关键词:运动估计、运动补偿技术、位移(运动)矢量 Abstract The basic idea is that the motion estimation as accurate as possible the image sequence interframe motion displacement, i.e. the motion vector. Motion estimation more accurate prediction compensation, the higher the image quality is compensated residuals is smaller, less compensation coding bits required, the smaller the transmission bit rate. Performing motion compensation using the motion vector obtained in the interframe. Compensation residuals through transformation, quantization, entropy-coded together with the motion vector is encoded, and then sent out in the form of a bit stream. In video coding and processing system, the motion estimation and motion compensation to reduce the temporal redundancy of video sequence to improve the coding efficiency plays a crucial role. The degree of accuracy of the motion estimation will directly determine the encoding efficiency of the video encoder. Keywords:Motion estimation Motion compensation techniques The vector of displacement (movement)

运动估计算法实现

运动估计算法实现 一、实验目的: 1、掌握运动估计算法的实现原理。 在视频编码和处理系统中,运动估计和运动补偿技术对降低视频序列时间冗余度、提高编码效率起着非常关键的作用。运动估计的准确程度将直接决定视频编码器的编码效率。它极大地消除了视频序列的帧间相关性。运动估计算法的复杂性将直接决定视频压缩编码系统的复杂性,如何提高运动估计的效率,使运动估计算法的搜索过程更快速、更高效一直是人们研究的热点。掌握运动估计的块匹配算法,以及快速运动估计算法。 2、掌握运动估计算法的研究现状及多种计算方法。 3、学习基于块的全搜索运动估计算法,研究分析其Matlab实现 程序过程,并补充完成程序,对实验结果进行分析比较。 二、实验内容 1、分析基于块匹配的全搜索运动估计算法程序,画出 motionEstAnalysis.m文件流程图

2、编程补充完成costFuncMAD.m 文件中最小绝对误差计算函数 costFuncMAD()和imgPSNR.m文件中峰值信噪比PSNR计算函数 imgPSNR()的程序,最终输出运动矢量场; 3、掌握运动补偿算法,编程补充minCost( )函数; 4、了解多种快速运动估计算法,例如三步法搜索法、菱形搜索法等。总结实验结果。 三、实验原理

在帧间预测编码中,由于活动图像邻近帧中的景物存在着一定的相关性。因此,可将活动图像分成若干块或宏块,并设法搜索出每个块或宏块在邻近帧图像中的位置,并得出两者之间的空间位置的相对偏移量,得到的相对偏移量就是通常所指的运动矢量,得到运动矢量的过程被称为运动估计。 运动矢量和经过运动匹配后得到的预测误差共同发送到解码端,在解码端按照运动矢量指明的位置,从已经解码的邻近参考帧图像中找到相应的块或宏块,和预测误差相加后就得到了块或宏块在当前帧中的位置。 运动估计的准确程度往往用补偿图像与原图像比较的PSNR来衡量表示。 四、实验要求 1、对实验程序motionEstAnalysis.m进行分析,完成主程序流程图。 函数流程图: 2、编写补充完成部分不全程序代码,调试程序使其能正确运行 (1)motionEstAnalysis.m % This script uses all the Motion Estimation algorithms written for the % final project and save their results. close all clear all % imageName = 'caltrain.avi';

运动估计算法比较 块匹配 全搜索 四步法 三步法

大作业 运动估计算法比较 一、实验内容 简要介绍各种运动估计算法,并比较不同运动估计算法的性能,主要考虑各算法的运算速度和精度。 二、实验背景 视频原始图像中存在着大量的信息冗余,如时间冗余、空间冗余、信息熵冗余、谱间冗余、几何结构冗余、视觉冗余和知识冗余等等。运动估计是视频压缩编码中的核心技术之一,采用运动估计和运动补偿技术可以消除视频信号的时间冗余以提高编码效率。如何提高运动估计的效率,使运动估计算法的搜索过程更健壮、更快速、更高效成为目前研究的热点。 运动估计的基本思想是尽可能准确地获得序列图像帧间的运动位移,即运动矢量。因为运动估计越准确,预测补偿的图像质量越高,补偿的残差就越小,补偿编码所需位数越少,需要传输的比特率就越小。利用得到的运动矢量在帧间进行运动补偿。补偿残差经过变换、量化、编码后与运动矢量一起经过熵编码,然后以比特流形式发送出去。 运动估计算法多种多样,大体上可以把它们分成四类:块匹配法、递归估计法、贝叶斯估计法和光流法。其中块匹配运动估计算法因其具有算法简单、便于VLSI实现等优点得到广泛应用。所以本文将重点介绍块匹配运动估计算法,并对各种块匹配算法在计算速度和估计精度上进行简单比较。 三、实验原理 (一)、像素递归技术 像素递归技术是基于递归思想。在连续帧中像素数据的变化是因为物体的移位引起的,郑么如果沿着梯度方向在某个像素周圈的若干像素作迭代运算,运算会最后收敛于一个固定的运动估计矢量,从而预测该像素的位移。 (二)、块匹配运动估计 块匹配运动估计是把图像帧划分为若干互不重叠的块,并以块为单位寻找目标帧中每块在参考帧(上一帧或者其它帧)中最优匹配的块的相对位置,假设图像中每块的大小为M

一种有效的三步运动估计算法

一种有效的三步运动估计算法 摘 要:为了减小运动估计算法的计算复杂度及提高序列图像超分辨率重建的可靠性,提出了一种有效的三步搜索算法。该算法采用多步搜索策略,根据运动矢量分布的中心偏移性及并行处理的思想,在最佳匹配点所在的区域使用菱形小模板代替原有的正方形小模板来进行精细搜索,以提高算法的搜索精度。实验结果表明,该算法在保证搜索精度的同时能大幅度缩短消耗时间。 关键词:超分辨率重建;运动估计;块匹配;运动矢量 由于误差表面通常并不是单调的,所以搜索窗口太小,就容易陷入局部最优;而搜索窗口太大,又容易产生错误的搜索路径[7]。3SS 搜索法第一步搜索步长较大,在图像运动较小的时候会影响运动估计的效果,使运动估计的精度明显下降。在超分辨率图像重建中,序列图像的每一帧变化都很小,帧与帧之间大多为小运动估计,而在实际应用中,除了要保证运动估计的精度之外,对算法的实时性也提出了更高的要求。根据这个特点,本文提出一种根据N3SS 法演变而来的一种有效的三步搜索算法(effective three step search ,E3SS)。图2为E3SS 的搜索模板,搜索窗宽度为5,即搜索范围是)5,5(±±j i 。 i j 6-i 6 +i 6 +j 6 -j 图2 E3SS 搜索模板 在真实的视频序列中,运动矢量的分布具有中心偏移的特点,由全搜索算法FS 的匹配结果表明,匹配点在中心点的概率最高,其次为在中心点周围上、下、左、右的4个邻点,而在中心点周围左上、右上、右下、左下4个对角点的概率最小[8],因此在搜索窗口的中心采用了一个小的菱形搜索模板来替代N3SS 算法

中的正方形小模板。 首先,搜索模板上的13个检测点,如果最小块误差(minimum block distortion ,MBD) 点 (SAD 值最小的点),在搜索窗口的中心则算法结束。 如果MBD 点位于中心点的4个相邻点中,移动菱形小模板到上一步的MBD 点,继续搜索菱形小模板中的其他点,直到MBD 点是菱形中心的点或者菱形小模板到达搜索窗口边缘为止,如图3(a)中,点(0,-1)是第一步的MBD 点,也是第二阶段的MBD 点,且位于搜索窗中心,故最终运动矢量就是(0,-1)。图中每个点上的数字表明了不同阶段搜索时的检测点。 如果MBD 点是99 模板中的8点之一,搜索方法同3SS ,即将步长减半,中心点移到上一步的MBD 点,重新在周围距离步长的8个点处进行块匹配计算并比较,重复此步骤,直到步长为1,该点所在位置即对应最优运动矢量,如图3(b)中,(4,4)是第一步的MBD 点,然后以(4,4)为中心点进行第二步搜索,此时搜索半径已经缩减为2像素,最后以当前MBD 点(2,6)完成第三步搜索,找到最优匹配点。 -1 1 -2-3-4-5-6-702 3 4567 -11-2-3-4-5-6-7 0234567-11-2-3-4-5-6-7 0234567-11 -2-3-4-5-6-702 3 4 5 6 7 (a) (b) 图3 E3SS 搜索示意图 4 实验结果与分析 为了验证E3SS 算法的性能,在相同条件下进行了一系列的仿真实验。实验的搜索区域在水平与竖直方向的最大位移均为±7,块的大小为16×16,并采用SAD 作为最佳匹配准则。实验时,首先利用预测帧的峰值信噪比(peak signal to noise ratio ,PSNR)来度量搜索的准确性,同时选取多个不同性质的序列图像来检

相关主题