搜档网
当前位置:搜档网 › Opencv2图像算法库分析解读

Opencv2图像算法库分析解读

Opencv2图像算法库分析解读
Opencv2图像算法库分析解读

第二章Opencv2主要算法归类

1.图像基本操作

主要包括图像各种预处理操作。如直方图、图像腐蚀膨胀、区域分割、滤波、二值化、边缘检测、图像增强等基础算法,通常用于其他算法的预处理操作。

1.1直方图相关算法

直方图是对数据进行统计,将统计值组织到一系列事先定义好的bin(直方图中的柱子)中。bin中的数值是从数据中计算出的特征的统计量,这些数据可以是诸如梯度、方向、色彩或任何其他特征。无论如何,直方图获得的是数据分布的统计图。直方图是一幅图像中各像素灰度出现频次的统计结果,它只反映图像中不同灰度值出现的次数,而没反映某一灰度所在的位置。也就是说,它只包含了该图像的某一灰度像素出现的概率,而丢失了其所在的位置信息。

提供功能有:产生图像直方图、图像背投影直方图、对比直方图、直方图均衡化,EMD(Earth Mover s Distance,即陆地移动距离)直方图,归一化。

直方图均衡化处理的中心思想是把原始图像的灰度直方图从比较集中的某个灰度区间变成在全部灰度范围内的均匀分布。

图1.1 直方图效果图

1.2腐蚀与膨胀相关算法( Erosion 与Dilation)

所谓的灰度级膨胀和腐蚀即将而知图像的二值形态学运算推广到灰度图像上。对于一幅图像的腐蚀(膨胀)运算定义为对每个像素赋值为某个领域内输入图像灰度级的最小(或最大值)。在二值变换中的结构元素只代表一个领域,而在灰度级变化中,结构元素是一个二元函数,它规定了希望的局部灰度级性质。在求的邻域内最大值(或最小值)的同时,将结构元素的值相加(相减)。

膨胀是在模板卷积的基础上做或运算,腐蚀则是做与运算。

他们的运用广泛:消除噪声,分割独立的图像元素,以及连接相邻的元素;寻找图像中的明显极大值区域或极小值区域。

图1.2 腐蚀膨胀效果图

1.3区域分割

分水岭变换是一个流行的图像处理算法,用于快速分割图像为同类区域。它背后的原理是,如果将图像视为拓扑结构的地图,那么均质区域对应的是被陡峭边缘包围的平坦盆地。设想一个个“集水盆”中存在积水,且水位不断升高,淹没梯度较低的地方,当水漫过程停止后,图像就可以被分割成几块连通区域。分水岭算法有不同的实现方法。

GabCut图像分割算法,它同时能够将一幅图像分割为背景及前景物体。GabCut在计算时更加复杂,但是产生的结果要精确许多对于期望从表态图像中提取前景物体的应用,如将一幅图中的物体剪贴到另一幅图中,这是最佳算法。

图1.3a 图像分割:分水岭算法效果图

图1.3b 图像分割:分水岭算法效果图

1.4滤波(Filtering)

滤波是信号处理及图像处理中的一个基本操作,旨在特定的应该程序中,选择性地提取图像中被认为传达重要信息的部分。滤波去除图像中的噪声,提取感兴趣的视觉特征,允许图像重采样。在频域分析的框架下,滤波操作的作用是增强部分频段,同时限制(或衰减)其他频段。OPENCV主要滤波器:低通滤波器、中值滤波器、方向滤波器检测边缘、积卷变换等。其中利用方向滤波器和拉普拉斯变换可以对图像的边缘进行检测。

图1.4a 高斯滤波效果图

图1.4b 中值滤波效果图

图1.4c filter2D变换效果图

1.5二值化

将256个亮度等级的灰度图像通过适当的阈值选取而获得仍然可以反映图像整体和局部特征的二值化图像。在数字图像处理中,

二值图像占有非常重要的地位,首先,图像的二值化有利于图像的进一步处理,使图像变得简单,而且数据量减小,能凸显出感兴趣的目标的轮廓。其次,要进行二值图像的处理与分析,首先要把灰度图像二值化,得到二值化图像。所有灰度大于或等于阈值的像素被判定为属于特定物体,其灰度值为255表示,否则这些像素点被排除在物体区域以外,灰度值为0,表示背景或者例外的物体区域。OpenCV中有两个函数可以实现图片的二值化:adaptiveThreshold 、threshold

图1.5 二值化效果图

1.6边缘检测

图像最基本的特征是边缘,边缘是图像分割所依赖的最重要特征。经典的边缘检测方法,是对原始图像按像素的某领域构造边缘检测算子。OPENCV主要提供通过Sobel算子、Laplace算子、Canny算子来实现图像的边缘的检测。

图1.6a Canny算子边缘检测效果图

图1.6b 三中边缘检测算子效果图(Sobel / Laplace / Canny):

1.7 图像增强

直方图均衡化是图像增强处理中常见的方法之一,其基本的思想是通过均衡化处理调整图像灰度分布,达到改善图像对比度的目的。由于图像对比度是决定一幅图像主观质量的重要因素,因此直方图均衡化被广泛应用于图像的增强处理。

图1.7 Laplace算子图像锐化效果图

2.几何形态抽取

主要包括图像中各种几何形态的提取、拟合和识别,基本类型为直线、圆、椭圆、轮廓、连通区域等。

图像通过阈值分割和边缘提取来分割图像,使用此两种方法时物体的边界都明确返回得到或通过一些后处理推导得到。由边界点组的轮廓,生成大量的数据,但是通常并不感兴趣如此大数数据的信息,此类算子将轮廓数据拟合成几何基本单元的方法。

图2a 椭圆拟合

图2b 圆形拟合

3.简单模板匹配

模板与目标图案的初级扫描匹配。仅适用于直接匹配,对模板旋转、缩放等支持效果不好。

模板匹配是一项在一幅图像中寻找与另一幅模板图像最匹配(相似)部分的技术. 使用OpenCV函数matchTemplate 在模板块和输入图像之间寻找匹配,获得匹配结果图像。OpenCV通过函数matchTemplate 实现了模板匹配算法. 可用的方法有6个: 平方差匹配method=CV_TM_SQDIFF;标准平方差匹配method=CV_TM_SQDIFF_NORMED;相关匹配method=CV_TM_CCORR;标准相关匹配method=CV_TM_CCORR_NORMED;相关匹配method=CV_TM_CCOEFF;标准相关匹配method=CV_TM_CCOEFF_NORMED。

图3a 输入原始图像(左)模版图像(右)

图3b 不同频率分量上匹配效果图

图3c 匹配效果图

4.检测特征点及特征匹配

基于特征描述点的模板匹配。适用于任意情况下的模板匹配,支持旋转、缩放等各种复杂情况,但运算耗时较大。

特征点又称兴趣点、关键点,它是在图像中突出且具有代表意义的一些点,通过这些点我们可以用来识别图像、进行图像配准、进行3D重建等。它依赖于这个想法,即不再观察整幅图像,而是选择某些特殊的点,然后对它们执行局部分析。如果能检测到足够

多的这种点,同时它们的区分度很高,并且可以精确定位稳定的特征,那么这个方法就很有效。可以做到如:使用二维特征点(Features2)和间映射(Homography)寻找已知物体;平面物体检测等。

视频例子:https://www.sodocs.net/doc/807677289.html,/v_show/id_XNDc0MTg0NjA0.html

图4 特征点匹配效果图

5.视频序列处理

基于视频序列的图像算法,主要包括前后景区分、动作跟踪等。提取视频中的每个单独帧,那其它OPENCV不同图像处理函数可以应用到每个帧上。可以对视频序列实施时序分析的算法,比较相邻帧以进行物跟踪,随时间累积图像统计数据以提取前景物体。OPENCV提供一个易用的框架以提取视频文件和USB摄像头中的图像帧。

图5a 视频中特征点跟踪效果图

图5b应用跟踪视频中提取前景物体效果图

6.级联分类器

Opencv自带完整的分类器模块,包括用于物体检测的分类器和分类器训练算法。用于对放置位置、大小、旋转等不定的目标物体进行检测(最常见的是人脸检测),检测准确度取决于分类器训练样本规模和质量。

图6a 人脸检测和人眼检测效果图

图6b 人脸检测效果图。注意到有时存在误检和漏检。

7.机器学习

主要包括用于模式识别的算法模块,包括SVM、ANN等,理论上可以实现对各种模式识别的应用,如人脸识别、字符识别、车牌识别、语音识别,但opencv自带机器学习模块实际效果不是很好,主要作为学习参考之用。

7.1 支持向量机SVM

支持向量机(SVM) 是一个类分类器,正式的定义是一个能够将不同类样本在样本空间分隔的超平面。换句话说,给定一些标记(label)好的训练样本(监督式学习), SVM算法输出一个最优化的分隔超平面。OpenCV开发SVM算法是基于LibSVM软件包开发的,LibSVM是台湾大学林智仁(Lin Chih-Jen)等开发设计的一个简单、易于使用和快速有效的SVM模式识别与回归的软件包。

图7.1 一个二维数据集分类任务中,SVM效果示意图

7.2 神经网络ANN

人工神经网络(artificial neural network,缩写ANN),是一种模仿生物神经网络的结构和功能的数学模型或计算模型。神经网络由大量的人工神经元联结进行计算。大多数情况下人工神经网络能在外界信息的基础上改变内部结构,是一种自适应系统。现代神经网络是一种非线性统计性数据建模工具,常用来对输入和输出间复杂的关系进行建模,或用来探索数据的模式。

人工神经网络通常是通过一个基于数学统计学类型的学习方法(Learning Method)得以优化,所以人工神经网络也是数学统计学方法的一种实际应用,通过统计学的标准数学方法我们能够得到大量的可以用函数来表达的局部结构空间,另一方面在人工智能学的人工感知领域,我们通过数学统计学的应用可以来做人工感知方面的决定问题(也就是说通过统计学的方法,人工神经网络能够类似人一样具有简单的决定能力和简单的判断能力),这种方法比起正式的逻辑学推理演算更具有优势。

神经网络常用于各种模式识别处理,如字符识别等,效果如图所示:

图7.2 神经网络用于字符识别效果图

8.单目及双目镜头标定

单镜头及双镜头的标定,在视觉测量应用中常作为预处理环节。

8.1 单镜头标定

在图像测量过程以及机器视觉应用中,为确定空间物体表面某点的三维几何位置与其在图像中对应点之间的相互关系,必须建立相机成像的几何模型,这些几何模型参数就是相机参数。在大多数条件下这些参数必须通过实验与计算才能得到,这个求解参数的过程就称之为相机标定(或摄像机标定)。无论是在图像测量或者机器视觉应用中,相机参数的标定都是非常关键的环节,其标定结果的精度及算法的稳定性直接影响相机工作产生结果的准确性。因此,做好相机标定是做好后续工作的前提,提高标定精度是科研工作的重点所在。

图8.1一种常见标定板的单镜头标定示意图

8.2 双镜头标定

摄像机标定,是指建立摄像机几何成像模型,描述空间坐标系中的景物点同它在图像平面上的像点之间的对应关系,并求取该模型的各参数的过程。在基于双目立体视觉的三维重建系统中,摄像机标定是非常关键的环节,精确求取双摄像机的内外参数以及径向和切向畸变不仅可以直接提高三维恢复的精度,而且可以为后续的特征匹配奠定良好的基础。

图8.2a 双镜头标定的原理图

图8.2b 双镜头标定示意图

9.双目视觉及3D重建

主要用于双摄像头重建三维场景的相关算法。目前不借助主动结构光源(特定形状的激光源)情况下,重建的场景精度不是很高。

9.1 双目视觉

双目立体视觉(Binocular Stereo Vision)是机器视觉的一种重要形式,它是基于视差原理并利用成像设备从不同的位置获取被测物体的两幅图像,通过计算图像对应点间的位置偏差,来获取物体三维几何信息的方法。融合两只眼睛获得的图像并观察它们之间的差别,使我们可以获得明显的深度感,建立特征间的对应关系,将同一空间物理点在不同图像中的映像点对应起来,这个差别,我们称作视差(Disparity)图像。

双目立体视觉测量方法具有效率高、精度合适、系统结构简单、成本低等优点,非常适合于制造现场的在线、非接触产品检测和质量控制。对运动物体(包括动物和人体形体)测量中,由于图像获取是在瞬间完成的,因此立体视觉方法是一种更有效的测量方法。双目立体视觉系统是计算机视觉的关键技术之一,获取空间三维场景的距离信息也是计算机视觉研究中最基础的内容。

图9.1 双目视觉建立深度图效果

9.2 3D重建

被动光三维重建是利用多福图像相关信息来进行目标重建的方式,目前常常利用多视点图像信息来完成。有两种常见的立体求取方式。其中立体匹配方式可以获得较精确的3D模型,而基于轮廓的3D重建则多用于一些实时应用之中。

图9.2a 基于立体匹配的3D重建

图9.2b基于轮廓的3D重建

10.并行运算/GPU加速

主要利用GPU并行计算加速图像处理速度的OpenCL模块。OpenCL可以实现GPGPU(General-purpose computing on graphics processing units, 通用图形处理器)运算, 是一种利用处理图形任务的GPU来计算原本由CPU处理的通用计算任务。这些通用计算常常与图形处理没有任何关系。由于现代图形处理器强大的并行处理能力和可编程流水线,令流处理器可以处理非图形数据。特别在面对单指令流多数据流(SIMD),且数据处理的运算量远大于数据调度和传输的需要时,通用图形处理器在性能上大大超越了传统的中央处理器应用程序。

从OpenCV 2.4.3开始,至最新发布的2.4.8版本中,OpenCV都会得到了OpenCL的有力支持。OpenCV-CL正逐渐地成为功能优异而性能高效的计算机视觉库,在GPU显卡上表现出优异性能。下面列举出了一些目前已经移植到OpenCL的OpenCV功能,截止至OpenCV2.4.8的一些功能:

?OpenCV-CL 二进制下载

?初始化和信息

?单个元操作

?图像变换

?还原

?色彩转换

?丰富的滤波引擎,包括有各种类型的图像滤波器,如高质量图像增强

?图像的几何转换

?基于均值漂移的变换,K-means,聚类

?角特征检测器

数字图像处理与分析实验作业(DOC)

数字图像处理与分析实验作业 作业说明:作业题目分为基本题和综合应用题。基本题主要是考察大家对教材涉及的一些基本图像处理技术的理解和实现。而综合应用题主要是考察大家综合利用图像处理的若干技术来解决实际问题的能力。 注:所有实验用图像均可从网上下载,文档中的图片只是示例。 作业要求: 编程工具:Matlab或者VC(可以使用OpenCV:https://www.sodocs.net/doc/807677289.html,/)。因为很多基本的图象处理算法已经集成在很多的编程工具中,而编程训练中基本题的目的是让同学们加深对这些算法的理解,所以基本题要求同学们只能使用图像读取和显示相关的函数(例如Matlab的imread imshow,imwrite,OpenCV的cvCreateImage,cvLoadImage,cvShowImage),而不要直接调用相关的API(例如二维DFT,图象均衡等等),但在综合应用题中则无此限制。 上交的作业包括:实验报告和程序。其中实验报告要求写出算法分析(必要时请附上流程图),函数说明(给出主要函数的接口和参数说明),实验结果(附图)及讨论分析。提交的程序,一定要确保可以运行,最好能写个程序说明。 基本题一共有10道,可以从中任选2道题来完成。综合应用题有2道,可以从中任选1道来完成。 请各位同学务必独立完成,切忌抄袭! 基本题 一、直方图变换 要求对原始Lena 图像实现以下三种取整函数的直方图均衡化: 线性函数: t k= int[(L -1) t k+ 0.5]; 对数函数: t k= int[( L-1)log(1+9t k) + 0.5] ; 指数函数: t k= int[(L -1)exp( t k-1) + 0.5] ; 要求给出: 1、原始图像和分别采用上述三种方式均衡化后的图像; 2、原始图像的直方图和上述三种方式对应均衡化后的直方图。

基于matlab的图像去雾算法详细讲解与实现-附matlab实现源代码

本文主要介绍基于Retinex理论的雾霭天气图像增强及其实现。并通过编写两个程序来实现图像的去雾功能。 1 Rentinex理论 Retinex(视网膜“Retina”和大脑皮层“Cortex”的缩写)理论是一种建立在科学实验和科学分析基础上的基于人类视觉系统(Human Visual System)的图像增强理论。该算法的基本原理模型最早是由Edwin Land(埃德温?兰德)于1971年提出的一种被称为的色彩的理论,并在颜色恒常性的基础上提出的一种图像增强方法。Retinex 理论的基本容是物体的颜色是由物体对长波(红)、中波(绿)和短波(蓝)光线的反射能力决定的,而不是由反射光强度的绝对值决定的;物体的色彩不受光照非均性的影响,具有一致性,即Retinex理论是以色感一致性(颜色恒常性)为基础的。 根据Edwin Land提出的理论,一幅给定的图像S(x,y)分解成两幅不同的图像:反射物体图像R(x,y)和入射光图像L(x,y),其原理示意图如图8.3-1所示。 图-1 Retinex理论示意图 对于观察图像S中的每个点(x,y),用公式可以表示为: S(x,y)=R(x,y)×L(x,y) (1.3.1) 实际上,Retinex理论就是通过图像S来得到物体的反射性质R,也就是去除了入射光L的性质从而得到物体原本该有的样子。 2 基于Retinex理论的图像增强的基本步骤 步骤一: 利用取对数的方法将照射光分量和反射光分量分离,即: S'(x, y)=r(x, y)+l(x, y)=log(R(x, y))+log(L(x, y)); 步骤二:用高斯模板对原图像做卷积,即相当于对原图像做低通滤波,得到低通滤波后的图像D(x,y),F(x, y)表示高斯滤波函数: D(x, y)=S(x, y) *F(x, y); 步骤三:在对数域中,用原图像减去低通滤波后的图像,得到高频增强的图像G (x, y):

贝叶斯框架下的单幅图像去雾算法

第22卷第10期2010年10月 计算机辅助设计与图形学学报 Journal o f Computer A ided Desig n &Co mputer Gr aphics V ol.22N o.10Oct.2010 收稿日期:2009-11-10;修回日期:2010-04-15.基金项目:中国博士后科学基金资助项目.王多超(1982 ),男,硕士,主要研究方向为数字图像处理;王永国(1965 ),男,学士,副教授,硕士生导师,论文通讯作者,主要研究方向为数值计算、图像处理、数据库应用(ygw ang21@https://www.sodocs.net/doc/807677289.html,);董雪梅(1979 ),女,博士,主要研究方向为小波分析、机器学习及统计分析;胡晰远(1984 ),男,博士研究生,主要研究方向为图像与信号处理、图像配准;彭思龙(1971 ),男,博士,研究员,博士生导师,主要研究方向为小波理论及应用、模式识别、图像处理等. 贝叶斯框架下的单幅图像去雾算法 王多超1),王永国 1)* ,董雪梅2),胡晰远2),彭思龙 2) 1)(安徽大学数学科学学院 合肥 230039) 2)( 中国科学院自动化研究所国家专用集成电路设计工程技术研究中心 北京 100190) (splade2009@https://www.sodocs.net/doc/807677289.html,) 摘要:在有雾天气条件下拍摄的图像,由于光线在传播过程中受到空气中悬浮颗粒的散射,导致图像内容模糊不 清,颜色偏灰白色.为了恢复出清晰的图像,根据大气散射物理模型,利用图像的稀疏先验知识,在贝叶斯框架下提出一种单幅图像去雾算法.该算法用图像梯度稀疏性先验来约束优化结果,并认为图像成像噪声服从零均值的高斯分布,然后用IRL S 方法对其求解.实验结果表明,该算法能够很好地恢复图像的对比度和保持图像的真实颜色,噪声小,便于应用. 关键词:去雾;贝叶斯框架;稀疏先验;大气散射模型中图法分类号:T P391.41 Single Image Dehazing Based on Bayesian Framework Wang Duo chao 1),Wang Yongg uo 1)*,Dong Xuem ei 2),H u Xiy uan 2),and Peng Silo ng 2) 1)(S chool of M athematica l S cie nces ,A nhui Univ er sity ,H e f ei 230039) 2)(N ational A S IC Design Eng ineering Ce nter ,I nstitu te o f A utomation ,Chine se Ac ade my o f S cience s,Beij ing 100190) Abstract :Because o f light scattered by the suspended particles in the atm osphere,pho to graphs taken in the fo gg y day lo ok g ray and are lack of visibility.In order to unv eil the clear imag e s structures and colors,w e pr opo se a new algor ithm based o n the atm osphere scattering m odel using a single imag e and the image sparsity prior in Bayesian framewo rk.The fog remov al r esult is optimized under the constraint of the prior of the image gr adient sparsity and the noise in the fogg y imag e being the normal distributio n w ith zero mean,and then the o ptimization functio n is com puted using the IRLS alg orithm.In our ex periments,the alg orithm has a g ood effect on resto ring the clear image s co ntents and preserving the image s true co lors.T he no ise in the output im age is very w eak that has advantag e for many applicatio ns. Key words :dehazing;Bay esian framew ork;spar sity prior;atmosphere scattering m odel 对户外场景进行普通光学成像时经常会受到有雾天气的影响.在有雾天气条件下,从物体表面反射的光线到达成像设备之前,会受到大气中悬浮颗粒的影响发生散射,散射的程度和悬浮颗粒的种类、大小、形状及其在大气中的聚集程度,即雾的浓度以及光的波长有关[1] .当雾较浓时,成像设备所得到的图像的对比度较低,颜色偏向灰白色,导致图像中的物体辨认不清,直接影响到大多数基于计算机视觉算 法的自动化图像系统的正常工作,如交通运输、户外监视、地形侦测系统等.因此,图像去雾算法的研究有着现实和理论的迫切需要. 在已有的文献中,人们提出了多种去雾方法.一种方法是利用相机附带的偏振光滤波器,以及同一场景点在不同偏振光条件下获得的图像,实现多幅图像去雾[2];该方法的缺点是对动态场景处理效果不好.另一种方法是利用同一场景在不同雾强度下

图像压缩算法的分析与研究本科毕业设计论文

图像压缩算法的分析与研究本科毕业设计论文 河南理工大学 本科毕业设计 图像压缩算法的分析与研究 摘? 要 随着多媒体技术和通讯技术的不断发展, 多媒体娱乐、信息高速公路等不断对信息数据的存储和传输提出了更高的要求, 也给现有的有限带宽以严峻的考验, 特别是具有庞大数据量的数字图像通信, 更难以传输和存储, 极大地制约了图像通信的发展, 因此图像压缩技术受到了越来越多的关注。图像压缩的目的就是把原来较大的图像用尽量少的字节表示和传输,并且要求复原图像有较好的质量。利用图像压缩, 可以减轻图像存储和传输的负担, 使图像在网络上实现快速传输和实时处理。 本文主要介绍数字图像处理的发展概况,图像压缩处理的原理和特点,对多种压缩编码方法进行描述和比较,详细讨论了Huffman编码的图像压缩处理的原理和应用。 关键词:图像处理,图像压缩,压缩算法,图像编码,霍夫曼编码

Abstract With the developing of multimedia technology and communication technology, multimedia entertainment, information, information highway have kept on data storage and transmission put forward higher requirements, but also to the limited bandwidth available to a severe test, especially with large data amount of digital image communication, more difficult to transport and storage, greatly restricted the development of image communication, image compression techniques are therefore more and more attention. The purpose of image compression is to exhaust the original image less the larger the bytes and transmission, and requires better quality of reconstructed images. Use of image compression, image storage

图像压缩算法论文

算法论文 基于huffman编码的图像压缩技术 姓名:康凯 学院:计算机学院 专业:网络工程1102 学号:201126680208 摘要 随着多媒体技术和通讯技术的不断发展, 多媒体娱乐、信息高速公路等不断对信息数据的存储和传输提出了更高的要求, 也给现有的有限带宽以严峻的考验, 特别是具有庞大数据量的数字图像通信, 更难以传输和存储, 极大地制约了图像通信的发展, 因此图像压缩技术受到了越来越多的关注。图像压缩的目的就是把原来较大的图像用尽量少的字节表示和传输,并且要求复原图像有较好的质量。利用图像压缩, 可以减轻图像存储和传输的负担, 使图像在网络上实现快速传输和实时处理。 本文主要介绍数字图像处理的发展概况,图像压缩处理的原理和特点,对多种压缩编码方法进行描述和比较,详细讨论了Huffman编码的图像压缩处理的原理和应用。 关键词:图像处理,图像压缩,压缩算法,图像编码,霍夫曼编码 Abstract With the developing of multimedia technology and communication technology, multimedia entertainment, information, information highway have kept on data storage and transmission put forward higher requirements, but also to the limited bandwidth available to a severe test, especially with large data amount of digital image communication, more difficult to transport and storage, greatly restricted the development of image communication, image compression techniques are therefore more and more attention. The purpose of image compression is to exhaust the original image less the larger the bytes and transmission, and requires better quality of

数字图像处理:部分课后习题参考问题详解

第一章 1.连续图像中,图像为一个二维平面,(x,y)图像中的任意一点,f(x,y)为图像于(x,y)于处的值。 连续图像中,(x,y)的取值是连续的,f(x,y)也是连续的 数字图像中,图像为一个由有限行有限列组成的二维平面,(i,j)为平面中的任意一点,g(i,j)则为图像在(i,j)处的灰度值,数字图像中,(i,j) 的取值是不连续的,只能取整数,对应第i行j 列,g(i,j) 也是不连续的,表示图像i行j列处图像灰度值。 联系:数字图像g(i,j)是对连续图像f(x,y)经过采样和量化这两个步骤得到的。其中 g(i,j)=f(x,y)|x=i,y=j 2. 图像工程的容可分为图像处理、图像分析和图像理解三个层次,这三个层次既有联系又有区 别,如下图所示。 图像处理的重点是图像之间进行的变换。尽管人们常用图像处理泛指各种图像技术,但比较狭义的图像处理主要是对图像进行各种加工,以改善图像的视觉效果并为自动识别奠定基础,或对图像进行压缩编码以减少所需存储空间 图像分析主要是对图像中感兴趣的目标进行检测和测量,以获得它们的客观信息,从而建立对图像的描述。如果说图像处理是一个从图像到图像的过程,则图像分析是一个从图像到数据的过程。这里的数据可以是目标特征的测量结果,或是基于测量的符号表示,它们描述了目标的特点和性质。 图像理解的重点是在图像分析的基础上,进一步研究图像中各目标的性质和它们之间的相互联系,并得出对图像容含义的理解以及对原来客观场景的解释,从而指导和规划行动。 如果说图像分析主要以观察者为中心来研究客观世界,那么图像理解在一定程度上是以客观世界为中心,借助知识、经验等来把握整个客观世界(包括没有直接观察到的事物)的。

单幅图像自动去雾新算法(精)

第16卷第4期2011年4月 中国图象图形学报Journa l o f I m age and G raphics V o.l 16,N o .4 A pr .,2011 中图法分类号:TP391.41 文献标志码:A 文章编号:1006-8961(201104-0516-06 论文索引信息:郭璠,蔡自兴,谢斌唐琎.单幅图像自动去雾新算法[J].中国图象图形学报,2011,16(4:516-521 收稿日期:2010-01-06;修回日期:2010-02-10基金项目:国家自然科学基金项目(。 第一作者简介:郭璠(1982 ,女。中南大学计算机应用技术专业博士研究生,主要研究方向为数字图像处理、虚拟实验环境等。E-m ai:l guofancs m 。 单幅图像自动去雾新算法 郭璠,蔡自兴,谢斌,唐琎 (中南大学信息科学与工程学院,长沙 410083 摘要:针对雾天拍摄图像的退化现象,提出一种针对单幅图像的自动去雾新算法。该算法先将有雾图像从RGB 转换到Y CbC r 颜色空间后,再在亮度分量上进行多尺度R eti nex 处理,所得的亮度图在图像清晰度评价指标的调控下经过反色变换和中值滤波即可求得传播图,并进一步得到清晰化后的复原图像。实验结果表明,该算法能有效地改善雾天图像的退化现象,提高图像的清晰度。 关键词:雾;清晰化;亮度分量;R e ti nex 算法;图像清晰度评价指标 New algorith m of auto m atic haze re moval for single image Guo Fan ,Ca i Zi x ing ,X i e B i n ,Tang Ji n

JPEG图像压缩算法及其实现

多媒体技术及应用 JPEG图像压缩算法及其实现 罗群书 0411102班 2011211684

一、JEPG压缩算法(标准) (一)JPEG压缩标准 JPEG(Joint Photographic Experts Group)是一个由ISO/IEC JTC1/SC2/WG8和CCITT VIII/NIC于1986年底联合组成的一个专家组,负责制定静态的数字图像数据压缩编码标准。迄今为止,该组织已经指定了3个静止图像编码标准,分别为JPEG、JPEG-LS和JPEG2000。这个专家组于1991年前后指定完毕第一个静止图像压缩标准JPEG标准,并且成为国际上通用的标准。JPEG标准是一个适用范围很广的静态图像数据压缩标准,既可用于灰度图像又可用于彩色图像。 JPEG专家组开发了两种基本的静止图像压缩算法,一种是采用以离散余弦变换(Discrete Cosine Transform, DCT)为基础的有损压缩算法,另一种是采用以预测技术为基础的无损压缩算法。使用无损压缩算法时,其压缩比比较低,但可保证图像不失真。使用有损压缩算法时,其算法实现较为复杂,但其压缩比大,按25:1压缩后还原得到的图像与原始图像相比较,非图像专家难于找出它们之间的区别,因此得到了广泛的应用。 JPEG有4种工作模式,分别为顺序编码,渐近编码,无失真编码和分层编码,他们有各自的应用场合,其中基于顺序编码工作模式的JPEG压缩系统也称为基本系统,该系统采用单遍扫描完成一个图像分量的编码,扫描次序从左到右、从上到下,基本系统要求图像像素的各个色彩分量都是8bit,并可通过量化线性地改变DCT系统的量化结果来调整图像质量和压缩比。下面介绍图像压缩采用基于DCT的顺序模式有损压缩算法,该算法下的JPEG压缩为基本系统。 (二)JPEG压缩基本系统编码器 JPEG压缩是有损压缩,它利用了人的视觉系统的特性,将量化和无损压缩编码相结合来去掉视觉的冗余信息和数据本身的冗余信息。基于基本系统的JPEG压缩编码器框图如图1所示,该编码器是对单个图像分量的处理,对于多个分量的图像,则首先应将图像多分量按照一定顺序和比例组成若干个最小压缩单元(MCU),然后同样按该编码器对每个MCU各个分量进行独立编码处理,最终图像压缩数据将由多个MCU压缩数据组成。 图1 JPEG压缩编码器结构框图

基于retinex的图像去雾算法

I=imread('1.jpg'); R = I(:, :, 1); G = I(:, :, 2); B = I(:, :, 3); R0 = double(R); G0 = double(G); B0 = double(B); [N1, M1] = size(R); Rlog = log(R0+1); Rfft2 = fft2(R0); sigma1 = 128; F1 = fspecial('gaussian', [N1,M1], sigma1); Efft1 = fft2(double(F1)); sigma2 = 256; F2 = fspecial('gaussian', [N1,M1], sigma2); Efft2 = fft2(double(F2)); sigma3 = 512; F3 = fspecial('gaussian', [N1,M1], sigma3); Efft3 = fft2(double(F3)); DR0 = Rfft2.* Efft1; DR = ifft2(DR0); DRlog = log(DR +1); Rr1 = Rlog - DRlog; DR0 = Rfft2.* Efft2; DR = ifft2(DR0); DRlog = log(DR +1); Rr2 = Rlog - DRlog; DR0 = Rfft2.* Efft3; DR = ifft2(DR0); DRlog = log(DR +1); Rr3 = Rlog - DRlog; Rr = (Rr1 + Rr2 +Rr3)/3; a = 125; II = imadd(R0, G0); II = imadd(II, B0); Ir = immultiply(R0, a); C = imdivide(Ir, II); C = log(C+1); Rr = immultiply(C, Rr); EXPRr = exp(Rr); MIN = min(min(EXPRr)); MAX = max(max(EXPRr)); EXPRr = (EXPRr - MIN)/(MAX - MIN); EXPRr = adapthisteq(EXPRr); Glog = log(G0+1); Gfft2 = fft2(G0); DG0 = Gfft2.* Efft1;

图像去雾霭算法及其实现..

图像去雾霭算法及其实现 电气工程及其自动化 学生姓名杨超程指导教师李国辉 摘要雾霭等天气条件下获得的图像,具有图像不清晰,颜色失真等等一些图像退化的现象,直接影响了视觉系统的发挥。因此,为了有效的改善雾化图像的质量,降低雾霭等天气条件下造成户外系统成像的影响,对雾霭图像进行有效的去雾处理显得十分必要。 本设计提出了三种图像去雾算法,一种是基于光照分离模型的图像去雾算法;一种是基于直方图均衡化的图像去雾算法;还有一种是基于暗原色先验的图像去雾算法。并在MATLAB的基础上对现实生活的图像进行了去雾处理,最后对不同的方法的处理结果进行了简要的分析。 关键词:图像去雾光照分离直方图均衡化暗原色先验

Algorithm and its implementation of image dehazing Major Electrical engineering and automation Student Yang Chaocheng Supervisor Li Guohui Abstract Haze weather conditions so as to obtain the image, the image is not clear, the phenomenon of color distortion and so on some image degradation, directly influence the exertion of the visual system. Therefore, in order to effectively improve the atomization quality of the image, reduce the haze caused by outdoor weather conditions such as imaging system, the influence of the haze image effectively it is necessary to deal with the fog. This design introduced three kinds of algorithms of image to fog, a model is based on the separation of light image to fog algorithm; One is the image to fog algorithm based on histogram equalization; Another is based on the dark grey apriori algorithms of image to fog. And on the basis of MATLAB to the real life to deal with the fog, the image of the processing results of different methods are briefly analyzed. Key words:Image to fog Light separation histogram Dark grey

JPEG2000图像压缩算法标准

JPEG2000图像压缩算法标准 摘要:JPEG2000是为适应不断发展的图像压缩应用而出现的新的静止图像压缩标准。本文介绍了JPEG2000图像编码系统的实现过程, 对其中采用的基本算法和关键技术进行了描述,介绍了这一新标准的特点及应用场合,并对其性能进行了分析。 关键词:JPEG2000;图像压缩;基本原理;感兴趣区域 引言 随着多媒体技术的不断运用,图像压缩要求更高的性能和新的特征。为了满足静止图像在特殊领域编码的需求,JPEG2000作为一个新的标准处于不断的发展中。它不仅希望提供优于现行标准的失真率和个人图像压缩性能,而且还可以提供一些现行标准不能有效地实现甚至在很多情况下完全无法实现的功能和特性。这种新的标准更加注重图像的可伸缩表述。所以就可以在任意给定的分辨率级别上来提供一个低质量的图像恢复,或者在要求的分辨率和信噪比的情况下提取图像的部分区域。 1.JPEG2000的基本介绍及优势 相信大家对JPEG这种图像格式都非常熟悉,在我们日常所接触的图像中,绝大多数都是JPEG格式的。JPEG的全称为Joint Photographic Experts Group,它是一个在国际标准组织(ISO)下从事静态图像压缩标准制定的委员会,它制定出了第一套国际静态图像压缩标准:ISO 10918-1,俗称JPEG。由于相对于BMP等格式而言,品质相差无己的JPEG格式能让图像文件“苗条”很多,无论是传送还是保存都非常方便,因此JPEG格式在推出后大受欢迎。随着网络的发展,JPEG的应用更加广泛,目前网站上80%的图像都采用JPEG格式。 但是,随着多媒体应用领域的快速增长,传统JPEG压缩技术已无法满足人们对数字化多媒体图像资料的要求:网上JPEG图像只能一行一行地下载,直到全部下载完毕,才可以看到整个图像,如果只对图像的局部感兴趣也只能将整个图片载下来再处理;JPEG格式的图像文件体积仍然嫌大;JPEG格式属于有损压缩,当被压缩的图像上有大片近似颜色时,会出现马赛克现象;同样由于有损压缩的原因,许多对图像质量要求较高的应用JPEG无法胜任。 JPEG2000是为21世纪准备的压缩标准,它采用改进的压缩技术来提供更高的解像度,其伸缩能力可以为一个文件提供从无损到有损的多种画质和解像选择。JPEG2000被认为是互联网和无线接入应用的理想影像编码解决方案。 “高压缩、低比特速率”是JPEG2000的目标。在压缩率相同的情况下,JPEG2000的信噪比将比JPEG提高30%左右。JPEG2000拥有5种层次的编码形式:彩色静态画面采用的JPEG 编码、2值图像采用的JBIG、低压缩率图像采用JPEGLS等,成为应对各种图像的通用编码方式。在编码算法上,JPEG2000采用离散小波变换(DWT)和bit plain算术编码(MQ coder)。此外,JPEG2000还能根据用户的线路速度以及利用方式(是在个人电脑上观看还是在PDA上观看),以不同的分辨率及压缩率发送图像。 JPEG2000的制定始于1997年3月,但因为无法很快确定算法,因此耽误了不少时间,直到2000年 3 月,规定基本编码系统的最终协议草案才出台。目前JPEG2000已由ISO和

数字图像处理整理经典

名词解释 数字图像:是将一幅画面在空间上分割成离散的点(或像元),各点(或像元)的灰度值经量化用离散的整数来表示,形成计算机能处理的形式。 1.数字图像:一幅图像f(x,y),当x,y和幅值f为有限的离散数值时,称该图像为数字图像。 图像:是自然生物或人造物理的观测系统对世界的记录,是以物理能量为载体,以物质为记录介质的信息的一种形式。 数字图像处理:采用特定的算法对数字图像进行处理,以获取视觉、接口输入的软硬件所需要数字图像的过程。 图像增强:通过某种技术有选择地突出对某一具体应用有用的信息,削弱或抑制一些无用的信息。 无损压缩:可精确无误的从压缩数据中恢复出原始数据。 灰度直方图:灰度直方图是灰度级的函数,描述的是图像中具有该灰度级的像素的个数。或:灰度直方图是指反映一幅图像各灰度级像元出现的频率。 细化:提取线宽为一个像元大小的中心线的操作。 8、8-连通的定义:对于具有值V的像素p和q ,如果q在集合N8(p)中,则称这两个像素是8-连通的。 9、中值滤波:中值滤波是指将当前像元的窗口(或领域)中所有像元灰度由小到大进行排序,中间值作为当前像元的输出值。 10、像素的邻域: 邻域是指一个像元(x,y)的邻近(周围)形成的像元集合。即{(x=p,y=q)}p、q为任意整数。像素的四邻域:像素p(x,y)的4-邻域是:(x+1,y),(x-1,y) ,(x,y+1), (x,y-1) 11、灰度直方图:以灰度值为自变量,灰度值概率函数得到的曲线就是灰度直方图。 12.无失真编码:无失真编码是指压缩图象经解压可以恢复原图象,没有任何信息损失的编码技术。 13.直方图均衡化:直方图均衡化就是通过变换函数将原图像的直方图修正为平坦的直方图,以此来修正原图像之灰度值。 14.采样:对图像f(x,y)的空间位置坐标(x,y)的离散化以获取离散点的函数值的过程称为图像的采样。 15.量化:把采样点上对应的亮度连续变化区间转换为单个特定数码的过程,称之为量化,即采样点亮度的离散化。 16.灰度图像:指每个像素的信息由一个量化的灰度级来描述的图像,它只有亮度信息,没有颜色信息。 17.色度:通常把色调和饱和度通称为色度,它表示颜色的类别与深浅程度。 18.图像锐化:是增强图象的边缘或轮廓。 19.直方图规定化(匹配):用于产生处理后有特殊直方图的图像的方法 20. 数据压缩:指减少表示给定信息量所需的数据量。 像素的邻域:邻域是指一个像元(x,y)的邻近(周围)形成的像元集合。即{(x=p,y=q)}p、q为任意整数。 像素的四邻域:像素p(x,y)的4-邻域是:(x+1,y),(x-1,y) ,(x,y+1),(x,y-1) 灰度直方图:灰度直方图是指反映一幅图像各灰度级像元出现的频率。?、中值滤波:中值滤波是指将当前像元的窗口(或领域)中所有像元灰度由小到大进行排序,中间值作为当前像元的输出值。 像素数字图像是由有限的元素组成的,每个元素都有一个特定的位置和幅值,这些元素称为图像元素、画面元素或像素。 4.空间分辨率:是图像中可辨别的最小细节。

图像去雾设计报告

课程设计——图像去雾 一、设计目的 1、通过查阅文献资料,了解几种图像去雾算法,; 2、理解和掌握图像直方图均衡化增强用于去雾的原理和应用; 3、理解和掌握图像退化的因素,设计图像复原的方法; 4、比较分析不同方法的效果。 二、设计容 采用针对的有雾图像,完成以下工作: 1、采用直方图均衡化方法增强雾天模糊图像,并比较增强前后的图像和直方图; 2、查阅文献,分析雾天图像退化因素,设计一种图像复原方法,对比该复原图像与原始图像以及直方图均衡化后的图像; 3、分析实验效果; 4、写出具体的处理过程,并进行课堂交流展示。 三、设计要求 1、小组合作完成; 2、提交报告(*.doc)、课堂交流的PPT(*.ppt)和源代码。

四、设计原理 (一)图像去雾基础原理 1、雾霭的形成机理 雾实际上是由悬浮颗粒在大气中的微小液滴构成的气溶胶,常呈现乳白色,其底部位于地球表面,所以也可以看作是接近地面的云。霭其实跟雾区别不大,它的一种解释是轻雾,多呈现灰白色,与雾的颜色十分接近。广义的雾包括雾、霾、沙尘、烟等一切导致视觉效果受限的物理现象。由于雾的存在,户外图像质量降低,如果不处理,往往满足不了相关研究、应用的要求。在雾的影响下,经过物体表面的光被大气中的颗粒物吸收和反射,导致获取的图像质量差,细节模糊、色彩暗淡。 2、图像去雾算法 图像去雾算法可以分为两大类:一类是图像增强;另一类是图像复原。图1-1介绍了图像去雾算法的分类: 图1-1 去雾算法分类

从图像呈现的低亮度和低对比度的特征考虑,采用增强的方法处理,即图像增强。比较典型的有全局直方图均衡化,同态滤波,Retinex 算法,小波算法等等。 基于物理模型的天气退化图像复原方法,从物理成因的角度对大气散射作用进行建模分析,实现场景复原,即图像复原。运用最广泛、最权威的是由何凯明等人提出的暗通道先验的方法。 (1)图像增强技术 为了改善视觉效果或者便于人们对图像的判别和分析,根据图像的特征采取简单的改善方法或者加强特征的措施叫做图像增强。图像增强可分为两大类:频率域法和空间域法。空间域处理主要包括:点处理,模块处理即领域处理。频率域处理主要包括:高、低通滤波、同态滤波等等。 图像增强可分为两大类:频率域法和空间域法。空间域处理主要包括:点处理,模块处理即领域处理。频率域处理主要包括:高、低通滤波、同态滤波等等。 (2)图像复原技术 从广义上讲,图像复原是一个求逆问题,逆问题经常存在非唯一解,甚至无解。图像复原的目的是将所观测到的退化图像恢复到退化前的原始图像,这种恢复过程在很多图像处理中的应用十分重要。为了更好的对图像复原的理解,图1-2为图像复原的流程图:

图像压缩算法

《算法设计与分析》课程报告 姓名:文亮 学号:201322220254 学院:信息与软件工程学院 老师:屈老师;王老师

算法实现与应用——《算法设计与分析》课程报告 一. 基本要求 1. 题目: 图像压缩 2. 问题描述 掌握基于DCT 变换的图像压缩的基本原理及其实现步骤;对同一幅原 始图像进行压缩,进一步掌握DCT 和图像压缩。 3. 算法基本思想 图像数据压缩的目的是在满足一定图像质量的条件下,用尽可能少的比特数来表示原始图像,以提高图像传输的效率和减少图像存储的容量,在信息论中称为信源编码。图像压缩是通过删除图像数据中冗余的或者不必要的部分来减小图像数据量的技术,压缩过程就是编码过程,解压缩过程就是解码过程。压缩技术分为无损压缩和有损压缩两大类,前者在解码时可以精确地恢复原图像,没有任何损失;后者在解码时只能近似原图像,不能无失真地恢复原图像。 假设有一个无记忆的信源,它产生的消息为{}N ≤≤i a i 1,其出现的概率是已知的,记为()i a p 。则其信息量定义为: ()()i i a p a log -=I 由此可见一个消息出现的可能性越小,其信息量就越多,其出现对信息的贡献量越大,反之亦然。 信源的平均信息量称为“熵”(entropy ),可以表示为: ()()[]()()∑∑==-=?=H N i i i N i i i a p a p a p I a p 1 1 log 对上式取以2为底的对数时,单位为比特(bits ): ()()∑=-=H N i i i a p a p 1log 根据香农(Shannon )无噪声编码定理,对于熵为H 的信号源,对其进行无

基于matlab的图像去雾算法详细讲解与实现附matlab实现源代码

基于matlab的图像去雾算法详细讲解与实现-附matlab 实现源代码

————————————————————————————————作者: ————————————————————————————————日期: ?

本文主要介绍基于Retinex理论的雾霭天气图像增强及其实现。并通过编写两个程序来实现图像的去雾功能。 1Rentinex理论 Retinex(视网膜“Retina”和大脑皮层“Cortex”的缩写)理论是一种建立在科学实验和科学分析基础上的基于人类视觉系统(Human Visual System)的图像增强理论。该算法的基本原理模型最早是由Edwin Land(埃德温?兰德)于1971年提出的一种被称为的色彩的理论,并在颜色恒常性的基础上提出的一种图像增强方法。Retinex 理论的基本内容是物体的颜色是由物体对长波(红)、中波(绿)和短波(蓝)光线的反射能力决定的,而不是由反射光强度的绝对值决定的;物体的色彩不受光照非均性的影响,具有一致性,即Retinex理论是以色感一致性(颜色恒常性)为基础的。 根据Edwin Land提出的理论,一幅给定的图像S(x,y)分解成两幅不同的图像:反射物体图像R(x,y)和入射光图像L(x,y),其原理示意图如图8.3-1所示。 图-1 Retinex理论示意图 对于观察图像S中的每个点(x,y),用公式可以表示为:? S(x,y)=R(x,y)×L(x,y) (1.3.1)实际上,Retinex理论就是通过图像S来得到物体的反射性质R,也就是去除了入射光L的性质从而得到物体原本该有的样子。 2 基于Retinex理论的图像增强的基本步骤 步骤一: 利用取对数的方法将照射光分量和反射光分量分离,即: S'(x,y)=r(x,y)+l(x, y)=log(R(x,y))+log(L(x, y)); 步骤二:用高斯模板对原图像做卷积,即相当于对原图像做低通滤波,得到低通滤波后的图像D(x,y),F(x, y)表示高斯滤波函数: D(x,y)=S(x, y) *F(x, y); 步骤三:在对数域中,用原图像减去低通滤波后的图像,得到高频增强的图像G (x,y): G(x,y)=S'(x, y)-log(D(x, y)) ;

数字图像处理的基本方法

一、图像的预处理技术 图像处理按输入结果可以分为两类,即输入输出都是一副图像和输入一张图像输出不再是图像的数据。图像处理是个很广泛的概念,有时候我们仅仅需要对一幅图像做一些简单的处理,即按照我们的需求将它加工称我们想要得效果的图像,比如图像的降噪和增强、灰度变换等等。更多时候我们想要从一幅图像中获取更高级的结果,比如图像中的目标检测与识别。如果我们将输出图像中更高级的结果视为目的的话,那么我们可以把输入输出都是一幅图像看作是整个处理流程中的预处理。下面我们将谈到一些重要的预处理技术。 (一)图像增强与去噪 图像的增强是一个主观的结果,原来的图像按照我们的需求被处理成我们想要的效果,比如说模糊、锐化、灰度变换等等。图像的去噪则是尽可能让图像恢复到被噪声污染前的样子。衡量标准是可以度量的。不管是图像的增强与去噪,都是基于滤波操作的。 1.滤波器的设计方法 滤波操作是图像处理的一个基本操作,滤波又可分为空间滤波和频域滤波。空间滤波是用一个空间模板在图像每个像素点处进行卷积,卷积的结果就是滤波后的图像。频域滤波则是在频率域看待一幅图像,使用快速傅里叶变换将图像变换到频域,得到图像的频谱。我们可以在频域用函数来保留或减弱/去除相应频率分量,再变换回空间域,得到频域滤波的结果。而空间滤波和频域滤波有着一定的联系。频域滤波也可以指导空间模板的设计,卷积定理是二者连接的桥梁。 (1)频域滤波 使用二维离散傅里叶变换(DFT )变换到频域: ∑∑-=+--==10)//(210),(),(N y N vy M ux i M x e y x f v u F π 使用二维离散傅里叶反变换(IDFT )变换到空间域: ∑∑-=-=+=1010)//(2),(1),(M u N v N vy M ux i e v u F MN y x f π 在实际应用中,由于该过程时间复杂度过高,会使用快速傅里叶变换(FFT )来加速这个过程。现在我们可以在频域的角度看待这些图像了。必须了解的是,图像中的细节即灰度变化剧烈的地方对应着高频分量,图像中平坦变化较少的地方对应着低频分量。图像中的周期性图案/噪声对应着某一个频率区域,那么在频域使用合适的滤波器就能去除相应的频率分量,再使用傅里叶反变换就能看到实际想要的结果。 不同的是,在频域的滤波器不再是做卷积,而是做乘积,因为做乘法的目的在于控制频率分量。比较有代表性的有如下几个滤波器: 高斯低通滤波器 222/),(),(σv u D e v u H -= D 是距离频率矩形中心的距离。该滤波器能保留低频分量,逐渐减小高频分量,对原图像具有模糊作用。

图像压缩算法性能的测试与分析工具

图像压缩算法性能的测试与分析工具1 蔡正兴,张虹 中国矿业大学计算机科学与技术学院,江苏徐州 (221008) 摘要:本文研究了图像压缩算法性能的评价方法,提出了图像压缩算法性能的测试算法,包括横向比较测试和纵向分解测试,并在此基础上设计并实现了压缩算法性能的测试与分析工具。该工具能够测试和分析压缩算法的性能,并自动生成各种分析图表,为用户提供了方便,具有较大的实用价值。为了提高评价的效率、准确性和全面性,文中提出了测试图像的选择方法和测试结果的分析方法,具有一定的理论意义。 关键词:压缩性能,测试方法,分析方法,图像选择方法 1. 引言 近年来,图像压缩得到快速发展[1],各种算法层出不穷,比如有损的压缩算法可以在低失真的条件下达到高压缩比[2,3],而无损的压缩算法则可以保证重建图像的无失真[4]。因此在实际应用中得知各种压缩算法的性能及特点是必要的。在评价图像压缩算法性能时主要考虑压缩比、重建质量、时间复杂度、空间复杂度和实现代价这几个方面[5],其中较为重要的是压缩比、重建质量和时间复杂度。为了计算这些压缩性能指标,常常使用一些工具软件,比如在图像处理领域广泛使用的MATLAB系列软件,它提供了大量的内置函数[6],操作方便,功能强大,但它不是评价图像压缩算法性能的专业工具,需要进行二次开发,不能有效的分析和评价压缩性能。其次,利用性能指标来评价压缩方法,尽管方便快捷,但还不能反映图像压缩算法的全部特点。例如,在考虑变换编码系统的失真性质时,一般采用MSE(均方误差),有时利用MSE计算得到的重建质量很好,但视觉效果却不好,这是因为MSE对图像中的失真显著性不敏感[7],可见,性能指标仅仅是对压缩算法进行宏观上的评价,无法评价每个过程对压缩性能的影响。再次,在评价压缩性能时,不可避免地要使用测试图像,用户在选择测试图像时带有随机性,不利于全面地评价压缩方法。针对这些不足,本文设计了图像压缩算法性能的测试与分析工具——AutoTA。AutoTA的目标是自动地对图像压缩算法进行测试与分析,并生成各种分析图表,全面的评价图像压缩算法的性能。AutoTA具有广泛的应用前景,科研人员利用AutoTA可横向比较各种压缩算法的性能,也可纵向分析压缩算法的特点;工程技术人员也可以根据AutoTA的测试结果,在实际应用中选择合适的图像压缩算法。 2. 压缩算法性能指标 压缩性能指标是评价压缩算法的重要方面,也是AutoTA分析图像压缩算法性能的重要依据,下面将描述相关的性能指标。 2.1压缩比 压缩比是指压缩过程中输入数据量和输出数据量之比,反映了图像压缩算法的压缩性能,当压缩比小于1时为正压缩,当压缩比大于1时为负压缩。压缩比的计算公式为: 1本课题得到国家自然科学基金项目(编号:60372102)、教育部博士点基金项目(编号:20030290011)、软件新技术国家重点实验室课题(编号:A200309)资助。

相关主题