搜档网
当前位置:搜档网 › OpenCV入门教程

OpenCV入门教程

OpenCV入门教程
OpenCV入门教程

OpenCV 入门教程

作者:于仕琪

shiqi.yu@https://www.sodocs.net/doc/f95274310.html, https://www.sodocs.net/doc/f95274310.html,

2012年8月

版权所有?于仕琪

本作品采用知识共享署名-相同方式共享 4.0 国际许可协议进行许可。

前言

1

OpenCV 是一个广受欢迎的开源计算机视觉库,它提供了很多函数,实现了

很多计算机视觉算法,算法从最基本的滤波到高级的物体检测皆有涵盖。很多

初学者希望快速掌握OpenCV 的使用方法,但往往会遇到各种各样的困难。其

实仔细分析,造成这些困难的原因有两类:第一类是C/C++编程基础不过关;

第二类是不了解算法原理。解决这些困难无非提升编程能力,以及提升理论基

础知识。提升编程能力需要多练习编程,提升理论知识需要系统学习《数字图

像处理》、《计算机视觉》和《模式识别》等课程,所有这些都不能一蹴而就,

需要耐下心来认真修炼。同时我们也需要认识到OpenCV 只是一个算法库,能

为我们搭建计算机视觉应用提供“砖头”。我们并不需要完全精通了算法原理

之后才去使用OpenCV,只要了解了“砖头”的功能,就可以动手了。在实践

中学习才是最高效的学习方式。本小册子希望为初学者提供引导,使初学者快

速了解OpenCV 的基本数据结构以及用法。此外,如您发现有错误之处,欢迎

来信指正。

于仕琪

深圳大学

插播广告:欢迎有能力、有激情以及对计算机视觉有兴趣的同学报考我的

研究生。欲了解详情可以访问深圳大学招生网https://www.sodocs.net/doc/f95274310.html,/或者给我发email。

目录

第 1 章预备知识 (5)

1.1编程的流程 (5)

2

1.2什么叫编辑 (6)

1.3什么叫编译 (6)

1.4什么叫连接 (7)

1.5什么叫运行 (7)

1.6Visual C++是什么 (8)

1.7头文件 (9)

1.8库文件 (10)

1.9OpenCV 是什么 (11)

1.10什么是命令行参数 (12)

1.11常见编译错误 (13)

1.11.1找不到头文件 (13)

1.11.2拼写错误 (14)

1.12常见链接错误 (15)

1.13运行时错误...................................................................................... 17第

2 章OpenCV 介绍 (19)

2.1OpenCV 的来源 (19)

2.2OpenCV 的协议 (19)

第 3 章图像的基本操作 (21)

3.1图像的表示 (21)

3.2Mat 类 (23)

3.3创建Mat 对象 (24)

3.3.1构造函数方法 (24)

3.3.2create()函数创建对象 (25)

3.3.3Matlab 风格的创建对象方法 (26)

3

3.4矩阵的基本元素表达 (26)

3.5像素值的读写 (27)

3.5.1at()函数 (28)

3.5.2使用迭代器 (29)

3.5.3通过数据指针 (30)

3.6选取图像局部区域 (32)

3.6.1单行或单列选择 (32)

3.6.2用Range 选择多行或多列 (33)

3.6.3感兴趣区域 (33)

3.6.4取对角线元素 (34)

3.7Mat 表达式 (34)

3.8Mat_类 (36)

3.9Mat 类的内存管理 (38)

3.10输出 (40)

3.11Mat 与IplImage 和CvMat 的转换 (42)

3.11.1Mat 转为IplImage 和CvMat 格式 (42)

3.11.2IplImage 和CvMat 格式转为Mat (42)

第4 章数据获取与存储 (44)

4.1读写图像文件 (44)

4.1.1读图像文件 (44)

4.1.2写图像文件 (45)

4.2读写视频 (47)

4.2.1读视频 (47)

4.2.2写视频 (49)

4

第1章预备知识

OpenCV 是一个功能强大的计算机视觉库,要用好它,除了要具有相关的计算机视觉理论知识外,还需要具有一定的编程能力。本书作者通过对OpenCV 中文论坛中的大量问题观察,发现有很大比例的问题是因为用户对C/C++语言不熟练,导致出错,或出错后不知如何解决。如果对C/C++语言不熟悉,那使用OpenCV 时会满头雾水瞎摸索,费心费力。

在这一章中,将介绍一些编程的基本概念,让读者对编程的流程有一个基本

了解。这样在出现错误时,可以快速确定错误的类型,并知道该如何解决。

1.1编程的流程

一个编程的基本流程包括编辑、编译和连接三大步骤。其流程图如图 1.1 所示。

5

6

图 1.1 编程的基本流程

1.2什么叫编辑

编辑(edit )代码即编写代码,是编程的第一步。你可以任意一个编辑器进行代码的编写。你可以使用 Windows 自带的“记事本”来编写代码,也可以使用 Notepad++,或者 Visual Studio 提供的编辑器。

编辑 编译 a.cpp a.obj opencv_core.lib

编辑

编译

b.cpp

b.obj

连接

main.exe

图 1.2 使用Windows 自带的记事本编辑代码

虽然可以使用记事本软件编辑代码,但是记事本软件的功能非常有限。缺少常用的语法高亮,自动缩进等功能。所以可以使用其他功能更丰富的编辑器,如Notepad++(图 1.3)等。

图 1.3 使用Notepad++软件编辑代码

1.3什么叫编译

编译(compile)是将用某种编程语言(如C++语言)写成的源代码,转换成目标文件。目标文件包含着机器代码(可直接被计算机中央处理器执行)以及代码在运行时使用的数据。编译器(compiler)是实现这一目的的软件。编译器有很多,如在Windows 下有微软公司的cl.exe,在Linux 下有gcc 和g++。在命令行下使用cl.exe 对hello.cpp 源代码进行编译,如图 1.4 所示。编译后,将得到目标文件hello.obj,如图 1.5 所示。

7

图 1.4 在命令行下使用cl.exe 对hello.cpp 进行编译

图 1.5 编译后,将新生成hello.obj 目标文件

1.4什么叫连接

连接(link)是将多个目标文件,以及库文件生成可执行的文件(或静态库、或动态库)的过程。连接器(linker)是实现这一目的的软件。常用的连接器有Windows 下的link.exe,Linux 下的ld 等。

在Windows 下可以使用link.exe 将前面生成的hello.obj 连接为可执行文件。在命令行下效果如所图 1.6 示。连接后,将生成可执行文件,如图 1.7 所示。

图 1.6 在命令行下使用link.exe 对hello.obj 进行连接

图 1.7 连接后,将新生成hello.exe 可执行文件

8

1.5什么叫运行

运行(run)较容易理解,我们在Windows 资源管理器里用鼠标双击exe 可执行程序,可以使程序被载入CPU 运行。我们也可以在命令行窗口中输入可执行程序的文件名运行,如图 1.8 所示。

图 1.8 在命令行窗口中运行hello.exe,可以看到程序打印到标准输出的结果。

1.6Visual C++是什么

通过前面的介绍,可以看到一个编程的流程:编辑->编译->连接->运行。更

具体来说,完成这个流程需要你:

1.打开记事本软件,编辑代码,并保存;

2.在命令行下运行编译器,对代码进行编译,生成目标文件;

3.在命令行下运行连接器,将目标文件连接起来,生成可执行程序;

4.在命令行下,或Windows 资源管理器中运行程序,验证程序的正确性。

如果你的项目只有一个源代码文件,完成上面四个步骤尚可接受。但是如果你的项目包括几十个甚至几百个源文件,如无其他软件辅助,只用上面四个非常基本的步骤进行编程开发,会让人抓狂。

集成开发环境(Integrated Development Environment,简称IDE)可以帮助你

对项目进行管理。常用的IDE 有微软公司的Visual Studio,里面包含Visual C++,Visual C#等,其他的还有Eclipse、NetBeans、Delphi 等。因此我们平时所说的VC 不是一种编程语言,也不是编译器,它只是一个IDE。

IDE 一般包含编辑器。IDE 自带的编辑器一般都针对编程语言进行了定制,实现语法高亮、自动缩进、自动补全等方便的功能。IDE 还提供丰富的菜单和按

9

10

钮工具,如图 1.9、图 1.10 和图 1.11 所示。

如果你点击 IDE 中的“生成(build )”按钮(图 1.11),或者点击菜单“生成(build )”中的菜单项“生成项目(build project )”,那么 IDE 会去调用编译器 cl.exe 和连接器 link.exe 来生成可执行程序。如果你在调试状态下,还会去调用调试器

(debugger )。IDE 会提升程序开发的效率,特别是调试程序的效率。

图 1.9 微软 Visual Stdio 集成开发环境

图 1.10 Visual Stdio 中的编辑按钮

图 1.11 Visual Stdio 中的生成程序按钮

1.7头文件

在编程过程中,程序代码往往被拆成很多部分,每部分放在一个独立的源文件中,而不是将所有的代码放在一个源文件中。考虑一个简单的小例子:程序中有两个函数 main()和 foo()。main()函数位于 main.cpp ,foo()函数位于 foo.cpp , main()函数中调用 foo()

函数。在编译阶段,由于编译是对单个文件进行编译,所

11

以编译 main.cpp 时,编译器不知道是否存在 foo()函数以及 foo()调用是否正确,因此需要头文件辅助。也就是说,在编译命令:

cl.exe /c main.cpp

运行时,编译器不知道 foo 的用法是否正确(因为 foo 在另一个文件 foo.cpp 中),只有借助头文件中的函数声明来判断。对 main.cpp 进行编译时,不会涉及 foo.cpp 文件,只会涉及 main.cpp 和 foo.h (因为 foo.h 被 include )文件。头文件的作用如图 1.1 所示。

图 1.12 对 main.cpp 进行编译时,需要利用头文件中的 foo()函数声明来确认 main.cpp 中 对 foo()的调用是正确的

1.8库文件

库文件中包含一系列的子程序。例如在上一节的例子中,foo.cpp 源文件中实现了 foo()函数,我们假设 foo()函数是包含重要算法的函数,我们需要将 foo() 函数提供给客户使用,但是不希望客户看到算法源代码。为了达到这一目的,我们可以将 foo.cpp 编译程库文件(图 1.13),库文件是二进制的,在库文件中是看不到原始的源代码的。库和可执行文件的区别是,库不是独立程序,他们是向其他程序提供服务的代码。

#include "foo.h" int foo(int i, int j) {

…… }

int foo(int i, int j);

2 . 函数声明是 int foo(int i, int j) ,你的 调用看上去是对的。

foo.h

foo.cpp

#include "foo.h" int main() {

int i=foo(3,4); return i; }

. foo() 1 函数 这样用对

main.cpp

当然使用库文件的好处不仅仅是对源代码进行保密,使用库文件还可以减少重复编译的时间,增强程序的模块化。将库文件连接到程序中,有两种方式,一种是静态连接库,另一种是动态连接库。如果希望了解更多关于库文件的知识,请查阅相关资料,再次不详细分析它们之间的异同。

图 1.13 库是二进制的文件,里面包含一系列子程序(图有问题)

1.9OpenCV 是什么

OpenCV 其实就是一堆C 和C++语言的源代码文件,这些源代码文件中实

现了许多常用的计算机视觉算法。例如 C 接口函数cvCanny()实现了Canny 边

缘提取算法。可以直接将这些源代码添加到我们自己的软件项目中,而不需要

自己再去写代码实现Canny 算法,也就是不需要重复“造轮子”。

由于OpenCV 中源代码文件巨多,根据算法的功能,将这些源文件分到多个模块中:core、imgproc、highgui等。将每个模块中的源文件编译成一个库文件

12

(如opencv_core.lib、opencv_imgproc.lib、opencv_highgui.lib 等),用户在使用时,仅将所需的库文件添加到自己的项目中,与自己的源文件一起连接成可执行程序则可。

1.10什么是命令行参数

C/C++语言中的main 函数,经常带有参数argc,argv,如下:

int main(int argc, char** argv) 或者

int main(int argc, char* argv[])

在上面代码中,argc表示命令行输入参数的个数(以空白符分隔),argv 中

存储了所有的命令行参数。假如你的程序是hello.exe,如果在命令行运行该程序(如图 1.14。首先应该在命令行下用 cd 命令进入到 hello.exe 文件所在目录),运

行命令为:

hello.exe Shiqi Yu

那么,argc 的值是 3,argv[0]是"hello.exe",argv[1]是"Shiqi",argv[2]是"Yu"。

图 1.14 使用命令行参数运行程序

下面的程序演示argc 和argv 的使用:

#include int main(int

argc, char ** argv)

{ int i; for (i=0; i

< argc; i++)

printf("Argument %d is %s.\n", i, argv[i]); return 0;

}

13

假如上述代码编译为hello.exe,那么运行

hello.exe a b c d e

将得到

Argument 0 is hello.exe.

Argument 1 is a.

Argument 2 is b.

Argument 3 is c.

Argument 4 is d.

Argument 5 is e. 运行

hello.exe lena.jpg 将得到

Argument 0 is hello.exe.

Argument 1 is lena.jpg.

1.11常见编译错误

在编程中,经常会出现各种错误。出现错误后,不要闭眼抱头作痛苦状。出现错误后,需要做的第一件事情是阅读出错信息。出错信息虽然看似凌乱,但是能够提供很多有价值的信息,帮你解决问题。

1.11.1找不到头文件

找不到头文件往往会提示如下错误:

hello.cpp(2): fatal error C1083: Cannot open include file:

'opencv2/opencv.hppp': No such file or directory

找不到头文件一般有两个原因:一个是头文件的文件名拼写错误;或者未将头文件所在路径添加到开发环境中。上例中的错误是文件名拼写错误,

opencv2/opencv.hpp 被错误地拼写为opencv2/opencv.hppp。如果文件名拼写正确,编译器还是找不到头文件,则需要将头文件所在路径添加到相应的变量中。

如在Visual Studio 2010 中,需要在项目属性(Project Property)对话框中设置

头文件路径。具体位置在对话框“VC++ Directories”里面的“Include Directories” 中,如图 1.15 所示。

14

图 1.15 头文件所在路径设置

1.11.2拼写错误

在编程中,拼写错误也是一类常见错误。如图 1.16 所示代码中,将imread 函数错误地拼成imreadd,编译器会提示错误:

hello.cpp(9): error C3861: 'imreadd': identifier not found

这句错误提示的意思是说无法找到imreadd 标识符,因此我们需要仔细检查imreadd 找不到的原因。假如你真的有一个函数是imreadd,但是找不到,可能的原因是声明imreadd 的头文件未使用include 语句包含到源文件中。

15

16

图 1.16 拼写错误,将 imread 拼成了 imreadd ,会造成编译时错误。

如果源代码不符合语法规则,则会造成编译错误。编译错误往往是由于编写代码不仔细造成,比如拼写错误、漏了半个括号、漏了分号等。因此一旦遇到便宜错误,你需要按照错误提示,定位到出错的位置,仔细检查语法是否符合规范。

1.12常见链接错误

如果你的代码符合语法规则,则会通过编译过程。编译完所有源代码之后, 下一步是连接目标文件,以形成可执行文件。连接过程中最常见的错误如下(图 1.17):

1>hello.obj : error LNK2019: unresolved external symbol "class cv::Mat __cdecl cv::imread(class std::basic_string,class std::allocator> const &,int)" ( ?imread@cv@@YA?AVMat@1@ABV?$basic_string@DU?$char_traits@D@std@@ V?$allocator@D@2@@std@@H@Z) referenced in function _main

这个错误信息里最关键的词是“unresolved external symbol ”,更具体的意思是在 main 函数中使用了 imread 函数,但是无法从外部找到 imread 。imread 函数是 OpenCV 的函数,不是用户自己实现的函数。opencv.hpp

头文件告诉编

译器有个imread 函数可以用,编译通过;但是到了连接时,连接器却找不到imread 的具体实现,故出错。

图 1.17 连接错误,无法找到imread 等函数的实现

要解决这一问题,需要将依赖的库文件添加到项目设置中。具体位置在对话框“Linker - Input”里面的“Additional Dependencies”中,如图 1.18 所示。

图 1.18 添加依赖的库文件

17

18

1.13运行时错误

经过编译和连接过程,生成了可执行的文件(如 exe 文件)之后,在运行这 个可执行文件所产生的错误是运行时错误。比较常见的运行时错误是内存错误。比如下面这段代码:

#include

#include using namespace cv; int main() { printf("Hello, OpenCV!\n");

Mat img = imread("lena.jpg"); Mat gray; cv::cvtColor(img, gray, CV_BGR2GRAY);

return 0; }

编译和连接过程无任何问题,但在运行时弹出如图 1.19 所示对话框,并在命令行窗口输出错误信息(图 1.20)。

图 1.19 运行时错误对话框

图 1.20 运行时错误的出错信息

错误信息中提示 color.cpp 文件的第 2834 行有错,错误原因是条件 (scn==3||scn==4)不成立。很多 OpenCV

用户看到此错误信息一头雾水,不知如

何下手解决。根据程序源代码的意思,是将三通道的BGR 图像img 转为单通道

的图像gray。但是程序说img 既不是 3 通道,也不是 4 通道。而根据imread

函数的文档,imread 将图像作为彩色图像读入,条件(scn==3||scn==4)肯定成立。

这个程序的问题出现在当前目录下无lena.jpg 文件,这样程序无法读到图像,

造成cvtColor 函数出错。因此对于读入图像时,需要检查图像读入是否成功,以免造成运行时错误。

在程序编写中,对于数组和指针等,要特别地小心。因为对于空指针以及数

组越界等问题,编译器无法在编译时给出错误提示。这类错误一旦在运行时发生,排除起来非常困难。

19

第2章OpenCV 介绍

OpenCV 的全称是Open Source Computer Vision Library,是一个开放源代码

的计算机视觉库。OpenCV 是最初由英特尔公司发起并开发,以BSD 许可证授

权发行,可以在商业和研究领域中免费使用,现在美国Willow Garage 为OpenCV 提供主要的支持。OpenCV 可用于开发实时的图像处理、计算机视觉以

及模式识别程序,目前在工业界以及科研领域广泛采用。

2.1OpenCV 的来源

OpenCV 诞生于Intel。Intel 最初希望提供一个计算机视觉库,使之能充分发

掘CPU 的计算能力,当然更希望以此促进Intel 的产品的销售。OpenCV 最初的

开发工作是由Intel 在俄罗斯的团队实现。这里面有两个关键人物,一个是Intel

性能团队(Intel’s Performance Library Team)的李信弘(Shinn Lee)先生,他是

团队的经理,负责IPP 等库,给予OpenCV 很大的支持。另一个关键人物是Vadim Pisarevsky,Vadim 在Intel 负责OpenCV 的项目管理、代码集成、代码优

化等工作。在后期Intel 支持渐少的时候,是Vadim Pisarevsky 一直在维护着OpenCV。2007 年6 月,受本书作者之邀,李信弘和Vadim Pisarevsky 作为嘉

宾参加了在北京举行的“开放源代码计算机视觉库(OpenCV)研讨会”1,并做了

非常有价值的报告。

在2008 年,一家美国公司,Willow Garage2,开始大力支持OpenCV,Vadim Pisarevsky 和Gary Bradski 都加入了Willow Garage。Gary Bradski 也是OpenCV 开

发者中的元老级人物,他曾出版《Leaning OpenCV》一书,广受欢迎。

Willow Garage 是一家机器人公司,致力于为个人机器人开发开放的硬件平台

和软件。现在已经开发了PR2 机器人,并支持ROS、OpenCV、PCL 等软件。ROS (Robot Operating System)是用于机器人的操作系统,是一个开放源代码的软件,OpenCV 作为ROS 的视觉模块嵌入。

自从获得Willow Garage 支持后,OpenCV 的更新速度明显加快。大量的新

特性被被加入OpenCV 中,很多算法都是最近一两年的新的科研成果。OpenCV

正日益成为算法研究和产品开发不可缺少的工具。

1研讨会网址:https://www.sodocs.net/doc/f95274310.html,/index.php/OpenCV_Symposium

2 Willow Garage 公司网站:https://www.sodocs.net/doc/f95274310.html,

20

相关主题