搜档网
当前位置:搜档网 › 基于深度学习的车辆型号识别

基于深度学习的车辆型号识别

基于深度学习的车辆型号识别
基于深度学习的车辆型号识别

1讲了神经网络、卷积神经网络的基础概念,讲得比较通俗易懂,作者是在自己理解了之后来讲的;

2深度学习的车牌识别没看懂

分类号学号M201171824

学校代码10487 密级

硕士学位论文

基于深度学习的车辆型号识别

学位申请人:熊祎

学科专业:通信与信息系统

指导教师:刘文予教授

答辩日期:2014.1.22

A Thesis Submitted in Partial Fulfillment of the Requirements

for the Degree for the Master of Engineering Vehicle Type Recognition Based On Deep Learning

Candidate : Yi Xiong

Major : Communication and Infromation System

Supervisor : Prof. Wenyu Liu

Huazhong University of Science & Technology

Wuhan 430074, P. R. China

January 22, 2014

独创性声明

本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除文中已经标明引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写过的研究成果。对本文的研究做出贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律结果由本人承担。

学位论文作者签名:

日期:年月日

学位论文版权使用授权书

本学位论文作者完全了解学校有关保留、使用学位论文的规定,即:学校有权保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权华中科技大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。

保密□,在年解密后适用本授权书。

不保密□。

(请在以上方框内打“√”)

学位论文作者签名:指导教师签名:

日期:年月日日期:年月日

摘要

目标识别是计算机视觉一个重要的研究领域,由此延伸出的车辆型号识别具有重要的实际应用价值,特别是在当今交通状况复杂的大城市,智能交通系统成为发展趋势,这离不开对车辆型号进行识别和分类的工作,本文围绕如何利用计算机视觉的方法进行车辆型号的识别和分类展开了一系列研究:

本文对当前的目标识别和分类的特征和算法做了总结和归纳。分析比较了作为图像特征描述常见的特征算子,总结归纳了他们的提取方法、特征性能以及相互之间的关联。另外,介绍了在目标识别工作中常用的分类方法,阐述了他们各自的原理和工作方法。研究了深度神经网络的理论依据,分析比较了深度神经网络不同的特征学习方法,以及卷积神经网络的训练方法。分析比较不同特征学习方法的特点选取k-means 作为本文使用的特征学习方法,利用卷积神经网络结构搭建深度学习模型,进行车辆车型识别工作。

本文为了测试基于深度学习的车辆型号分类算法的性能在30个不同型号共7158张图片上进行实验;并在相同数据上利用改进了的SIFT特征匹配的算法进行对比实验;进过实验测试,深度学习方法在进行车型分类的实验中取得94%的正确率,并在与SIFT 匹配实验结果对比后进一步证实:深度学习的方法能够应用在车辆型号识别领域。

关键词:k均值聚类,深度学习,卷积神经网络,尺度不变特征变换, 支撑向量机

Abstract

Object recognition is one of the most important research fields of computer vision. Vehicle type recognition, as one of the extensions of object recognition, is indispensable in intelligent traffic systems, considering today's complex urban traffic conditions. This paper focuses on figuring out how to use computer vision methods for vehicle type recognition and classification.

We first summarized the popular features and algorithms used in object recognition and classification. Deep analysis on those useful image descriptors is given in this paper. And the properties and relationship of those descriptors are also analyzed. We summed up their extraction algorithms as well. In addition, we gave an overview of the most useful classification algorithm used in this field. The theory basis of deep neural network is studied, and different learning methods which are used in deep neural network are compared. We also explained the way to train convolution neural network. Finally, we choose k-means to learn the image feature and build up the recognition system based on convolution neural network method.

We collected a total of 7158 images covering 30 types of vehicle to do the experiments to verify the characteristic of the deep learning network on vehicle recognition. And we also used improved SIFT matching method to classify the same image set. During the experiments, deep learning network achieved 94% accuracy , after compared to SIFT matching results, we can come to a conclusion that the deep learning can be used to do vehicle type recognition.

Key words:k-means, deep learning, CNN, SIFT, SVM

目录

摘要 .................................................................................................................. I Abstract ................................................................................................................ I I 1. 绪论

1.1. 研究背景 (1)

1.2. 国内外智能交通系统现状 (2)

1.3. 国内外深度学习研究现状 (4)

1.4. 本文的结构和内容 (5)

2. 目标识别算法综述

2.1. 图像特征提取 (7)

2.2. 基于机器学习的分类算法 (12)

2.3. 神经网络与深度神经网络 (14)

2.4. 特征学习方法及模型 (16)

2.5. 卷积神经网络训练过程 (20)

2.6. 本章小结 (21)

3. 基于SIFT特征匹配的车型识别

3.1. 算法概述 (22)

3.2. 算法改进 (28)

3.3. 实验结果及分析 (33)

3.4. 本章小结 (35)

4. 基于深度学习的车型识别模型

4.1. 无监督特征学习 (36)

4.2. 利用SVM分类器进行卷积网络优化 (42)

4.3. 基于深度学习的车型识别模型 (44)

4.4. 算法实现及实验 (45)

4.5. 本章小结 (49)

5. 结论与展望 (50)

致谢 (52)

参考文献 (54)

英文单词缩写与中文对照表

SIFT Scale-invariant feature transform 尺度不变特征变换DoG Difference of Gaussian operator 高斯差分算子LoG Laplacian of Gaussian operator 高斯拉普拉斯算子SURF Speeded Up Robust Feature 加速的健壮特征LBP Local Binary Patterns 局部二值纹理HOG Histogram of Oriented Gradient 方向梯度直方图SVM Support Vector Machine 支撑向量机

KNN K Nearest Neighbor K近邻

CNN Convolutional Neural Networks 卷积神经网络ZCA Zero Component Analysis 零成分分析

1.绪论

1.1.研究背景

现在,信息呈现方式已经从单一的文本丰富到包括音频、图像、视频等多媒体数据在内的各种形式,随着互联网进入Web2.0时代,信息数量更是呈指数增长。如何高效检索到有价值的信息并加以利用,是近几年来学者和工程师们研究的热点问题。

由于数据不再是单一的文本,因此,用特征关键词(或标签)对文本进行标注、检索的方式已经无法满足现在的应用需求,特别是在海量数据中,进行图片的查找、分类和内容识别更是需要新技术作为支撑。计算机视觉技术从实验室研究的热点发展到能够应用到实际生活,给各行各业带来了巨大的影响。

计算机视觉的目的是让计算机能和人类一样完成视觉行为,从图像或场景中自主分析提取有用信息,主要有物体检测、目标识别、物体跟踪、形状分类等研究方向。其应用领域则涵盖了互联网、医疗、交通等诸多领域。特别是在交通领域,随着城市建设和人们的消费水平提高,城市街道状况越来越复杂,道路上车辆越来越多,因此很多问题也接踵而至——交通事故、道路障碍、乘车抢劫、车辆拥堵等等。这些状况如果都依靠交警人工监控是非常耗时费力的,构建智能化的交通系统是现在城市交通发展的趋势。目前已经出现了很多智能交通系统,他们可以进行交通监控、事故预防、交通拥堵预防和通行税征收等工作。由于监控相机和监控录像采集到的海量数据由人工进行分析处理效率低下无法做到实时性且容易出错,智能监控要求系统能够尽量减少人工操作环节,自动完成车辆的检测以及各类感兴趣内容的识别和判断,对道路交通中发生的各类情况及时做出响应。利用计算机视觉技术能够高效地捕捉到有用的信息并进行后续的处理。因此,智能交通系统中计算机视觉起能到关键性的作用。

车辆的检测和识别则是智能交通系统的技术核心,车辆识别在车辆管理、车辆违规逃逸、车辆收费等诸多问题上都起着关键作用。本文也将围绕如何高效、准确、智能化的进行车辆型号识别展开。

在车辆信息识别方面关于车牌的检测识别已经有非常多的研究成果,也有很多成

熟的产品投入市场。但是车牌信息只是车辆信息很少的一部分,单纯依赖车牌的系统是不稳定的,比如车牌沾污、套牌车等情况导致车牌信息不可用的时候,这类系统就无法提供可靠而有用的车辆信息了。因此,我们希望能够获得车辆其他方面的信息,其中最为重要的就是车辆型号,针对车辆型号的识别主要步骤有:车辆检测、用于识别的区域选取和定位、该区域的特征提取及分类器分类。车辆型号分类效果在很大程度上依赖于两个方面:一个就是提取能够描述车辆型号的特征,这些特征需要有很强的鲁棒性来应对一定角度的偏转、一定范围内的光照变化以及图像尺度变化;另一方面就是针对特征进行分类器选择。多数研究都是集中在特征选取上,因为分类效果的好坏很大程度上取决于所选特征。

就目前的车辆分类算法来看,车辆识别的核心问题和主要困难有以下几点:

1)不同光照条件对识别效果影响很大。比如天气状况不同,车辆在晴天和阴雨、下雪天气视觉上是不一样的,晴天车辆图片一般都较为清晰,但是强烈光照会带来局部反光过强的问题,阴雨天气图片昏暗模糊,下雪则有可能覆盖车辆的某些区域;另外即使在同一天由于阳光颜色的变化也会影响图片质量。

2)车辆所处的场景多变。高速卡口图片背景单一,能够与车辆有高区分度,但是在城市交通图片中背景很复杂,车辆之间也可能存在相互遮挡,也会有房树木投射到路面的阴影干扰。

3)车辆本身外观多变。比如形状、颜色、尺寸等,另外,拍摄点的距离不同、拍摄角度不同都会影响到最终车辆在图片中的呈现姿态和外观。

1.2.国内外智能交通系统现状

目前国内外已经有不少智能交通系统,从大的方向来看有以下两类:

第一类是需要硬件支持的。一般都需要在道路路面下铺设传感器,如果有车辆驶过传感器,传感器则收集车辆数据并进行分析得到相关的车辆信息。这种方法的优点是能够没有遗漏的捕获通过的车辆,但是由于传感器收集的数据有限,所以能够得到的车辆信息很少并且精度不高。除此之外,传感器对车辆速度以及工作环境状况都有一定要求。由于硬件设施成本高,安装维修都不方便,因此这类系统的应用范围受到

限制。

另外一类通过使用视频检测、图像处理和识别等计算机视觉方法实现[1]。这个方向的研究比较零散。早期Tan[2]和Sullivan[3]通过匹配图像边缘特征去简化车辆轮廓匹配模型,达到从路面检测到不同姿态和尺寸的车辆。Gupte et al[4]则根据高速拍摄到的车辆侧面图像判断车辆是否为小轿车,他们只用从二值图像中提取的宽度和高度信息,达到70%的分类准确度。还有利用车辆长度对车辆进行计数的系统[5]。后来Hasegawa 和Kanad[6]从图片中提取一种11维的特征对街道上的车辆类型进行识别,这种特征包括宽度、高度、面积和轮廓以及各种图形矩,他们利用线性判别将车辆分为六大类,正确率能达到91%,但是对光照变化不鲁棒,变化了光照强度会使结果下降很多。类似的系统还有Ji et al.[7]利用车辆侧面图,结合Gabor特征用最小距离度量分类,将车辆分为5个类别,能达到95%的识别率。Morris等人[8]利用在二值图像上的简单形态学方法,加上线性判别分析(LDA),模糊C-means聚类以及加权k最近邻(wkNN)将车辆分为8类,准确率达到94%,但这个结果不包括判别置信度低而被丢弃的样本。文献[9, 10]中基于PCA-SVM的方法仅将车辆分为货车、乘用车、面包车和皮卡。近两年又出现了基于3D模型[11-13]的车辆检测和识别系统。还有的方法使用边缘特征结合SIFT描述子[14]的系统,以及基于多区块局部二值模式(LBP)识别的分类系统[15]。他们能够将车辆型号进行更精确的划分,但也是停留在货车、小型货车、轿车以及出租车之间的区分。国内则有一些基于车标识别[16, 17]对车辆的品牌加以识别的研究,但是由于车标区域较小,因此对图像质量要求非常高。

可以看出目前对于车辆具体型号的分类系统还很少,大多数系统只能将车辆粗略分为几个大类。近年来,文献[18]中讨论了利用多种的特征进行车型分类,另外有利用Canny算子结合机器学习进行分类[19],但效果都很有限。直到SIFT特征匹配方法[20]被提出才取得较好的分类效果,因此SIFT特征一直被广泛应用在各类智能交通系统中。

汽车正面包含的结构和纹理特征最为丰富,特别是车头部分,一般采用车头区域对车辆进行识别,SIFT特征匹配算法不需要精确定位车头区域,而其他的一些边缘或者轮廓的做法则要求定位精准文献[21]采取先确定车牌的位置,然后向左右上下扩展一定范围定位车头区域,这不仅要求车牌位置精确,而且对车辆朝向以及拍摄角度要求

等条件都很高。一旦某一个或几个条件发生变化,就会造成车头与车牌的相对比例发生改变,这种方法得到的车头区域就将不准确。可见,基于SIFT特征匹配的算法是各种车辆识别方法中相对而言最为可靠的。本文将把它与本文的方法进行比较。

1.3.国内外深度学习研究现状

用来进行车辆分类的特征需要对尺度、旋转以及一定的角度变换、光照变化都有很好的鲁棒性,一般都是人工花费大量时间和精力去设计合适的特征。为了能让计算机自动选择合适特征,人工神经网络就应运而生了,早在1999年就有国外的研究者利用神经网络对物体进行分类,但由于其性能存在诸多问题,因此被人们冷落了很长时间,直到深度学习(deep learning)的提出才又重新成为研究热点。

深度学习(deep learning)的概念开始引起人们的注意是在大约2006年前后,当时Geoffrey Hinton和Ruslan Salakhutdinov[22]的实验表明,多层的前向神经网络能够逐层做高效的前期训练(pre-training),采用无监督的限制性玻尔兹曼机对每一层进行训练,最后在利用有监督的后向传播做微调(fine-tuning)。其实早在1992年,Jurgen Schmidhuber在更一般情况下,实现过一个类似的无监督层次结构递归神经网络[23, 24]并且从实验上证明了模型可以有效地提高有监督学习的速度。但是对于实际应用来说还是很慢,因此一直以来用支撑向量机(SVM)等方法进行目标识别更受人们的欢迎。直到2010年,Ciresan et al[25]使用非线性深度后向传播网络,在MNIST[26]手写字数据集上进行实验,实验结果超越了所有不使用无监督学习的前人方法,人们才逐渐转向将深度学习用来做目标检测和识别的研究。此外,随着硬件的发展,深度学习已经能够通过各种途径得到速度上的提升,从而逐渐被运用到解决实际问题当中。最近Google、百度等公司都成立了相关的研究机构,甚至推出了相关产品。可以看到,虽然对于深度学习的研究已经很多,但是多数研究都是将深度学习作为辅助工具进行前期训练,提高有监督学习的效率;最近出现的将深度学习运用到手写字的识别上,启发我们将深度学习应用到其他目标的识别及分类问题上。上一节的介绍中,我们指出车辆分类的核心问题就是设计不同的特征来提高分类的效果和精确程度,但由于设计特征很困难,因此,尝试结合深度学习的方法来完成这项工作。本文的目的就是要探讨使用深

度学习的方法进行图像的特征提取等工作的可行性,并且在这些特征上进行车辆型号的识别工作。

1.4.本文的结构和内容

目前已有的车型识别系统[1],多数只能根据边缘和几何特征对车辆型号进行粗略的分类,如:轿车、客车、货车、面包车等;另外,一些根据车标进行品牌分类的系统识别准确率也都不高;如果要精确的区分车辆具体型号,需要设计复杂的特征,但是复杂特征的设计难度很大。而深度学习在进行手写字识别[25]上取得的较好实验效果,证明深度神经网络能够学习到描述能力强的特征。因此,本文拟采用深度学习的方法,利用其特征学习能力解决对车型进行精细识别的问题。深度学习仅是一个抽象概念,如何针对车型识别这一具体问题进行深度神经网络架构和优化是本文的研究重点。

本文研究内容主要包括,1)介绍车辆型号识别现状和深度学习理论,分析总结出各自的优缺点,提出改进思路;2)研究将深度神经网络引入目标识别和分类问题中的具体方法;3)研究了卷积神经网络的构建方法和训练方法;4)提出针对车型识别的卷积神经网络模型,并通过实验证实该模型在车辆型号分类上的效果;5)与改进的SIFT 特征匹配分类方法进行对比。

本文分为四个章节:

第一章主要介绍了车辆检测和识别的应用背景和目前该领域存在的主要问题和挑战,阐述了研究车辆型号识别的目的和意义,并对当前现有的智能交通系统做了介绍,比较各种车型分类识别的方法,介绍深度学习在特征提取和文字识别上的发展状况,提出车辆分类算法新思路。

第二章对当前的车辆分类特征和算法做了详细的描述。分析各种特征之间的优势和劣势,并对主流的粉类算法的思想做了描述和总结,分析了每类算法的优点和缺点,为本文提出的基于卷积神经网络的车辆识别算法打下了基础。

第三章介绍了基于SIFT特征匹配算法。首先对传统的SIFT特征匹配算法做了介绍,分析该模型存在的问题,并提出了改进方法;然后将改进后的SIFT匹配算法应用于车型识别问题中,最后给出实验结果及分析。

第四章给出基于深度神经网络的车型识别模型,讨论了该模型的核心算法,并给出以该算法为核心的车型识别系统架构。然后对算法实现并给出实验结果,重点讨论了实验过程中一些对结果影响较大的工程细节,最后对算法进行了总结和归纳。

2.目标识别算法综述

传统的目标识别主要是利用一种或多种特定的特征去表示图片中目标物体区域,然后利用分类器对所得的特征向量进行分类,车辆型号的识别其实就是目标识别的对象为车辆,方法流程基本一致。物体的轮廓线条是可以描述目标特征的全局特征,但是在尺度变换、旋转变换之后变化很大,从而表达能力发生变化。而局部特征由于在一定程度上对尺度和旋转的变化具有鲁棒性,所以作为描述图片的特征更有优势。现在目标识别使用的局部特征算子很多,如LBP[27-30]、SIFT[31]、HOG[32-34]等,这些特征中使用最多的就是SIFT特征和HOG,本文将用到SIFT特征,因此,我们简单地介绍SIFT特征的设计及描述方法,并对最常用的机器学习分类器做简单的阐述。

机器学习的核心问题就是让计算机模拟人类大脑工作,为此科学家们构建出人工神经网络模型,算法在提供初始条件后自主从数据学习新知识,不断增强自身的学习和理解能力。深度学习的提出给神经网络的学习能力带来了飞跃。本章会介绍深度学习相关研究,为后文建立基于卷积神经网络进行车型识别提供理论依据。

2.1.图像特征提取

SIFT(Scale-invariant feature transform)[31]是目标识别中最常用的局部特征算子之一。David Lowe在1999年首先提出了利用尺度不变的局部特征[35]进行目标识别,在此基础上发展并提出完善的SIFT算法,算法使用的梯度统计信息对图像旋转平移、尺度变换、光照变化都可以保持不变性,具有很强的区分能力。SIFT主要包括特征点检测和特征描述两部分,下面分别介绍两部分的内容。

1)构建尺度空间

首先,要保证最后提取的特征能具有尺度不变性,需要针对原始图片生成它的多尺度表示,这个过程就是在构建尺度空间。文献[36]中证明:能实现尺度变换的线性卷积核只有线性核高斯卷积核,因此,利用一组尺度可变的高斯函数与原始图像做卷积得到一系列图像,这些图像就称作一幅图像的尺度空间:

?x,y,σ=G x,y,σ?I x,y(2-1)

I x,y表示原始图像其中x,y表示像素点空间坐标,?表示卷积运算,G x,y,σ表示一组尺度可变的高斯函数,σ表示相应的尺度:

e? x2+y22σ2(2-2)

G x,y,σ=1

2πσ

σ的大小决定卷积运算后图像的平滑度,与σ值越大的卷积核运算,所得图像分辨率越低,丢失原图像细节只保留概貌;与图像运算的卷积核σ值越小,分辨率越高,能够保留图像的细节。

将原始图像和一系列尺度等比递增的高斯核进行卷积,得到尺度空间中的图片金字塔是SIFT算法的第一步,这可以得到不同尺度的图片从而能模拟不同距离下的观测效果。在所得的图像尺度空间金字塔中,越高层的图片模糊程度越高,对应的高斯核越大,计算量越大。David为了降低计算复杂度提出使用组(octave)的概念。具体做法如下:最下层的几张图(即第一组)用较小的高斯核计算,计算量较小图像模糊程度不高,可以直接用相应的卷积核计算。从σ到2σ之间的几张图像大小一致,这些图像组成一组(octave),当σ增大到2σ的时候,对原图像做下采样,下采样之后图像长宽都减到原来的一半,此时,可以用第一组的高斯核在缩小后的图片上做卷积,得到下一组(octave)图片,如此反复建立好所有的尺度空间。

2)极值点检测

找到高斯差分尺度空间的极值点是为了得到稳定的特征点的关键点,其中要用到高斯差分尺度空间(DoG scale-space),该尺度空间可用高斯差分函数和输入图像做卷积得到:

D x,y,σ= G x,y,kσ?G x,y,σ?I x,y(2-3)

=?x,y,kσ??x,y,σ

一般是使用尺度归一化高斯拉普拉斯算子(LoG)[37]算子,提取稳定的图像特征点,为了简化把LoG替换成DoG进行近似计算。由公式(2-3)可以看出,只需将同组的相邻层次如图2-1所示的方式逐层相减就可以得到差分金字塔。

图2-1生成DoG金字塔

寻找高斯差分空间极值点的方法是:将每个点与它同尺度相邻的点以及上下两相邻尺度相同位置及领域的共26个点作比较,如图2-2所示。若该点比这26个点都大或都小则是局部极值点。

图2-2选取局部极值点

3)去除不稳定关键点

为了确定候选的极值点的位置和尺度SIFT算法利用三维二次函数做拟合。另外为了所得特征稳且能较好对抗噪声,还应去除低对比度点和边缘点。对于空间尺度函数:

D x,y,σ=D x,y,σ+?D T

ex x+1

2

x Te2D

ex

(2-4)

求导后令导数为0,求得候选点的位置值x

x=??2D?1?D(2-5)

带入空间尺度函数得到:

D x=D x,y,σ+1

2?D T

ex

x(2-6)

只保留D x≥0.03的极值点就去除了对比度低的候选点。

由于DoG具有强边缘反应,因此会检测到一些虚假边缘,为了去除不稳定边缘点,首先计算DoG算子在空间维度上的Hessian矩阵:

H=D xx D xy

D xy D yy(2-7)

D的主曲率和上式特征值成正比,首先,对上式进行特征根分析可以得到曲面的主曲率,如果两个方向的曲率都很大说明是角点,若只在某一方向上曲率很大则是边缘点,然后,将灰度变化最快的方向作为SIFT特征主方向,能获得旋转不变性,最后,用两个特征根之间的比值作为阈值进行边缘点筛选,得到稳定的边缘点。

4)生成描述子

检测得到图像稳定的特征点之后,就要对特征点所在的局部进行描述,上面已经提到为了具有旋转不变性,要确定特征点的主方向,即灰度变化最快的方向,为此我们要针对每个点计算梯度的大小和方向:

m x,y= ?x+1,y??x?1,y,σ2+ ?x,y+1??x,y?12(2-

8)

θx,y=arctan?x,y+1??x,y?1

?x+1,y??x?1,y,σ

(2-9) 故一个特征点包含:位置、尺度和方向三个信息。SIFT把360度平均分为36个区间,在以关键点为中心的方形邻域中进行像素的梯度方向统计,找到直方图峰值所在的角度范围,这是该关键点处的邻域梯度方向,即为该点方向。

然后针对每一个关键点生成一个128维的描述子,具体生成方法是:找到该特征点对应的尺度金字塔层级,在该层对应的图像中找到对应点,并取对应点周围8×8区域,计算区域内所有像素梯度值和方向角,然后在每个4×4小块中计算8个方向上的梯度直方图如图2-3所示,得到的2×2的分块区域每个小区域都包含8方向信息,增强了算法稳定性和容错性。

图2-3关键点特征向量生成

再利用一个高斯核函数进行权重调整,远离中心点的位置权重降低,然后进行总描述子的计算:找到关键点周围16×16区域,然后分为16个4×4小块,每个小块包含8个维度的信息,故最后得到16×8共128维的特征。如图2-4所示:

图2-4 SIFT特征生成

描述子最后进行向量归一化处理,从而能够对光照变换具有鲁棒性。

5)图像匹配

SIFT用于分类的一种思路是检测图像的SIFT关键点,然后求关键点的SIFT特征,将计算得到的关键点和特征与数据库中已知类别的图像做相似度计算,如果相似度很高达到判别阈值则认为找到的是同类图片,从而解决目标分类问题。其中相似度的衡量标准可以是简单的向量间欧式距离,也可以是自己定义的相似度衡量标准。由于SIFT 计算量大,较为耗时,因此也出现了针对这个问题的优化方法如:PCA-SIFT[38]、SURF[39]

等。

2.2.基于机器学习的分类算法

2.2.1.K近邻算法

K近邻(K nearest neighbor,KNN)作为数据挖掘的十大经典算法之一也在图像分类中用的很多,大多数基于特征匹配的分类算法都需要用到KNN或者他的变形。K近邻是从最近邻算法发展而来的,在最近邻算法中,计算测试样本到所有训练样本的距离,找到距离最近的样本所属类别作为分类结果。K近邻则是寻找K个最近邻样本,然后让K个样本进行投票决定测试样本点所属类别。在目标分类领域,关键点特征匹配加上K近邻的方式非常常用,效果也不错,特别是标记样本数据不充足的时候比基于分类的方法可靠性更高,但是其缺点也很明显,需要存储大量数据,并且计算量也很大。为了优化计算也出现了K-dtree、VOCtree[40, 41]等优化算法。

2.2.2.支撑向量机算法

支撑向量机(Support Vector Machine, SVM)[42]的目的是将线性可分的数据进行分类,而对线性不可分的样本,算法寻找映射函数将数据从低维空间映射到一个高维空间,要求在该高维空间中数据线性可分,最后在高维空间中则可以用超平面进行样本分类。另外,SVM还要求最后得到的判决面是最优的,即所得判决面两侧离判决面最近的样本到超平面距离最大。设训练样本为:x1,y1,x2,y2,…,x n,y n,x i表示样本特征向量,y i表示样本的标签取值为?1,1若存在超平面:

w?x+b=0(2-10) 则样本线性可分,因此两类的间距可以表示成2ω,因此为了得到最优判决平面就要对类间距进行优化,求解最优判决平面的问题转化为下面这个规划问题:

min?ω=1

ω2(2-11)

2

s.t. y i w?x i+b≥1,i=1,2,…,n

然后用拉格朗日法将上述问题转化为对偶的二次规划问题:

江南营_江南深度研学之旅(1)

诗梦江南,入画寻踪 ——长清区实验小学江南深度研学实践之旅 【课程简介】 一道水,一架桥,一支橹声,隽秀婉约的聚合了太多的历史文化。此次研学活动旨在让同学们了解祖国江南,同时感受一场从远古传说,到春秋的吴越文化,到南北朝的文人风骨,再到明清以及近代的大儒伟人的历史盛宴。活动中,同学们将一起寻访王羲之、蔡元培、鲁迅、周恩来等名人伟人故里,穿越历史,冶爱国之志,体悟文化魅力;一起走进园,欣赏宋代江南私家园林的秀美景观,探寻园林蕴含的文化涵;一起游历西湖,领略“淡妆浓抹总相宜”的如画美景;一起走进综合性人文科学博物馆博物馆、中国黄酒博物馆,全面了解历史文化。 【课程特色】 ●文化名镇江南风采 ●穿越时空触摸历史 【行程简表】

上午探访安昌古镇漫游小桥流水梦回江南水乡游历江南小镇,画笔描绘 第五天 下午乘坐高铁前往:车次G60东-西 15:22-19:48辅导员送站一次相聚一生情谊备注:因天气交通等原因,组委会保留调整活动顺序及个别项目的权力,保证活动总量不变。 【活动费用】 2900/人;包含火车(往返高铁)及活动期间所有的费用。 ?【人文积淀-理性思维】·第一天下午·钱塘江·六和塔 钱塘江潮被誉为“天下第一潮”,是世界一大自然奇观,它是天体引力和地球自转的离心作用,加上湾喇叭口的特殊地形所造成的特大涌潮。六和塔位于省市西湖之南,钱塘江畔 月轮山上,是中国现存最完好的砖木结构古塔之一。 小任务1:学生面对浩渺的钱塘江,接受审美教育,并结合手册提示,探究钱塘江大潮的在科学原理; 小任务2:学生走进六和塔,收集关于六和塔的传说故事,留下自己与六和塔最美的合照; ?【审美情趣-人文积淀】·第二天上午·西湖·省博物馆 西湖,是一首诗,一幅天然图画,一个美丽动人的故事,不论是多年居住在这里的人还是匆匆而过的旅人,无不为这天下无双的美景所倾倒。平湖秋月、断桥残雪、柳浪闻莺、花 港观鱼、雷峰夕照、双峰插云、南屏晚钟、三潭印月,西湖十景个擅其胜。省博物馆是省规 模最大的综合性人文科学博物馆,文物品类丰富,年代序列完整。 小任务1:集体创绘,全体学生齐动手,集体协作,面对美景,协作创作最美的西湖; 小任务2:走进博物馆,寻访国宝,找一找最能代表江南文化的文物,向小组同学分享并交流;

基于深度学习的车辆型号识别

1讲了神经网络、卷积神经网络的基础概念,讲得比较通俗易懂,作者是在自己理解了之后来讲的; 2深度学习的车牌识别没看懂 分类号学号M201171824 学校代码10487 密级 硕士学位论文 基于深度学习的车辆型号识别 学位申请人:熊祎 学科专业:通信与信息系统 指导教师:刘文予教授 答辩日期:2014.1.22

A Thesis Submitted in Partial Fulfillment of the Requirements for the Degree for the Master of Engineering Vehicle Type Recognition Based On Deep Learning Candidate : Yi Xiong Major : Communication and Infromation System Supervisor : Prof. Wenyu Liu Huazhong University of Science & Technology Wuhan 430074, P. R. China January 22, 2014

独创性声明 本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除文中已经标明引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写过的研究成果。对本文的研究做出贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律结果由本人承担。 学位论文作者签名: 日期:年月日 学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规定,即:学校有权保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权华中科技大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。 保密□,在年解密后适用本授权书。 不保密□。 (请在以上方框内打“√”) 学位论文作者签名:指导教师签名: 日期:年月日日期:年月日

基于深度学习的图像识别

基于深度学习的图像识别 摘要:本文讨论了两种实现图像识别的深度学习(Deep Learning,DL)方法:卷积神经网络(Convolution Neural Network,CNN)与深度信念网络(Deep Belief Network,DBN)。 关键词:深度学习,卷积神经网络,深度信念网络 1前言 在计算机图像处理中,最困难但又最让人兴奋的任务就是让机器可以实现图像分类,从而通过图像识别物体的种类。 这项任务很难实现。在数据库中的图像总是在不同状态下记录的。这意味这光线与角度的多变性。 而可运用的计算能力的限制是一大障碍。我们不可能像让人类识别图像一样让机器识别图像。计算能力的限制导致可供训练与测试的数据有限,而模型的复杂程度也受到限制。 但是,目前这种情况得到极大的改善。综合多CPU/综合多GPU系统(multi-CPU/multi-GPU systems)使得运行高速神经网络成为现实,而费用也可以负担得起。人们对深度学习模型在图像识别与机器学习中的应用兴趣渐浓,而与之对抗的传统模型日渐式微。目前最具意义的研究方向就是运用深度学习模型,处理综合数据库中的图像识别问题。 本文主要关注深度神经网络(DNN)在图像识别在的作用。 深度神经系统主要有多层特征提取单元组成。低层特征提取单元提取了简单特征,之后依照该单元的规模进行学习,并按该单元的权重或参照物将特征反馈给高层特征提取单元。而高层特征提取单元可以提取更复杂的特征。 目前有一些实现深层学习网络的方法。深度信念网络(DBN)一个多层生成模型,而每一层都是一个统计编码器(statistical encoder)。这些统计编码器都是基于附属于它的更低层的结点(unit)。而这种训练主要关注训练数据中的最大化概率。 DBN在众多领域都有成功运用,如手写数据识别与人类手势识别。 另一个深度学习模型是卷积神经网络(CNN),与相似层次尺寸的标准化前向反馈网络不同,这个模型所需的连接与参照物比较少,使其训练也更简单。 层次深,规模大的DNN结构往往可以产生最好的结果。这意味这我们需要数量巨大的基础样本与种类丰富的训练样本,以确保面对状况多变的数据时,我们的训练数据仍代表性。 2 模型介绍 人类的视觉系统可以在多种情况下高效识别物体,而对计算机算法,这个任务并不简单。 深度神经网络便是模拟哺乳动物视觉网络。这已被验证为这项任务的最佳实现方案。目前,有人已运用这种模型,设计出识别准确性可能高于人类的机器图像识别系统。 2.1 卷积神经网络(CNN) 卷积神经网络系统(CNNs)是专注处理图案识别的多层网络系统。它是多层感知器(Multi-Layer Percentrons,MLPs)的变体,灵感来自于生物系统。 CNNs是分层型(hierarchical)神经网络。通过运用卷积计算(convolution)将集成层(pooling layers)交织起来,CNNs可以实现特征信息的自动提取,形成可完成最终分类的一系列全连接的网络层次。 卷积神经网络 结构:输入,卷积,深层取样(sub-sampling)/总集成与分类层(max-pooling and classification layers) 2.1.1 卷积层(Convolution layer) 卷积成通常可由特征图(feature map)的数目,核(kernel)的大小(sizes),与先前层的联系来展现。 每一层都包含了相同维度的特征图M,如 ) , ( y x M M;这些特征图可以通过先前层的一系列卷积运算得到。而在这些运算中,它们之间有相互关

基于小波变换的图像边缘检测算法

基于小波变换的图像边缘检测算法仿真实 现 学生姓名:XX 指导教师:xxx 专业班级:电子信息 学号:00000000000 学院:计算机与信息工程学院 二〇一五年五月二十日

摘要 数字图像边缘检测是图像分割、目标区域识别和区域形态提取等图像分析领域中十分重要的基础,是图像识别中提取图像特征一个重要方法。 目前在边缘检测领域已经提出许多算法,但是提出的相关理论和算法仍然存在很多不足之处,在某些情况下仍然无法很有效地检测出目标物的边缘。由于小波变换在时域和频域都具有很好的局部化特征,并且具有多尺度特征,因此,利用多尺度小波进行边缘检测既能得到良好的抑制噪声的能力,又能够保持边缘的完备。 本文就是利用此方法在MATLAB环境下来对数字图像进行边缘的检测。 关键词:小波变换;多尺度;边缘检测

Abstract The boundary detection of digital image is not only the important foundation in the field of image segmentation and target area identification and area shape extraction, but also an important method which extract image feature in image recognition. Right now, there are a lot of algorithms in the field of edge detection, but these algorithms also have a lot of shotucuts, sometimes, they are not very effective to check the boundary of the digital image. Wavelet transform has a good localization characteristic in the time domain and frequency domain and multi-scale features, So, the boundary detection of digital image by using multi-scale wavelet can not only get a good ability to suppress noise, but also to maintain the completeness of the edge. This article is to use this method in the environment of MATLAB to detect the boundary of the digital image. Keywords: wavelet transform; multi-scale; boundary detection.

研学方案

“研学旅行”实施方案 一、项目实施背景 从2013年发布《国民休闲旅游纲要》到2016年的《关于推进中小学生研学旅行的意见》,国家教育部等多部门发文要求大力推进研学旅行。研学旅行有利于促进学生培育和践行社会主义核心价值观,激发学生对党、对国家、对人民的热爱之情;有利于推动全面实施素质教育,创新人才培养模式,引导学生主动适应社会,促进书本知识和生活经验的深度融合;有利于加快提高人民生活质量,满足学生日益增长的旅游需求,从小培养学生文明旅游意识,养成文明旅游行为习惯。近年来,各地积极探索开展研学旅行,部分试点地区取得显著成效,在促进学生健康成长和全面发展等方面发挥了重要作用。二、定位与宗旨 目前大多数研学旅行还处在研究开发状态,良莠不齐,市场认可度不够,家长热度不高(尤其省内)。这是我们的机遇,也是挑战,我们的定位是要打造出一个学校认可、家长认可、学生认可的研学品牌,让学生在研学中学到东西。 三、具体实施 (一)方案A:纯旅游研学 本方案以若干旅游景点为研学地点,前期采取跟旅行社合作的方式(合作方式有待探讨),研学的核心(课件+“内容”)内容采取跟大学历史系或者旅游系的老师合作。 该方案的优点:该方案采用跟旅行社合作,研学路线可以借用

旅行社的优势,资源充分整合,老师和家长的路线选择多,可以极大丰富学生的课外知识,并且可以开展夏令营和冬令营活动。缺点是要综合考虑各个年龄段的学生,路线过多,会导致前期工作准备不够充足。 方案细节初步安排如下: 1、前期工作(3月20日-3月30日): (1)与某个旅行社达成合作关系(目前有合作意向的有康辉旅行社); (2)与某个大学的历史或者旅游系老师达成合作关系,负责研学核心内容的开发,包括路线的选择和内容的开发 (3)完成计划的策划和确定具体实施细节。 2、中期工作(4月1日-5月30日) (1)4月1日-4月15日与旅行社和老师确定最终的研学路线; (2)4月15日-5月30日一个半月的时间根据最终具体的研学路线,来做具体的研学课件和研学内容,研究出研学到底应该让学生学到什么,怎么保证学生能学到这些; (3)同时根据最终确定的研学方案做好定价方案,在这个过程中要充分进行调研,进学校、访家长,做到收费合理; (4)根据做好的方案做好线上推广,把做好的资料全部上传到线上,可以参考北京世纪明德。

数字图像处理和边缘检测

中文译文 数字图像处理和边缘检测 1.数字图像处理 数字图像处理方法的研究源于两个主要应用领域:为便于人们分析而对图像信息进行改进;为使机 器自动理解而对图像数据进行存储、传输及显示。 一幅图像可定义为一个二维函数(,)f x y ,这里x 和y 是空间坐标,而在任何一对空间坐标(,)x y 上 的幅值f 称为该点图像的强度或灰度。当,x y 和幅值f 为有限的、离散的数值时,则图像为数字图像。数字图像处理是指借用数字计算机处理数字图像,值得提及的是数字图像是由有限的元素组成的,每一个元素都有一个特定的位置和幅值,这些元素称为图像元素、画面元素或像素。像素是广泛用于表示数字图像元素的词汇。 视觉是人类最高级的感知器官,所以,毫无疑问图像在人类感知中扮演着最重要的角色。然而,人 类感知只限于电磁波谱的视觉波段,成像机器则可覆盖几乎全部电磁波谱,从伽马射线到无线电波。它们可以对非人类习惯的那些图像源进行加工,这些图像源包括超声波、电子显微镜及计算机产生的图像。因此,数字图像处理涉及各种各样的应用领域。 图像处理涉及的范畴或其他相关领域(例如,图像分析和计算机视觉)的界定在初创人之间并没有 一致的看法。有时用处理的输入和输出内容都是图像这一特点来界定图像处理的范围。我们认为这一定义仅是人为界定和限制。例如,在这个定义下,甚至最普通的计算一幅图像灰度平均值的工作都不能算做是图像处理。另一方面,有些领域(如计算机视觉)研究的最高目标是用计算机去模拟人类视觉,包括理解和推理并根据视觉输入采取行动等。这一领域本身是人工智能的分支,其目的是模仿人类智能。人工智能领域处在其发展过程中的初期阶段,它的发展比预期的要慢的多,图像分析(也称为图像理解)领域则处在图像处理和计算机视觉两个学科之间。 从图像处理到计算机视觉这个连续的统一体内并没有明确的界线。然而,在这个连续的统一体中可 以考虑三种典型的计算处理(即低级、中级和高级处理)来区分其中的各个学科。 低级处理涉及初级操作,如降低噪声的图像预处理,对比度增强和图像尖锐化。低级处理是以输入、输出都是图像为特点的处理。中级处理涉及分割(把图像分为不同区域或目标物)以及缩减对目标物的描述,以使其更适合计算机处理及对不同目标的分类(识别)。中级图像处理是以输入为图像,但输出是从这些图像中提取的特征(如边缘、轮廓及不同物体的标识等)为特点的。最后,高级处理涉及在图像分析中被识别物体的总体理解,以及执行与视觉相关的识别函数(处在连续统一体边缘)等。 根据上述讨论,我们看到,图像处理和图像分析两个领域合乎逻辑的重叠区域是图像中特定区域或 物体的识别这一领域。这样,在研究中,我们界定数字图像处理包括输入和输出均是图像的处理,同时也包括从图像中提取特征及识别特定物体的处理。举一个简单的文本自动分析方面的例子来具体说明这一概念。在自动分析文本时首先获取一幅包含文本的图像,对该图像进行预处理,提取(分割)字符,然后以适合计算机处理的形式描述这些字符,最后识别这些字符,而所有这些操作都在本文界定的数字图像处理的范围内。理解一页的内容可能要根据理解的复杂度从图像分析或计算机视觉领域考虑问题。

江南营江南深度研学之旅1

江南营-江南深度研学之旅(1)

————————————————————————————————作者:————————————————————————————————日期:

诗梦江南,入画寻踪 ——长清区实验小学江南深度研学实践 之旅 【课程简介】 一道水,一架桥,一支橹声,隽秀婉约的杭州绍兴聚合了太多的历史文化。此次研学活动旨在让同学们了解祖国江南,同时感受一场从远古传说,到春秋的吴越文化,到南北朝的文人风骨,再到明清以及近代的大儒伟人的历史盛宴。活动中,同学们将一起寻访王羲之、蔡元培、鲁迅、周恩来等名人伟人故里,穿越历史,陶冶爱国之志,体悟文化魅力;一起走进沈园,欣赏宋代江南私家园林的秀美景观,探寻园林蕴含的文化内涵;一起游历西湖,领略“淡妆浓抹总相宜”的如画美景;一起走进综合性人文科学博物馆浙江博物馆、中国黄酒博物馆,全面了解浙江历史文化。 【课程特色】 ●文化名镇江南风采 ●穿越时空触摸历史 【行程简表】 时间课程安排课程主题课程链接 第一天上午乘坐高铁前往杭州:车次G63 济南-杭州东 07:23-11:53辅导员接站读万卷书行万里路下午参观钱塘江、六和塔看天下第一潮登镇潮六和塔追寻江畔的历史故事 晚上研学课程指导分组讨论课程,研学收获分享 实践-辅导员指导学生完成课程手 册 第二天上午 游历杭州西湖置身如画美景感受西湖柔情参观苏堤、孤山、曲院风荷 浙江博物馆参观历史展品考察浙江文化感受历史文化的沉淀 下午灵隐寺、飞来峰登山览胜景寺宇悟佛心登山参观庙宇,了解佛教文化 晚上研学课程指导分组讨论课程,研学收获分享实践-辅导员指导学生完成课程手册 第三天上午探访鲁迅故里探寻书中世界亲访三味书屋追寻鲁迅先生的足迹 下午 游览沈园漫步江南园林,探寻文化内涵 人文-体味江南风情/建筑-江南园林建 筑风格 参观黄酒博物馆参观历史文物体悟江南魅力历史-绍兴历史文化 晚上 大善塔 仓桥直街 漫步古城小道欣赏绍兴夜色实践-实地感受,见景抒情 第四天上午书圣故里历史街区历游文人旧地感受文化魅力人文-文人旧所、大家荟萃

【CN110020650A】一种针对倾斜车牌的深度学习识别模型的构建方法、识别方法及装置【专利】

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 201910232421.X (22)申请日 2019.03.26 (71)申请人 武汉大学 地址 430072 湖北省武汉市武昌区珞珈山 武汉大学 (72)发明人 章登义 张强 武小平 章辉宇  (74)专利代理机构 武汉科皓知识产权代理事务 所(特殊普通合伙) 42222 代理人 罗飞 (51)Int.Cl. G06K 9/32(2006.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种针对倾斜车牌的深度学习识别模型的 构建方法、识别方法及装置 (57)摘要 本发明公开了一种针对倾斜车牌的深度学 习识别模型的构建方法、识别方法及装置,构建 方法包括:从收集的车牌图像中确定车牌坐标, 计算仿射参数;构建识别倾斜车牌的深度学习网 络框架;利用收集的数据集训练定位网络,通过 训练好的参数模型和车牌数据集训练车牌字符 识别网络。本发明针对倾斜车牌识别提出一种基 于深度学习方法的识别网络框架,可以实现大大 提高倾斜车牌的识别精度的技术效果。权利要求书2页 说明书8页 附图5页CN 110020650 A 2019.07.16 C N 110020650 A

1.一种针对倾斜车牌的深度学习识别模型的构建方法,其特征在于,包括: 步骤S1:收集倾斜车牌图像,构建训练数据集,记录每张倾斜车牌图像的车牌号码,并标定每张倾斜车牌图像中的车牌坐标,其中,车牌坐标包括四个顶点的实际坐标,根据预设的四个顶点的虚拟坐标和实际坐标,计算出对应的仿射参数; 步骤S2:根据对应的仿射参数和车牌号码,将训练数据集划分为车牌定位训练集和车牌识别训练集; 步骤S3:基于深度学习框架构建深度学习识别模型框架,深度学习识别模型框架包括定位网络和识别网络; 步骤S4:通过车牌定位训练集输入定位网络,进行车牌定位训练,再根据定位训练的参数,将车牌识别训练集输入识别网络,进行车牌识别训练,获得训练后的深度学习识别模型。 2.如权利要求1所述的方法,其特征在于,步骤S1中,根据预设的四个顶点的虚拟坐标和实际坐标,计算出对应的仿射参数,具体包括: 采用公式1来计算对应的仿射参数: 其中,(x ,y)表示一个虚拟坐标,(x ',y ')表示该虚拟坐标仿射后对应的实际坐标, 表示仿射矩阵,m 00、m 01、m 02、m 10、m 11、m 12表示仿射参数。 3.如权利要求1所述的方法,其特征在于,步骤S4具体包括: 通过车牌定位训练集输入定位网络,进行车牌定位训练; 判断定位网络损失函数是否收敛到预设程度,如果是,则将此时的参数作为定位参数,如果否,则继续进行车牌定位训练; 根据定位参数,将车牌识别训练集输入识别网络,进行车牌识别训练,获得训练后的深度学习识别模型。 4.如权利要求3所述的方法,其特征在于,获得训练后的深度学习识别模型之后,所述方法还包括: 再利用车牌定位训练集和车牌识别训练集进行一次车牌定位训练和一次车牌识别训练。 5.如权利要求4所述的方法,其特征在于,所述方法还包括: 利用验证数据集对训练后的深度学习识别模型进行测试,迭代修改超参数,直到达到预设测试精度,其中,验证数据集步骤S1中的训练数据集中划分获得。 6.一种针对倾斜车牌的深度学习识别模型的构建装置,其特征在于,包括: 训练数据集构建模块,用于收集倾斜车牌图像,构建训练数据集,记录每张倾斜车牌图像的车牌号码,并标定每张倾斜车牌图像中的车牌坐标,其中,车牌坐标包括四个顶点的实际坐标,根据预设的四个顶点的虚拟坐标和实际坐标,计算出对应的仿射参数; 训练数据集划分模块,用于根据对应的仿射参数和车牌号码,将训练数据集划分为车 权 利 要 求 书1/2页2CN 110020650 A

基于matlab的图像边缘检测算法研究和仿真设计

基于matlab的图像边缘检测算法研究和仿真 目录 第1章绪论 1 1.1 序言 1 1.2 数字图像边缘检测算法的意义 1 第2章传统边缘检测方法及理论基础 2 2.1 数字图像边缘检测的现状与发展 2 2.2 MATLAB和图像处理工具箱的背景知识 3 2.3 数字图像边缘检测关于边缘的定义 4 2.4 基于一阶微分的边缘检测算子 4 2.5 基于二阶微分的边缘检测算子 7 第3章编程和调试 10 3.1 edge函数 10 3.2 边缘检测的编程实现 11 第4章总结 13 第5章图像边缘检测应用领域 13 附录参考文献 15

第1章绪论 §1.1 序言 理解图像和识别图像中的目标是计算机视觉研究的中心任务,物体形状、物体边界、位置遮挡、阴影轮廓及表面纹理等重要视觉信息在图像中均有边缘产生。图像边缘是分析理解图像的基础,它是图像中最基本的特征。在Marr的计算机视觉系统中,图像边缘提取占据着非常重要位置,它位于系统的最底层,为其它模块所依赖。图像边缘提取作为计算机视觉领域最经典的研究课题,长期受到人们的重视。 图像边缘主要划分为阶跃状和屋脊状两种类型。阶跃状边缘两侧的灰度值变化明显,屋脊状边缘则位于灰度增加与减少的交界处。传统的图像边缘检测方法大多是从图像的高频分量中提取边缘信息,微分运算是边缘检测与提取的主要手段。由于传统的边缘检测方法对噪声敏感,所以实际运用效果有一定的局限性。近年来,越来越多的新技术被引入到边缘检测方法中,如数学形态学、小波变换、神经网络和分形理论等。 Canny于1986年提出基于最优化算法的边缘检测算子,得到了广泛的应用,并成了与其它实验结果作比较的标准。其原因在于他最先建立了优化边缘检测算子的理论基础,提出了迄今为止定义最为严格的边缘检测的三个标准。另外其相对简单的算法使得整个过程可以在较短的时间实现。实验结果也表明,Canny算子在处理受加性高斯白噪声污染的图像方面获得了良好的效果[1]。 §1.2 数字图像边缘检测算法的意义 数字图像处理是控制领域的重要课题,数字图像边缘检测是图像分割、目标区域识别和区域形状提取等图像分析领域十分重要的基础,是图像识别中提取图像特征的一个重要方法。边缘中包含图像物体有价值的边界信息,这些信息可以用于图像理解和分析,并且通过边缘检测可以极降低后续图像分析和处理的数据量。图像理解和分析的第一步往往就是边缘检测,目前它已成为机器视觉研究领域最活跃的课题之一,在工程应用中占有十分重要的地位。 图像的边缘检测技术是数字图像处理技术的基础研究容,是物体识别的重要基础。边缘特征广泛应用于图像分割、运动检测与跟踪、工业检测、目标识别、双目立体视觉等领域。现有边缘检测技术在抑制噪声方面有一定的局限性,在阈值参数选取方面自适

研学

第一单元 课题人与自我?我自信,会成功 学习目标正确认识自我,能够说出自己的优点和不足;增强自我调控、承受挫折、适应环境的能力;了解树立自信心的方法,培养健全的人格和良好的心理素质;提高心理健康水平,增强自我教育能力,形成健康、自信的人生观。参考主题(1)我自信,会成功;(2)克服考试焦虑;(3)消除孤独感。 实践方式心理测试;收集资料;手工制作。 方法引导发表意见的技巧;如何对调查结果进行统计与分析。 学科整合与心理健康教育、品德与社会、语文等学科整合。关注心理健康,形成健康的生活态度;善于发现其他同学身上的优点并虚心学习;学习名人名言,领悟其深刻含义,并激励自己;进行小制作设计。 课时安排5课时 教学流程 第一课时 研究准备 我们一天天地长大,从妈妈怀里的婴儿,长成了少年。想想自己在成长过程中有哪些烦恼?你是怎么解决的? 同学们根据自己的兴趣自主确定设计研究方案,其方法一般是: 1、我的烦恼及解决的办法 2、我自信,会成功 3、消除孤独感 以上方案进行研究、讨论、尝试初步建立印象。 第二课时 我自信,会成功 一、研究实施 自信对我们走向成功非常重要。今天,就我们一起通过探究活动来寻找自信,增强自信! 二、方法与引导: 发表意见的技巧 1、态度诚恳、谦逊。多采用“我个人认为”、“我目前的想法是”等表达方式; 2、不能只发表否定性意见,对好的方面要充分肯定; 3、对事不对人,只针对事情发表意见; 4、通过举例等方式,引导他人发现存在的问题; 5、避免个人垄断话题,邀请不善于发表意见的组员参与讨论。 三、“我自信,会成功”研究方案 主题名称研究时间 研究目的1、正确认识自己,发现自己的优点与不足 2、

基于深度学习的车牌识别系统设计

收稿日期:2017-08-29 修回日期:2017-12-26 网络出版时间:2018-04-28 基金项目:国家自然科学基金(61373117) 作者简介:陈 利(1981-),男,讲师,硕士研究生,研究方向为图形图像处理二计算机软件与理论三 网络出版地址:http ://https://www.sodocs.net/doc/6612450258.html, /kcms /detail /61.1450.TP.20180427.1649.083.html 基于深度学习的车牌识别系统设计 陈 利1,2 (1.西北大学信息科学与技术学院,陕西西安710127;2.铜川职业技术学院基础部,陕西铜川727031) 摘 要:随着国内机动车辆数目的不断增加,如何对众多的机动车进行有效管理已成为当前交通管理机构面临的主要问题三利用深度学习技术,通过对车牌定位二车牌字符分割和车牌字符识别技术进行研究,提出了一种车牌识别原型系统方案三在车牌预处理模块,通过图像灰度化处理等一系列操作,抑制了非车牌区域的噪声;在车牌定位模块,提出使用基于深度学习的目标检测方法对车牌进行定位,进行二值化二倾斜校正后使用垂直投影法分割出车牌字符,最后通过改进的Hausdorff 距离计算待识别图像与模板之间的相似程度,利用模板匹配的方法识别出车牌字符三实验结果显示,该系统车牌识别准确率高三 关键词:图像预处理;车牌定位;车牌字符分割;车牌字符识别;Hausdorff 距离 中图分类号:TP 302.1 文献标识码:A 文章编号:1673-629X (2018)06-0085-05 doi :10.3969/j.issn.1673-629X.2018.06.019 Design of License Plate Recognition System Based on Deep Learning CHEN Li 1,2 (1.School of Information Science and Technology ,Northwest University ,Xi ’an 710127,China ;2.Department of Basic Courses ,Tongchuan Vocational and Technical College ,Tongchuan 727031,China ) Abstract :With increasing of vehicles in domestic ,how to effectively manage a large number of motor vehicles has become the main prob?lem in the current traffic management institutions.In this paper ,we propose a prototype system of license plate recognition through the re?search of license plate location ,license plate character segmentation and recognition by using deep learning technology.In the plate pre?processing module ,a series of operations ,such as image grayscale processing ,are used for denoising in the non -license plate area.In the plate location module ,a target detection method based on deep learning is adopted.After the binarization and tilt correction ,license plate characters are segmented by vertical projection.Finally ,the similarity between the image and the template is calculated by the improved Hausdorff distance ,and the license plate characters are recognized by the template matching method.The experiment shows that the accu?racy of license plate recognition system is higher than others. Key words :image preprocessing ;license plate location ;license plate character segmentation ;license plate character recognition ;Hausdorff distance 0 引 言 当今中国经济已进入高速发展的阶段,人民生活 水平不断提高,私家车的数量与日俱增,随着机动车数 量的增加,一系列社会问题也随之而来,如交通堵塞二 交通事故频发二环境污染加剧等三这些问题尤其是交 通问题的根治仅仅依靠大规模的道路建设是不够的, 智能交通系统(intelligent traffic system ,ITS )是解决交 通问题的一个重要手段,而车辆牌照识别(license plate recognition ,LPR )技术在其中起着至关重要的作用三车辆牌照识别系统能够对获得的车辆图像信息进行分析,识别出车辆牌照的位置,并进一步识别出车牌号码三虽然在高清静止的场景中车牌识别技术已经较为成熟,但在雾霾天二夜晚和视角不正等更广义的场景中,车牌识别问题依然面临挑战,尤其在未来无人车二无人交通中,车牌识别技术更有着非常大的提高空间三深度学习的发展对计算机视觉和图像处理领域带来了巨大的变化,其在图像物体检测和分类问题中比 其他算法具有明显的优势,因此文中基于深度学习进 第28卷 第6期2018年6月 计算机技术与发展COMPUTER TECHNOLOGY AND DEVELOPMENT Vol.28 No.6June 2018

VC图像边缘检测算法研究报告与比较

目录

基于VC的图像边缘检测算法的研究与比较 摘要 图像的边缘是图像最基本的特征,它是灰度不连续的结果。图像分析和理解的第一步是边缘检测,因此边缘检测在图像处理中有着重要的作用。图像边缘检测大幅度地减少了数据量,并且剔除了可以认为不相关的信息,保留了图像重要的结构属性。 本文介绍了三种经典的图像边缘检测算子,并且运用强大的VC软件通过一个图像边缘检测的例子比较了它们的检测效果,分析了它们各自的特点,对学习边缘检测和具体工程应用具有很好的参考价值。 关键词: 图像处理,边缘检测, 算子,比较研究,VC

Comparison AndAnalysis ForImageEdgeDetection Algorithms Based On VC Abstract Edge is the most basic feature of the image, it is the result of discontinuous gray. The first step in image analysis and understanding is edge detection, so edge detection plays an important role in image processing.Image edge detection significantly reduces the amount of data and removes irrelevant information,retains the important structural properties of images. This article describes three types of classical edge detection operators, and the use the powerful software called VC to do the edge detection through a comparison of examples of the effect of their detection, analysis the characteristics,this is good reference value for their learning edge detection and application of specific projects. Key Words:Image processing ,Edge detection ,Operator ,Comparative Study ,VC

研学课程质量管理方案

XXXX中小学研学旅行课程质量管理 一、指导思想 全面贯彻党的教育方针,以《国家中长期教育改革和发展规划纲要》《基础教育课程改革纲要》《国民旅游休闲纲要》为指导,认真落实立德树人的育人目标,以培养学生的综合实践能力和创新能力为核心,以学生发展为本,全面提升学生综合素质。 二、课程设计原则与课程内容 (一)课程设计原则 1.开放性原则:充分利用校内外资源体现目标的多元性,内容的广泛性,时间空间的广域性,展示的多样性和评价的灵活性。 2.整合性原则:以研学旅行资源及教学内容、方法和师资情况为基础,结合学生认知能力和社会实际整合开发课程,保证课程的时效性,实现课程的生成性。 3.体验性原则:尊重学生主体地位,以人为本,以学生活动为主,突出体验实践,培养学生创新精神和实践能力,变知识性的课堂教学为发展性的体验教学。 4.生活性原则:着眼于生活实际的观察视角,把学生从最简单熟悉的生活层面引领到更加广阔的社会生活舞台,加强教育的生活性,突出生活的教育化程度。 (二)课程内容

1.了解社会状况。通过研学旅行活动,了解当前社会实践活动中迫切需要解决的现实问题,如交通、卫生、网络、饮食、环境、动植物保护以及人口老龄化、就业压力、就医入学等现实状况。 2.探究学科问题。包括物理、化学、生物、地理、数学、语文、英语、政治、历史、通用技术、信息技术、体育、音乐、美术以及学科交叉知识的探究,发现一些值得研究的新问题。 3.前沿科技应用。在研学活动中,学习和研究前沿科学技术在生活、生产实践和科学实践领域的应用。如3D打印、AR/VR、无人机、无人驾驶等。 三、课程实施 (1)课程开发要立足教育性。 要使研学旅行做到立意高远、目标明确、活动生动、学习有效,避免出现“只旅不学”或“只学不旅”的现象,就必须把教育性原则放在首位,寻找适切的研学主题和课程教育目标,深度促进研学旅行活动课程与学校课程的有机融合。作为中小学教育教学实践的重要组成部分,研学旅行的活动课程既要结合学生身心特点、接受能力和实际需要,又要注重知识性、科学性和趣味性。 在课程目标的制订上,要与学校的综合实践活动课程统筹考虑,活动中的知识性目标、能力性目标、情感、态度、价值观领域的目标和核心素养的目标等等,都应该是落实课标的核心要点。 (2)研学旅行课程突出实践性 正是我国推动全面实施素质教育的一种重要创新。研学旅行的课

图像分割和图像边缘检测

图像分割和图像边缘检测 边缘检测和图像分割的联系:边缘检测是通过图像的梯度变化将图像中梯度变化明显的地方检测出来,针对的是边缘信息。图像分割是将目标分割出来,针对的是目标对象,边缘检测是空间域图像分割的一种方法,属于包含关系 边缘检测后的图像是二值图像,对二值图像可以运用形态学操作来分割目标,所以边缘检测是图像分割的一个前提。但分割不一定非要用边缘检测。 图像分割:概念: 图像分割是将图像划分成若干个互不相交的小区域的过程,所谓小区域是某种意义下具有共同属性的像素的连通集合。 从集合的观点看:它应该是具有如下性质的一种点集,集合R代表整个区域,对R的分割可看作将R分成N个满足以下五个条件的非空子集R1,R2,,RN: 目的: 无论是图像处理、分析、理解与识别,其基础工作一般都建立在图像分割的基础上; 将图像中有意义的特征或者应用所需要的特征信息提取出来; 图像分割的最终结果是将图像分解成一些具有某种特征的单元,称为图像的基元; 相对于整幅图像来说,这种图像基元更容易被快速处理。 图像分割原理图像分割的研究多年来一直受到人们的高度重视,至今提出了各种类型的分割算法。Pal把图像分割算法分成了6类:阈值分割,像素分割、深度图像分割、彩色图像分割,边缘检测和基于模糊集的方法。但是,该方法中,各个类别的内容是有重叠的。为了涵盖不断涌现的新方法,有的研究者将图像分割算法分为以下六类:并行边界分割技术、串行边界分割技术、并行区域分割技术、串行区域分割技术、结合特定理论工具的分割技术和特殊图像分割技术。 图像分割的特征:分割出来的各区域对某种性质例如灰度,纹理而言具有相似性,区域内部是连通的的且没有过多小孔。 区域边界是明确的

青海研学l旅游发展的SWOT分析

青海省研学旅游发展SWOT分析 (一)优势(strength) 1.旅游资源丰富多样 截至目前,全省旅游A级景点多达106处,其中5A级3家;4A级19家,3A级65家,2A级19家。自然与人文旅游资源丰富多样,著名的景区有青海湖景区,金银滩景区、祁连风光旅游区、茶卡盐湖旅游区等,人文旅游资源有藏传佛教塔尔寺景区、互助土族故土园景区、原子城、湟源丹葛尔古城等,独特的地质条件与多样的民族风情为青海省开展研学旅游提供了强大的物质基础。 2.地质旅游资源优势明显 青海省地域辽阔,在漫长的地球演化过程中,在内外力地质共同作用形成、发展并遗留下来类型众多的不可再生的地质资源,青海省凭借丰富的旅游地质资源,现已获批多处地质资源集中分布区开发建设为国家地质公园,知名的有坎布拉国家地质公园、互助北山国家地质公园、贵德国家地质公园、昆仑山国家地质公园等,形成了红色砂砾岩的丹霞地貌、冰蚀地貌景观、高原岩溶景观、古地震鼓包遗迹等地貌景观,除了具有不可估量的科研价值外,还具有开展研学旅游,建设研学旅游教育基地的广阔前景。 (二)劣势(weakness) 1.景区间通达性差 作为研学旅游目的地其集聚性较差,包尤其是潜在的旅游资源,重要景区间的连接道路、景区内的交通体系、景区的道路标示系统等有待进一步加强,与现代“快旅慢游”需求和“井喷式”增长严重不匹配,缺乏全面系统的交通网将研学旅游景区串联起来。旅游各景区发展不平衡,基础设施、服务配套远不能适应人民群众日益增长的多旅游需求。 2.旅游季节差异性明显 旅游季节性是旅游活动的固有特征,青海省旅游季节性明显,由于气候因素旅游旺季集中在夏季,导致旺季游客量多,而到了冬季,气候比较寒冷,草木凋零,研学旅游开展较为困难、使得旅游景点、宾馆饭店、旅行社等资源和设施大量闲置、出租率下降、运营成本上升,旅游企业为争夺客源进而采取降价竞争,导致经济效益低下。 (三)机遇(opportunity) 1.政策支持焕发旅游活力 近年来,一系列决策为全省旅游业提档升级提供了强大的政策支撑。一是《国务院关于促进旅游业改革发展的若干意见》以及全国旅游发展“515战略”,将旅游业定位为战略性支柱产业和人民群众满意的现代服务业和实现脱贫的重要产业,破除了旅游发展的认识障碍和制度障碍;二是青海省委、省政府出台了《关于促进旅游业改革发展的实施意见》、《2015年—2020年青海省旅游业行动计划》,将推动县域旅游业发展提向更高层次、更大格局迈进;三是地方政府对各地旅游业的重要战略部署。随着研学旅游的深入开展,其巨大的经济效益、社会效益和生态效益毫无疑问将得到各级政府的高度重视,不断获得政策支持力度,实现研学旅游又好又快发展,引领“旅游+”产业新风向。 2.研学旅游竞争力将持续增强 随着旅游的飞速发展,我省已形成一批骨干旅游企业,将继续提升旅游市场主体的竞争力。旅游发展环境全面改善,形成设施齐全、功能配套、优质高效的

相关主题