搜档网
当前位置:搜档网 › 图像识别方法和设备的制作流程

图像识别方法和设备的制作流程

图像识别方法和设备的制作流程
图像识别方法和设备的制作流程

本技术的实施方式提供了一种图像识别方法。该方法包括:对待识别图像进行特征提取,得到多个特征向量;确定每个特征向量对应的类别;针对每个特征向量,分别计算其所对应的类别下各样本图像的分数;将计算得到的同一样本图像的分数累加,得到该同一样本图像的分值;将分值最高的样本图像对应的图像标识作为待识别图像的识别结果。通过上述图像识别方法,有效提取多个特征来表征待识别图像,提取的特征不受图像中物体的特性所影响,能够实现对图像的有效识别,适用范围广;且通过计算样本图像分数的方式得到识别结果,综合考虑了特征的重要性,能够获得较好的识别精度。此外,本技术的实施方式提供了一种图像识别装置。

权利要求书

1.一种图像识别方法,包括:

对待识别图像进行特征提取,得到多个特征向量;

确定每个特征向量对应的类别;

针对所述每个特征向量,分别计算其所对应的类别下各样本图像的分数;

将计算得到的同一样本图像的分数累加,得到该同一样本图像的分值;

将分值最高的样本图像对应的图像标识作为所述待识别图像的识别结果;

按照以下公式计算样本图像的分数:

其中,S表示当前样本图像的分数,A表示平均每个类别下的样本图像特征向量个数,B表示所述当前样本图像所属的类别下的所有图像标识出现次数之和,C表示所述当前样本图像所属的类别下,所述当前样本图像对应的图像标识出现次数,D表示放缩因子。

2.根据权利要求1所述的图像识别方法,其中,确定每个特征向量对应的类别,包括:

分别计算所述特征向量与预先存储的多个聚类中心向量的距离,其中,所述聚类中心向量与所述类别一一对应;

确定与所述特征向量距离最近的聚类中心向量对应的类别为所述特征向量对应的类别。

3.根据权利要求1所述的图像识别方法,其中,对待识别图像进行特征提取,得到多个特征向量,包括:

利用滑动窗口遍历所述待识别图像;

针对所述滑动窗口所处的每个区域,计算该区域的特征向量。

4.根据权利要求3所述的图像识别方法,其中,计算该区域的特征向量,包括:

将该区域划分为多个大小相同的细胞单元,其中,每个细胞单元之间不重叠;

针对所述每个细胞单元,计算其中各像素的梯度方向值,将所述梯度方向值在预设的投影区间内进行投影生成梯度方向投影向量;将各像素的梯度方向投影向量求和,得到该细胞单元的梯度方向直方图;

将该区域内所有细胞单元的梯度方向直方图进行串联作为该区域的特征向量。

5.根据权利要求3所述的图像识别方法,其中,利用滑动窗口遍历所述待识别图像,包括:

在所述待识别图像上,利用所述滑动窗口按照预设方向每隔固定个数的像素进行滑动,直到遍历整个待识别图像。

6.根据权利要求1所述的图像识别方法,其中,对待识别图像进行特征提取,包括:

在所述待识别图像上裁剪出识别区域,并将所述识别区域的像素尺寸调整到预定像素尺寸,对所述识别区域进行特征提取。

7.根据权利要求1至6中任一项所述的图像识别方法,其中,在对待识别图像进行特征提取之前,所述方法还包括:

建立索引信息,并存储所述索引信息。

8.根据权利要求7所述的图像识别方法,其中,建立索引信息包括:

记录多张样本图像的图像标识,分别对每张样本图像均提取多个样本图像特征向量,并记录所述图像标识与所述多个样本图像特征向量的对应关系;

对所述多张样本图像对应的全部样本图像特征向量进行聚类,得到预定个数的类别及与所述类别一一对应的聚类中心向量;

建立长度为所述预定个数的哈希索引结构,所述哈希索引结构包括:类别、图像标识及图像标识出现次数;

将所述全部样本图像特征向量插入所述哈希索引结构,得到所述索引信息。

9.根据权利要求8所述的图像识别方法,其中,将所述全部样本图像特征向量插入所述哈希索引结构,包括:

对每个样本图像特征向量均执行如下操作以插入所述哈希索引结构:

确定与待插入样本图像特征向量距离最近的聚类中心向量所对应的类别,并将该类别标记为所述待插入样本图像特征向量的类别;

在所述哈希索引结构中查找所述待插入样本图像特征向量的类别的位置,并遍历所述待插入样本图像特征向量的类别下的所有图像标识;

如果所述待插入样本图像特征向量对应的图像标识未存在于所述待插入样本图像特征向量的类别下,则添加新节点,其中,所述新节点的图像标识设置为所述待插入样本图像特征向量对应的图像标识,所述新节点的图像标识出现次数设置为1;

如果所述待插入样本图像特征向量对应的图像标识存在于所述待插入样本图像特征向量的类别下,则将该图像标识对应的图像标识出现次数加1。

10.一种图像识别装置,包括:

特征提取单元,用于对待识别图像进行特征提取,得到多个特征向量;

第一确定单元,用于确定每个特征向量对应的类别;

计算单元,用于针对所述每个特征向量,分别计算其所对应的类别下各样本图像的分数;

累加单元,用于将计算得到的同一样本图像的分数累加,得到该同一样本图像的分值;

第二确定单元,用于将分值最高的样本图像对应的图像标识作为所述待识别图像的识别结果;

所述计算单元具体用于:

按照以下公式计算样本图像的分数:

其中,S表示当前样本图像的分数,A表示平均每个类别下的样本图像特征向量个数,B表示所述当前样本图像所属的类别下的所有图像标识出现次数之和,C表示所述当前样本图像所属的类别下,所述当前样本图像对应的图像标识出现次数,D表示放缩因子。

技术说明书

图像识别方法和装置

技术领域

本技术的实施方式涉及图像识别技术领域,更具体地,本技术的实施方式涉及一种图像识别方法和装置。

背景技术

本部分旨在为权利要求书中陈述的本技术的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。

随着智能技术的发展,图像识别的使用和需求也在迅速发展。所谓的图像识别主要有:从图像中识别出目标物体,或者是识别出图像中的某个物体所属的类别等等。可以将其理解为近似于人面对一副图像或者一个场景时,通过肉眼和大脑实现对图像或者场景中所出现的物品进行区分和辨别。

目前,常用的图像识别(这里主要指识别图像中的某个物体所属的类别)方法主要有以下几种:1)基于神经网络;2)基于Hu不变距特征搜索;3)基于SIFT特征点匹配搜索;4)基于Gabor 图像特征搜索。

然而,上述几种方式也存在不同程度的问题,具体的:

1)基于神经网络,一般采用人工设计的图像特征算子作为输入,然而,目前人工设计的特征算子对某些图像的识别并不适用,例如硬币识别,而且神经网络多为浅层结构,难以学习到有效的高层抽象的特征。

2)基于Hu不变距特征搜索,一般利用物体的形状特征,但是有些不同类别的物体之间形状差异很小,因此Hu不变距特征搜索的方式难以有效地捕获上述物体的形状特征,难以实现有效识别。

3)基于SIFT特征点匹配搜索,对于纹理特征较多为刚性纹理特征(例如硬币上字的边角)的图像,提取出的有效SIFT特征点较少,且错误匹配现象严重。

4)基于Gabor图像特征搜索,表面凸起的物体,光线打上去不是整体变化,Gabor特征难以有效地捕捉物体图像的边缘信息。

技术内容

如前所述,现有的图像识别技术对于某些图像难以有效捕获特征信息,进而难以实现对图像的有效识别,识别精度低。

有鉴于此,非常需要一种改进的图像识别方法,以有效提取图像特征,提高识别精度。

在本技术实施方式的第一方面中,提供了一种图像识别方法,包括:对待识别图像进行特征提取,得到多个特征向量;确定每个特征向量对应的类别;针对所述每个特征向量,分别计算其所对应的类别下各样本图像的分数;将计算得到的同一样本图像的分数累加,得到该同一样本图像的分值;将分值最高的样本图像对应的图像标识作为所述待识别图像的识别结果。

在本技术实施方式的第二方面中,提供了一种图像识别装置,包括:特征提取单元,用于对待识别图像进行特征提取,得到多个特征向量;第一确定单元,用于确定每个特征向量对应的类别;计算单元,用于针对所述每个特征向量,分别计算其所对应的类别下各样本图像的分数;累加单元,用于将计算得到的同一样本图像的分数累加,得到该同一样本图像的分值;第二确定单元,用于将分值最高的样本图像对应的图像标识作为所述待识别图像的识别结果。

通过本技术实施方式的图像识别方法和装置,有效提取多个特征来表征待识别图像,提取的特征不受图像中物体的特性所影响,能够实现对图像的有效识别,适用范围广;且通过计算样本图像分数的方式得到识别结果,综合考虑了特征的重要性,能够获得较好的识别精度。

附图说明

通过参考附图阅读下文的详细描述,本技术示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本技术的若干实施方式,其中:

图1示意性地示出了根据本技术实施方式的应用场景示意图;

图2示意性地示出了根据本技术实施例的图像识别方法的流程图;

图3示意性地示出了根据本技术实施例的样本图像信息的示意图;

图4示意性地示出了根据本技术实施例的哈希索引结构的示意图;

图5示意性地示出了根据本技术一实施例的图像识别装置的结构框图;

图6示意性地示出了根据本技术另一实施例的图像识别装置的结构框图;

在附图中,相同或对应的标号表示相同或对应的部分。

具体实施方式

下面将参考若干示例性实施方式来描述本技术的原理和精神。应当理解,给出这些实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本技术,而并非以任何方式限制本技术的范围。相反,提供这些实施方式是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。

本领域技术技术人员知道,本技术的实施方式可以实现为一种系统、装置、设备、方法或计算机程序产品。因此,本公开可以具体实现为以下形式,即:完全的硬件、完全的软件(包括固件、驻留软件、微代码等),或者硬件和软件结合的形式。

根据本技术的实施方式,提出了一种图像识别方法和装置。

需要说明的是,附图中的任何元素数量均用于示例而非限制,以及任何命名都仅用于区分,而不具有任何限制含义。

下面参考本技术的若干代表性实施方式,详细阐释本技术的原理和精神。

技术概述

现有的图像识别技术对于某些图像难以有效捕获特征信息,进而难以实现对图像的有效识别,识别精度低。

为此,本技术提供了一种图像识别方法,通过该方法进行图像识别的过程可以包括:对待识

别图像进行特征提取,得到多个特征向量;确定每个特征向量对应的类别;针对每个特征向量,分别计算其所对应的类别下各样本图像的分数;将计算得到的同一样本图像的分数累加,得到该同一样本图像的分值;将分值最高的样本图像对应的图像标识作为待识别图像的识别结果。这样有效提取多个特征来表征待识别图像,提取的特征不受图像中物体的特性所影响,能够实现对图像的有效识别,适用范围广;且通过计算样本图像分数的方式得到识别结果,综合考虑了特征的重要性,能够获得较好的识别精度。

在本例中,图像标识可以是图像的名称、编号或者其他能够唯一标识该图像的信息。

在介绍了本技术的基本原理之后,下面具体介绍本技术的各种非限制性实施方式。

应用场景总览

首先参考图1,其示出了本技术的实施方式可以在其中实施的应用场景。处理设备100可以是一台计算机、一组计算机集群、或者是一台单一的处理器等,只要是能够实现对数据进行分析和处理的设备都是可以的,存储设备200可以是一个常规的存储器、云存储器,甚至也可以是互联网,只要是能够实现图像、数据、信息的获取和存储的设备都是可以的。处理设备100与存储设备200之间可以通过例如移动互联网、物理排线等方式进行通信连接。

利用本技术实施例提供的图像识别方法,处理设备100对待识别图像进行特征提取,得到多个特征向量,根据存储设备200中存储的信息,确定每个特征向量对应的类别,并针对每个特征向量,分别计算其所对应的类别下各样本图像的分数;将同一样本图像的分数累加,得到该同一样本图像的分值;将分值最高的样本图像对应的图像标识作为待识别图像的识别结果。样本图像的分值越高,表示待识别图像与该样本图像越相似。

此外,处理设备100可以从存储设备200中获取大量样本图像,基于获取的样本图像建立样本图像信息,并将该样本图像信息存储到存储设备200中,以备后续在具体的图像识别过程中使用。其中,样本图像信息可以包括:类别、图像标识、计算分数所需的参数等。可以根据图像的种类分别建立对应的样本图像信息,并存储该样本图像信息,例如,针对金属币图像,建立对应的样本图像信息,金属币可以是一种具有流通价值、纪念价值或收藏价值的币种;又如,针对服装图像,建立对应的样本图像信息。

示例性方法

下面结合图1的应用场景,参考图2至图4对本技术的图像识别方法进行介绍。

需要注意的是,上述应用场景仅是为了便于理解本技术的精神和原理而示出,本技术的实施方式在此方面不受任何限制。相反,本技术的实施方式可以应用于适用的任何场景。

如图2所示,该图像识别方法可以包括:

步骤S201,对待识别图像进行特征提取,得到多个特征向量。

步骤S202,确定每个特征向量对应的类别。

步骤S203,针对每个特征向量,分别计算其所对应的类别下各样本图像的分数。

步骤S204,将计算得到的同一样本图像的分数累加,得到该同一样本图像的分值。

步骤S205,将分值最高的样本图像对应的图像标识作为待识别图像的识别结果。其中,图像标识可以是图像的名称、编号或者其他能够唯一标识该图像的信息。

在一个实施例中,可以利用滑动窗口遍历待识别图像,针对滑动窗口所处的每个区域,计算该区域的特征向量,由此得到表征该待识别图像的多个特征向量。本技术对滑动窗口的像素尺寸不做限定。较优的,待识别图像的像素数能被滑动窗口的像素数整除,这样能够更有效地提取特征向量。

利用滑动窗口遍历待识别图像时,在待识别图像上,滑动窗口可以按照预设方向每隔固定个数的像素进行滑动,直到遍历整个待识别图像。例如,按行遍历或者按列遍历。

具体地,可以通过以下步骤计算滑动窗口所处的区域的特征向量:

(1)将该区域划分为多个大小相同的细胞单元,其中,每个细胞单元之间不重叠。

(2)针对每个细胞单元,计算其中各像素的梯度方向值,将梯度方向值在预设的投影区间内进行投影生成梯度方向投影向量;将各像素的梯度方向投影向量求和,得到该细胞单元的梯度方向直方图。

需要说明的是,梯度方向值包括:梯度方向和梯度幅值。梯度方向直方图是个向量。

(3)将该区域内所有细胞单元的梯度方向直方图进行串联作为该区域的特征向量。串联指的是将多个向量首尾相接。

下面结合一个具体实施例说明提取特征向量的过程。在实际应用中,各像素尺寸、细胞单元的个数等数值可以根据具体情况进行设置。

待识别图像的像素尺寸为96×96,滑动窗口的像素尺寸为32×32。以按行遍历为例,在待识别图像上,滑动窗口从左往右每隔8个像素进行滑动,当滑动窗口滑动到最右端时,将滑动窗口移动到最左端,并向下移动8个像素,再次完成从左往右的滑动操作,重复以上滑动操作,直到遍历整个待识别图像,共滑动81次。

针对滑动窗口所处的每个区域,计算该区域的特征向量,共得到81个特征向量。其中,每个区域的像素尺寸均为32×32。

具体地,计算区域的特征向量包括:

1)将当前区域划分为16个不重叠的细胞单元,每个细胞单元的像素尺寸均为8×8。

2)针对每个细胞单元,计算其中各像素的梯度方向值(包括梯度方向和梯度幅值),将梯度方向值在预设的投影区间内进行投影生成梯度方向投影向量。具体地,可以对灰度图像的像素进行计算。例如,计算得到的某一像素的梯度方向值如下:梯度方向为125度,梯度幅值为20;预设的投影区间为0~120度、120~240度、240~360度三区间;该梯度方向值投影到上述三区间时,形成三维的梯度方向投影向量(0,20,0);由此可看出,梯度方向决定三维向

量中哪个元素不为0,梯度幅值决定该不为0的元素的具体数值)。对当前细胞单元中的每个像素依次做上述操作,得到各个像素的梯度方向投影向量,进行求和,得到该细胞单元的梯度方向直方图(仍然是三维向量)。例如,求和得到的梯度方向直方图为(100,50,50),为方便后续数据的处理,可以对该梯度方向直方图进行归一化处理,例如,把该三维向量中三个元素的和作为除数,得到(0.5,0.25,0.25)。

3)将当前区域内所有细胞单元的梯度方向直方图进行串联作为该区域的特征向量。一共16个细胞单元,每个细胞单元的梯度方向直方图均为三维向量,串联得到该区域的48维特征向量。

由此,对于待识别图像,得到了81个48维的特征向量。

步骤S202中确定每个特征向量对应的类别,可以通过以下步骤实现:分别计算特征向量与预先存储的多个聚类中心向量的距离,其中,聚类中心向量与类别一一对应;确定与该特征向量距离最近的聚类中心向量对应的类别为该特征向量对应的类别。结合上述应用场景,可以从存储设备200中读取存储的样本图像信息中的类别和聚类中心向量。

在一个实施例中,可以按照以下公式计算样本图像的分数:

其中,S表示当前样本图像的分数,A表示平均每个类别下的样本图像特征向量个数,B表示当前样本图像所属的类别下的所有图像标识出现次数之和,C表示当前样本图像所属的类别下,当前样本图像对应的图像标识出现次数,D表示放缩因子,可以为预设常数,例如0.5。

下面结合一个具体实施例说明计算样本图像分数以及确定识别结果的过程。

先对已存储的样本图像信息进行说明。

假设有3个样本图像I、J、K,每个样本图像提取2个样本图像特征向量,样本图像的特征向量共3个类别X、Y、Z,此时,平均每个类别下的样本图像特征向量个数为2,即A=2。

类别X下,样本图像I出现次数为0,样本图像J出现次数为1,样本图像K出现次数为1;类别Y下,样本图像I出现次数为2,样本图像J出现次数为1,样本图像K出现次数为0;类别Z 下,样本图像I出现次数为0,样本图像J出现次数为0,样本图像K出现次数为1。样本图像信息的示意图如图3所示,同一样本图像在不同类别下的出现次数之和即为提取的该样本图像的特征向量个数。为方便理解,此处样本图像信息以表格的形式为例,本技术并不限于此,还可以其他能够表明各因素对应关系的方式进行存储。

需要识别某一待识别图像时,对待识别图像进行特征提取,得到2个特征向量。

假设其中一个特征向量对应类别X,则分别计算类别X下的样本图像I、J、K的分数:

另一个特征向量对应类别Z,则分别计算类别Z下的样本图像I、J、K的分数:

累加样本图像I的分数,得到样本图像I的分值1.58;累加样本图像J的分数,得到样本图像J 的分值1.53;累加样本图像K的分数,得到样本图像K的分值1.45。由此,将分值最高的样本图像I的图像标识作为待识别图像的识别结果,即待识别图像为样本图像I。

图像识别主要是根据待识别图像不同于其他图像的特性进行识别,采用计算样本图像分数的

方式得到识别结果,综合考虑了特征的重要性,例如,中,B表示当前样本图像所属的类别下的所有图像标识出现次数之和,即该类别下所有样本图像的特征向量的个数,B越大,表明这个类别中的特征越不重要;C表示当前样本图像所属的类别下,当前样本图像对应的图像标识出现次数,C越大,表明该样本图像中的相似特征越多,这些特征不是图像独有的特性,则这些特征越不重要。

为了更加有效地提取表征待识别图像的特征向量,可以在待识别图像上裁剪出识别区域,并将识别区域的像素尺寸调整到预定像素尺寸(例如500×500),对识别区域进行特征提取。例如,待识别图像为一圆形的金属币,图像一般为矩形,该金属币的图像中在圆形金属币区域之外,会包含噪声(例如,拍摄该图像时的背景),沿着该圆形金属币的边缘裁剪出识别区域,可以去除背景噪声的影响;并且,调整识别区域的像素尺寸,使得图像更加清晰,从而得到的特征向量可以较好地表征待识别图像。调整像素尺寸的方法为现有技术,此处不做详细介绍。

下面对样本图像信息进行详细说明。

在对图像进行识别之前,可以预先建立样本图像信息,并存储该样本图像信息,以根据该样本图像信息进行图像识别过程中的类别确定和分数计算,提高图像识别的效率。较优的,样本图像信息可以哈希(Hash)索引的形式存储,便于按照键值查找其中的信息,能够高效地进行查找操作,且查找速度不会随样本图像的增加而呈线性增加,即使在图像特征维度较高的情况下,也可以高效查找。

以下称样本图像信息为索引信息,即预先建立索引信息,并存储该索引信息。

索引信息可以包括:类别、图像标识和图像标识出现次数,还可以包括与类别一一对应的聚类中心向量。具体地,可以收集多张样本图像,对这些样本图像进行特征向量提取、聚类等处理,然后对处理得到的参数进行整理,得到索引信息。

具体地,可以通过以下步骤建立索引信息:

S1:记录多张样本图像的图像标识,分别对每张样本图像均提取多个样本图像特征向量,

并记录图像标识与多个样本图像特征向量的对应关系。

例如,N张样本图像,图像标识为数字编号1~N,对每张样本图像均提取81个样本图像特征向量,那么,会记录编号1对应81个样本图像特征向量,编号2对应81个样本图像特征向量。

为了更加有效地提取表征样本图像的特征向量,可以在样本图像上裁剪出识别区域,并将识别区域的像素尺寸调整到预定像素尺寸,对识别区域进行特征提取。例如,样本图像为一圆形的金属币,图像一般为矩形,该金属币的图像中在圆形金属币区域之外,会包含噪声(例如,拍摄该图像时的背景),沿着该圆形金属币的边缘裁剪出识别区域,可以去除背景噪声的影响;并且,调整识别区域的像素尺寸,使得图像更加清晰,从而得到的特征向量可以较好地表征样本图像。

需要说明的是,提取样本图像特征向量的方法,与上述实施例中提取待识别图像的特征向量的方法相同,此处不再赘述。提取的待识别图像的特征向量个数与样本图像特征向量的个数相同,例如,对每张样本图像提取64个特征向量,则对待识别图像也提取64个特征向量。如果需要调整像素尺寸,则调整后的待识别图像的像素尺寸与调整后的样本图像的像素尺寸相同。

S2:对多张样本图像对应的全部样本图像特征向量进行聚类,得到预定个数的类别及与类别一一对应的聚类中心向量。

聚类可以简单理解为分类,同一类别中的特征相似度较高。聚类方法有多种,例如,K-MEANS算法、K-MEDOIDS算法、CLARANS算法等。下面以K-MEANS算法为例进行说明。

对N×81个样本图像特征向量进行K-MEANS聚类,聚类过程如下:

(1)从N×81个样本图像特征向量中随机选择M个样本图像特征向量,作为初始聚类中心向量,并将选择的每个样本图像特征向量标记为一个类别,类别号可以是数字,例如,0、1、2……M-1。

(2)在N×81个样本图像特征向量中,针对每个样本图像特征向量,分别计算其与每个初始聚

类中心向量的距离,并将与该样本图像特征向量距离最近的初始聚类中心向量的类别作为该样本图像特征向量的类别。即将N×81个样本图像特征向量进行分类,分成M个类别。

(3)分别计算每个类别中所有样本图像特征向量的均值,并将该均值作为该类别的新的聚类中心向量。

(4)重复步骤(2)、(3)直到M个聚类中心向量均收敛(即对于同一类别,新的聚类中心向量与上一次的聚类中心向量的差值小于一预定经验值,变化差异较小),保存收敛的M个聚类中心向量。

S3:建立长度为预定个数的哈希索引结构,哈希索引结构包括:类别、图像标识及图像标识出现次数。

预定个数是步骤S2中对所有样本图像特征向量进行聚类得到的类别个数M。哈希索引结构的查找键值可以是步骤S2中生成的类别号,即0、1、2……M-1。图4示出了哈希索引结构的示意图,节点包括:图像标识与图像标识出现次数两个变量。

S4:将全部样本图像特征向量插入哈希索引结构,得到索引信息。

具体地,可以对每个样本图像特征向量均执行如下操作以插入哈希索引结构:

(1)确定与待插入样本图像特征向量距离最近的聚类中心向量所对应的类别,并将该类别标记为待插入样本图像特征向量的类别。

在步骤S2的聚类过程中,通过计算距离,最终得到M个聚类中心向量,且在此过程中,已经对全部样本图像特征向量进行了分类,可以在聚类结束后,将分类的信息进行存储。因此,可以直接通过读取数据确定与待插入样本图像特征向量距离最近的聚类中心向量对应的类别,无需重新计算,提高效率。

(2)在哈希索引结构中查找待插入样本图像特征向量的类别的位置,并遍历待插入样本图像特征向量的类别下的所有图像标识。

如果待插入样本图像特征向量对应的图像标识未存在于待插入样本图像特征向量的类别下,则添加新节点,其中,新节点的图像标识设置为待插入样本图像特征向量对应的图像标识,新节点的图像标识出现次数设置为1。

如果待插入样本图像特征向量对应的图像标识存在于待插入样本图像特征向量的类别下,则将该图像标识对应的图像标识出现次数加1。

通过上述步骤S1至步骤S4,可以得到索引信息。

通过本技术上述实施方式的图像识别方法,有效提取多个特征来表征待识别图像,提取的特征不受图像中物体的特性所影响,能够实现对图像的有效识别,适用范围广;且通过计算样本图像分数的方式得到识别结果,综合考虑了特征的重要性,能够获得较好的识别精度。

示例性设备

在介绍了本技术示例性实施方式的方法之后,接下来,参考图5对本技术示例性实施方式的图像识别装置进行介绍。该图像识别装置解决问题的原理与上述图像识别方法相似,因此该装置的实施可以参见上述图像识别方法的实施,重复之处不再赘述。

如图5所示,该图像识别装置包括:特征提取单元51、第一确定单元52、计算单元53、累加单元54和第二确定单元55。下面对该装置中的各个单元进行具体描述。

特征提取单元51,用于对待识别图像进行特征提取,得到多个特征向量。

第一确定单元52,用于确定每个特征向量对应的类别。

计算单元53,用于针对每个特征向量,分别计算其所对应的类别下各样本图像的分数。

累加单元54,用于将计算得到的同一样本图像的分数累加,得到该同一样本图像的分值。

第二确定单元55,用于将分值最高的样本图像对应的图像标识作为待识别图像的识别结果。

具体地,上述第一确定单元52可以包括:第一计算模块和确定模块。其中,第一计算模块可以用于分别计算特征向量与预先存储的多个聚类中心向量的距离,其中,聚类中心向量与类别一一对应;确定模块可以用于确定与该特征向量距离最近的聚类中心向量对应的类别为该特征向量对应的类别。

上述计算单元53可以被设置为按照以下公式计算样本图像的分数:

其中,S表示当前样本图像的分数,A表示平均每个类别下的样本图像特征向量个数,B表示当前样本图像所属的类别下的所有图像标识出现次数之和,C表示当前样本图像所属的类别下,当前样本图像对应的图像标识出现次数,D表示放缩因子,可以为预设常数,例如0.5。

具体地,上述特征提取单元51可以包括:遍历模块和第二计算模块。其中,遍历模块,用于利用滑动窗口遍历待识别图像;第二计算模块,用于针对滑动窗口所处的每个区域,计算该区域的特征向量。

遍历模块可以被设置为:在待识别图像上,利用滑动窗口按照预设方向每隔固定个数的像素进行滑动,直到遍历整个待识别图像。例如,按行遍历或者按列遍历。

第二计算模块可以按照以下方式计算滑动窗口所处的区域的特征向量:将该区域划分为多个大小相同的细胞单元,其中,每个细胞单元之间不重叠;针对每个细胞单元,计算其中各像素的梯度方向值,将梯度方向值在预设的投影区间内进行投影生成梯度方向投影向量;将各像素的梯度方向投影向量求和,得到该细胞单元的梯度方向直方图;将该区域内所有细胞单元的梯度方向直方图进行串联作为该区域的特征向量。

上述特征提取单元51可以被设置为:在待识别图像上裁剪出识别区域,并将识别区域的像素尺寸调整到预定像素尺寸,对识别区域进行特征提取。

如图6所示,上述图像识别装置还可以包括:建立单元56和存储单元57。其中,建立单元56

用于在对待识别图像进行特征提取之前,建立索引信息;存储单元57用于存储该索引信息。

上述建立单元56可以包括:特征提取模块、记录模块、聚类模块、建立模块和插入模块。

特征提取模块可以用于分别对每张样本图像均提取多个样本图像特征向量;记录模块可以用于记录多张样本图像的图像标识,并记录图像标识与多个样本图像特征向量的对应关系;聚类模块可以用于对多张样本图像对应的全部样本图像特征向量进行聚类,得到预定个数的类别及与类别一一对应的聚类中心向量;建立模块可以用于建立长度为预定个数的哈希索引结构,哈希索引结构可以包括:类别、图像标识及图像标识出现次数;插入模块可以用于将全部样本图像特征向量插入哈希索引结构,得到索引信息。

具体地,插入模块可以被设置为对每个样本图像特征向量均执行如下操作以插入哈希索引结构:

确定与待插入样本图像特征向量距离最近的聚类中心向量所对应的类别,并将该类别标记为待插入样本图像特征向量的类别;

在哈希索引结构中查找待插入样本图像特征向量的类别的位置,并遍历待插入样本图像特征向量的类别下的所有图像标识;

如果待插入样本图像特征向量对应的图像标识未存在于待插入样本图像特征向量的类别下,则添加新节点,其中,新节点的图像标识设置为待插入样本图像特征向量对应的图像标识,新节点的图像标识出现次数设置为1;

如果待插入样本图像特征向量对应的图像标识存在于待插入样本图像特征向量的类别下,则将该图像标识对应的图像标识出现次数加1。

应当注意,尽管在上文详细描述中提及了装置、单元或模块,但是这种划分仅仅为了更好的说明而并非强制性的。实际上,根据本技术的实施方式,上文描述的两个或更多装置的特征和功能可以在一个装置中具体化。反之,上文描述的一个装置的特征和功能可以进一步划分为由多个装置来具体化。

此外,尽管在附图中以特定顺序描述了本技术方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。

虽然已经参考若干具体实施方式描述了本技术的精神和原理,但是应该理解,本技术并不限于所公开的具体实施方式,对各方面的划分也不意味着这些方面中的特征不能组合以进行受益,这种划分仅是为了表述的方便。本技术旨在涵盖所附权利要求的精神和范围内所包括的各种修改和等同布置。

电力设备开关设常用电气图形符号和文字符号

开关设备用电气图形符号和文字符号 1范围 本标准规定了开关设备用电气图形符号和相应的文字符号。 本标准适用于高、低压开关设备电气图的绘制。 2 规范性引用文件 GB 4026 电器接线端子的识别和用字母数字符号标志接线端子的通则 GB 4728 电气图用图形符号 GB 5465 电气设备用图形符号 GB 7159 电气技术中的文字符号制订通则 3 术语 3.1 图形符号 通常用于图样或其他文件以表示一个设备或概念的图形、标记或字符。 3.2符号要素 一种具有确定意义的简单图形,必须同其他图形组合以构成一个设备或概念的完整符号。 3.3 一般符号 用以表示一类产品和此类产品特征的一种通常很简单的符号。 3.4 限定符号 用以提供附加信息的一种加在其他符号上的符号。 注:限定符号通常不能单独使用,但一般符号有时也可用作限定符号,如开关的一般符号作为限定符号加到熔断器符号上即构成具有独立报警电路的熔断器。 3.5 方框符号 用以表示元件、设备等的组合及其功能,既不给出元件、设备的细节也不考虑所有连接的一种简单的图形符号。 注:方框符号通常用在使用单线表示法的图中,也可用在表示全部输入和输出接线的图中。 3.6 项目 在图上通常用一个图形符号表示的基本件、部件、组件、功能单元、设备、系统等。如电阻器、继电器、发电机、放大器、电源装置、开关设备等,都可称为项目。 3.7 项目代号 用以识别图、图表、表格中和设备上的项目种类,并提供项目的层次关系、实际位置等信息的一种特定的代码。 4 基本要求 4.1 图形符号的绘制 4.1.1本标准中的图形符号均按便于理解的尺寸绘出,并尽量使符号互相之间的比例适当。布置图形符号时,应使连接线之间的距离是模数(2.5 mm)的倍数,通常不小于5 mm。 4.1.2本标准中的图形符号可根据需要缩小或放大,当一个图形符号用以限定另一个图形符号时,该符

机器视觉与图像处理方法

图像处理及识别技术在机器人路径规划中的一种应用 摘要:目前,随着计算机和通讯技术的发展,在智能机器人系统中,环境感知与定位、路径规划和运动控制等功能模块趋向于分布式的解决方案。机器人路径规划问题是智能机器人研究中的重要组成部分,路径规划系统可以分为环境信息的感知与识别、路径规划以及机器人的运动控制三部分,这三部分可以并行执行,提高机器人路径规划系统的稳定性和实时性。在感知环节,视觉处理是关键。本文主要对机器人的路径规划研究基于图像识别技术,研究了图像处理及识别技术在路径规划中是如何应用的,机器人将采集到的环境地图信息发送给计算机终端,计算机对图像进行分析处理与识别,将结果反馈给机器人,并给机器人发送任务信息,机器人根据接收到的信息做出相应的操作。 关键词:图像识别;图像处理;机器人;路径规划 ABSTRACT:At present, with the development of computer and communication technology, each module, such as environment sensing, direction deciding, route planning and movement controlling moduel in the system of intelligent robot, is resolved respectively. Robot path planning is an part of intelligent robot study. The path planning system can be divided into three parts: environmental information perception and recognition, path planning and motion controlling. The three parts can be executed in parallel to improve the stability of the robot path planning system. As for environment sensing, vision Proeessing is key faetor. The robot path planning of this paper is based on image recognition technology. The image processing and recognition technology is studied in the path planning is how to apply, Robots will sent collected environment map information to the computer terminal, then computer analysis and recognize those image information. After that computer will feedback the result to the robot and send the task information. The robot will act according to the received information. Keywords: image recognition,image processing, robot,path planning

动画电影制作流程(终审稿)

动画电影制作流程 文稿归稿存档编号:[KKUY-KKIO69-OTM243-OLUI129-G00I-FDQS58-

步骤是一个非常繁琐而吃重的工作,分工极为细致。通常分为前期制作、制作、等。前期制作又包括了企划、作品设定、资金募集等;制作包括了分镜、原画、动画、上色、背景作画、摄影、配音、录音等;包括合成、剪接、试映等。 如今的动画,计算机的加入使动画的制作变简单了,所以网上有好多的人用FLASH做一些短小的动画。而对于不同的人,动画的创作过程和方法可能有所不同,但其基本规律是一致的。传统动画的制作过程可以分为总体规划、设计制作、具体创作和拍摄制作四个阶段,每一阶段又有若干个步骤: 1、阶段 1)剧本。任何影片生产的第一步都是创作剧本,但动画片的剧本与真人表演的故事片剧本有很大不同。一般影片中的对话,对演员的表演是很重要的,而在动画影片中则应尽可能避免复杂的对话。在这里最重的是用画面表现视觉动作,最好的动画是通过滑稽的动作取得的,其中没有对话,而是由视觉创作激发人们的想象。 2)故事板。根据剧本,导演要绘制出类似连环画的故事草图(分镜头绘图剧本),将剧本描述的动作表现出来。故事板有若干片段组成,每一片段由系列场景组成,一个场景一般被限定在某一地点和一组人物

内,而场景又可以分为一系列被视为图片单位的镜头,由此构造出一部动画片的整体结构。故事板在绘制各个分镜头的同时,作为其内容的动作、道白的时间、摄影指示、画面连接等都要有相应的说明。一般30分钟的动画剧本,若设置400个左右的分镜头,将要绘制约800幅图画的图画剧本——故事板。 3)摄制表。这是导演编制的整个影片制作的进度规划表,以指导动画创作集体各方人员统一协调地工作。 2、设计制作阶段 1)设计。是在故事板的基础上,确定背景、前景及道具的形式和形状,完成场景环境和背景图的设计和制作。另外,还要对人物或其他角色进行,并绘制出每个造型的几个不同角度的标准画,以供其他动画人员参考。 2)音响。在时,因为动作必须与音乐匹配,所以音响录音不得不在动画制作之前进行。录音完成后,编辑人员还要把记录的声音精确地分解到每一幅画面位置上,即第几秒(或第几幅画面)开始说话,说话持续多久等。最后要把全部音响历程(即音轨)分解到每一幅画面位置与声音对应的条表,供动画人员参考。 3、具体创作阶段

图像识别方法和设备的制作流程

本技术的实施方式提供了一种图像识别方法。该方法包括:对待识别图像进行特征提取,得到多个特征向量;确定每个特征向量对应的类别;针对每个特征向量,分别计算其所对应的类别下各样本图像的分数;将计算得到的同一样本图像的分数累加,得到该同一样本图像的分值;将分值最高的样本图像对应的图像标识作为待识别图像的识别结果。通过上述图像识别方法,有效提取多个特征来表征待识别图像,提取的特征不受图像中物体的特性所影响,能够实现对图像的有效识别,适用范围广;且通过计算样本图像分数的方式得到识别结果,综合考虑了特征的重要性,能够获得较好的识别精度。此外,本技术的实施方式提供了一种图像识别装置。 权利要求书 1.一种图像识别方法,包括: 对待识别图像进行特征提取,得到多个特征向量; 确定每个特征向量对应的类别; 针对所述每个特征向量,分别计算其所对应的类别下各样本图像的分数;

将计算得到的同一样本图像的分数累加,得到该同一样本图像的分值; 将分值最高的样本图像对应的图像标识作为所述待识别图像的识别结果; 按照以下公式计算样本图像的分数: 其中,S表示当前样本图像的分数,A表示平均每个类别下的样本图像特征向量个数,B表示所述当前样本图像所属的类别下的所有图像标识出现次数之和,C表示所述当前样本图像所属的类别下,所述当前样本图像对应的图像标识出现次数,D表示放缩因子。 2.根据权利要求1所述的图像识别方法,其中,确定每个特征向量对应的类别,包括: 分别计算所述特征向量与预先存储的多个聚类中心向量的距离,其中,所述聚类中心向量与所述类别一一对应; 确定与所述特征向量距离最近的聚类中心向量对应的类别为所述特征向量对应的类别。 3.根据权利要求1所述的图像识别方法,其中,对待识别图像进行特征提取,得到多个特征向量,包括: 利用滑动窗口遍历所述待识别图像; 针对所述滑动窗口所处的每个区域,计算该区域的特征向量。 4.根据权利要求3所述的图像识别方法,其中,计算该区域的特征向量,包括: 将该区域划分为多个大小相同的细胞单元,其中,每个细胞单元之间不重叠;

主要电力设备故障图像特征及识别方法研究改

摘要 摘要内容 伴随着我国电网规模的日益加大,各类变电设备的运作状态是促使其安全高效运行的最为主要的因素之一。对于各类变电设备的在线状态监测系统的推广越来越发普及。研究基于图像特征的电力设备自动故障识别具有重要意义。 本文对各类主要电力设备,研究各类变电设备故障识别分类及相应故障的图像特征,以及基于红外与紫外图像特征的故障识别方法。对于紫外放电成像技术图像的处理与特征提取,本文从紫外成像技术的基本原理出发,在讲解紫外放电图片特性的基础上,对紫外放电图像使用灰度化预处理,以及应用中值滤波等方法对图像进行降噪。并通过canny算子边缘检测计算紫外光斑面积判断是否发生放电故障。针对红外故障图像,本文在红外成像原理的基础上,对红外图像进行超像素分割及HSV空间颜色提取,对应用卷积神经网络对红外故障图像故障区域检测进行理论上的研究。 关键词:红外成像紫外成像图像处理

ABSTRACT With the increasing scale of China's power grid, the operation of various types of substation equipment is one of the most important factors to promote the safe and efficient operation. The popularization of the on-line condition monitoring system for all kinds of transformer equipment is becoming more and more popular. Research on image feature based automatic fault recognition of power equipment is of great significance. In this paper, various types of main power equipment, the study of various types of substation equipment fault identification and classification of image features, as well as infrared and ultraviolet image features based on fault identification method. For ultraviolet discharge imaging technique to image processing and feature extraction, this paper from the basic principle of UV imaging technology of on the explanation of the ultraviolet discharge picture characteristics based and discharge on the UV image using grayscale preprocessing and application of median filtering method of image in noise reduction. And through the Canny operator edge detection to determine whether the area of the UV spot to determine whether the discharge fault. Aiming at the

完整版机器视觉思考题及其答案

什么是机器视觉技术?试论述其基本概念和目的。答:机器视觉技术是是一门涉及人工智能、神经生物学、心理物理学、计算机科学、图像处理、模式识别等诸多领域的交叉学科。机器视觉主要用计算机来模拟人的视觉功能,从客观事物的图像中提取信息,进行处理并加以理解,最终用于实际检测、测量和控制。机器视觉技术最大的特点是速度快、信息量大、功能多。机器视觉是用机器代替人眼来完成观测和判断,常用于大批量生产过程汇总的产品质量检测,不适合人的危险环境和人眼视觉难以满足的场合。机器视觉可以大大提高检测精度和速度,从而提高生产效率,并且可以避免人眼视觉检测所带来的偏差和误差。机器视觉系统一般由哪几部分组成?试详细论述之。答:机器视觉系统主要包括三大部分:图像获取、图像处理和识别、输出显示或控制。图像获取:是将被检测物体的可视化图像和内在特征转换成能被计算机处理的一系列数据。 该部分主要包括,照明系统、图像聚焦光学系统、图像敏感元件(主要是CCD和CMOS采 集物体影像。 图像处理和识别:视觉信息的处理主要包括滤波去噪、图像增强、平滑、边缘锐化、分割、图像识别与理解等内容。经过图像处理后,图像的质量得到提高,既改善了图像的视觉效果又便于计算机对图像进行分析、处理和识别。 输出显示或控制:主要是将分析结果输出到显示器或控制机构等输出设备。试论述机器视觉技术的现状和发展前景。 答:。机器视觉技术的现状:机器视觉是近20?30年出现的新技术,由于其固有的柔性好、 非接触、快速等特点,在各个领域得到很广泛的应用,如航空航天、工业、军事、民用等等领域。 发展前景:随着光学传感器、信息技术、信号处理、人工智能、模式识别研究的不断深入和计算机性价比的不断提高,机器视觉技术越来越成熟,特别是市面上已经有针对机器视觉系统开发的企业提供配套的软硬件服务,相信越来越多的客户会选择机器视觉系统代替人力进行工作,既便于管理又节省了成本。价格持续下降、功能逐渐增多、成品小型化、集成产品增多。 机器视觉技术在很多领域已得到广泛的应用。请给出机器视觉技术应用的三个实例并叙述之。答:一、在激光焊接中的应用。通过机器视觉系统,实时跟踪焊缝位置,实现实时控制,防止偏离焊缝,造成产品报废。 二、在火车轮对检测中的应用,通过机器视觉系统抓拍轮对图像,找出轮对中有缺陷的轮对,提高检测精度和速度,提高效率。 三、大批量生产过程中的质量检查,通过机器视觉系统,对生产过程中的产品进行质量检查 跟踪,提高生产效率和准确度。 什么是傅里叶变换,分别绘出一维和二维的连续及离散傅里叶变换的数学表达式。论述图像傅立叶变换的基本概念、作用和目的。 答:傅里叶变换是将时域信号分解为不同频率的正弦信号或余弦函数叠加之和。一维连续函数的傅里叶变换为:一维离散傅里叶变换为:二维连续函数的傅里叶变换为:二维离散傅里叶变换为: 图像傅立叶变换的基本概念:傅立叶变换是数字图像处理技术的基础,其通过在时空域和频率域来回切换图像,对图像的信息特征进行提取和分析,简化了计算工作量,被喻为描述图像信息的第二种语言,广泛应用于图像变换,图像编码与压缩,图像分割,图像重建等。作用和目的:图像的频率是表征图像中灰度变化剧烈程度的指标,是灰度在平面空间上的梯度。傅立叶变换的物理意义是将图像的灰度分布函数变换为图像的频率分布函数,傅立叶逆变换是将图像的频率分布函数变换为灰度分布函数。图像灰度变换主要有哪几种形式?各自的特点和作用是什么? 答:灰度变换:基于点操作,将每一个像素的灰度值按照一定的数学变换公式转换为一个新的灰度值。灰度变换是图像增强的一种重要手段,它可以使图像动态范围加大,使图像的对比度扩展,

二维动画制作流程

二维动画制作流程 1总体设计阶段 ◎策划:动画制作公司、发行商以及相关产品的开发商,共同策划应该开发怎样的动画片,预测此种动画片有没有市场,研究动画片的开发周期,资金的筹措等多个问题。 ◎文字剧本:开发计划订立以后,就要创作合适的文字剧本,一般这个任务由编剧完成。可以自己创作剧本,也可借鉴、改编他人的作品。 2设计制作阶段 ◎角色造型设定:要求动画家创作出片中的人物造型。 ◎场景设计:场景设计侧重于人物所处的环境,是高山还是平原,屋内还是屋外,哪个国家,哪个地区,都要一次性将动画片中提到的场所设计出来。 ◎画面分镜头:这个过程也是非常重要的,它的目的就是生产作业图。作业图比较详细,上面既要体 现出镜头之间蒙太奇的衔接关系,还要指明人物的位置、动作、表情等信息,还要标明各个阶段需要运用的镜头号码、背景号码、时间长度、机位运动等。

◎分镜头设计稿:动画的每一帧基本上都是由上下两部分组成。下部分是背景,上部分是角色。背景和角色制作中分别由两组工作人员来完成,分镜头设计稿是这两部分工作的纽带。 3具体创作阶段 ◎绘制背景:背景是根据分镜头设计稿中的背景部分绘制成的彩色画稿。 ◎原画:镜头中的人物或动物、道具要交给原画师,原画师将这些人物、动物等角色的每一个动作的关键瞬间画面绘制出来。 ◎动画中间画:动画师是原画师的助手,他的任务是使角色的动作连贯。原画师的原画表现的只是角 色的关键动作,因此角色的动作是不连贯的。在这些关键动作之间要将角色的中间动作插入补齐,这就是动画中间画。 ◎做监:也就是进行质量把关。生产一部动画片有诸多的工序,如果某一道工序没有达到相应的要求,肯定会影响以后的生产工作。因此在每个阶段都应有一个负责质量把关的人。 ◎描线、定色与着色。 4动画制作阶段

设备制造流程及制作周期

设备制造流程及制作周期 设备制造工艺流程图 (1) 材料入库 材料、零部件 材料进厂检查 材料领用 材料 切割 组对 焊接☆ 整型 表面毛刺处理 零(原)部件 检测 分组 测试 组装 调试 非标件 下料 整理 车床加工 检验 清理 喷漆☆ 成品检查 产品调试 产品整装 包装作业 铭牌、标签☆ 入库 激光打标 无损检测、理化检验☆

设备制造工艺流程表(2) NO 工程名称 作业内容 管理项目 记录 操作人员 1 材料、零部件 材料零部件入 库 先入先出 原材料入库表 仓库检验 保管员 2 材料进厂检查 实施进厂检查 N/A 外部采购合同书,输入 检验报告 3 材料入库 移动至材料仓 库保管 分规格保管 作业日志 4 材料领用 原材料工程投 入 先入先出 原材料出库表 5 材料 产品的加工 按顺序进行 作业日志 车间 技术人员 6 切割 材料切割 尺寸 生产作业指导书 7 组对 产品的精密加 工 尺寸 生产作业指导书 8 焊接 产品的加工 尺寸 生产作业指导书 9 整型 校正 尺寸 生产作业指导书 10 表面毛刺处理 表面毛刺处理 去除毛刺 生产作业指导书 11 无损、理化检验 仪器检测 焊接质量 生产作业指导书 12 喷漆 表面着色 外周检验 生产作业指导书 13 产品整装 产品整装 产品的结合 性 作业日志 14 产品调试 产品检验 产品性能 作业日志 15 成品检查 最终检查 N/A 检验报告 检验员 16 包装作业 包装作业 包装状态 作业日志 内外包装 操作工 17 铭牌、标签 打制铭牌、加贴 标签 N/A 作业日志 18 入库 包装成品 N/A 成品入库表 仓库检验保管员 注:在工艺流程图中带☆标记是主要控制项目和控制点及关键和特殊工序 有关制造工艺流程图的详细说明 ○ 将材料切割成所需的大小及形状。 ○ 利用切割机分料初步加工之后,接着利用攻螺丝机加工螺孔。 ○ 加工后的材料做为产品以成形,但为了提高表面粗度,进行抛丸清理。 ○ 抛丸清理后进行喷漆作业,该工艺属关键和特殊工序。 ○ 完成成品检查后打制铭牌、加贴标签入库。该工艺属关键和特殊工序。 ※从原料入库到成品入库,根据产品标准书的标准要求规定,全程记录及管理。

基于卷积神经网络的电力设备识别方法及系统实现

基于卷积神经网络的电力设备识别方法及系统实现电力设备的正常运行是一个电力系统能够长期安全稳定工作的基础,因此对电力设备进行定期巡检就显得十分重要。以往的巡检方法都存在着各种不同的缺点,造成人力物力上的浪费且效果也有待提升。 近年来随着人工智能技术以及图像处理等技术的逐渐发展与成熟,将其应用到电力设备运行状态的检测中则能很好的弥补了传统方法的不足,该方法具有深远的发展前景。本文利用卷积神经网络以及计算机视觉等相关知识,提出了一种新的对电力设备运行状态自动检测识别的系统,该系统能自动对电力设备的位置进行检测以及对其运行状态进行判别,同时对指针式仪表进行自动读数。 本文主要的研究内容及工作如下:(1)设计并实现了基于卷积神经网络的电力设备自动检测识别算法。使用Faster RCNN+ResNet101模型在高性能计算机上完成对电力设备的识别,同时针对计算能力较弱、可携带式的嵌入式设备树莓派设计MobileNet+SSD模型并实现。 并且制作了针对电力设备检测识别的数据集,分别使用两种模型在此数据集上进行训练测试,其中Faster RCNN+ResNet101模型取得了较高的识别准确率,同时在检测速度上也能勉强达到实时性的要求,MobileNet+SSD模型在树莓派上搭配神经网络计算棒的使用在识别准确率上稍有下降,但该模型的检测速度为 15fps,完全满足系统实时性的需求。(2)对电力系统中常用的指针式仪表设计并实现了一种自动读数的算法。 使用图像处理的相关知识,先对指针式仪表图像进行灰度化、直方图均衡化以及图像去噪的预处理,然后对其进行形态学膨胀操作,接着使用Canny算子检测图像的边缘信息,并使用Hough变换在边缘信息中检测出指针所在直线的位置,

动画片制作流程

动画片制作流程

动画片制作流程 1、策划 2、制作经费 3、动画前期一:脚本 4、动画前期二:导演的工作 5、动画前期三:分镜图和副导的工作 6、动画前期四:人物设计和人物设计师的工作 7、动画前期五:机械造型设计和背景设计的工作 8、动画前期六:色彩设计及色彩指定的工作 9、动画中期一:构图,原画和原画指导 10、动画中期二:动画师 11、动画中期三:着色/上色人员 12、动画中期四:特效及特效人员 13、动画中期五:摄影及摄影效果 14、动画后期一:剪接 15、动画后期二:音响1:配音及声优 16、动画后期三:音响2:音乐,效果音及合成 17、试映,宣传,行销 第一回制前作业第一步的前一步 普通在进行所谓的动画制作之前,常有一段为时不短(或有点痛苦)的「制前作业」(英文:Pre-Production 日文:准备段阶)。制前作业是

指要开始制作的准备工作.但是制前的前面呢? 制前的前面是「策划」(日文:策划段阶) 「策划」又分为两种。第一种是在每一年度的策划会议里,动画公司的老板(英文:boss, excutive producer, 日文:社长, 策划)或有点伟大有点发言权的制作人看到一本颇有趣又出名的漫画或小说,觉得拍成动画应该会蛮赚钱的,于是就打电话给代理那本被相中的漫画或小说的代理商问问看是否拍成动画的权利已卖出,如果没有那就开始进行「有时长有时短有时痛苦有时快乐」的权利交涉。如果您在动画的片头一开始看到「原作」这两个字大都是属于这类型。 另外一种是动画公司旗下的导演(英文:Director,日文:监督)或动画家们觉得自己天马行空胡思乱想不画画不按时交稿作白日梦的结果拍成动画应该颇有趣的就自己开始写策划书然后交给老板过目。幸运的,策划通过的话,就由老板或制作人四处奔波找金主...啊,不是,赞助商来一起响应伟大的策划。如果您在动画的片头看到「原案」二字大都是属于这类型。 交涉成功或策划通过后 让我们先谈原案企划通过的状况下动画公司的下一步骤。 动画公司基本上都没有独立制作动画作品(不管是TV或OVA)的经费,因此动画公司想要作原案作品时最重要的是提出企划给赞助商(*1)看他们有没有兴趣投资。如果赞助商对动画公司提出的新作品企划没兴趣或认为此商品(*2)没有市场价值,那么那企划100%不会再见天日。

图像模式识别的方法介绍

2.1图像模式识别的方法 图像模式识别的方法很多,从图像模式识别提取的特征对象来看,图像识别方法可分为以下几种:基于形状特征的识别技术、基于色彩特征的识别技术以及基于纹理特征的识别技术。其中,基于形状特征的识别方法,其关键是找到图像中对象形状及对此进行描述,形成可视特征矢量,以完成不同图像的分类,常用来表示形状的变量有形状的周长、面积、圆形度、离心率等。基于色彩特征的识别技术主要针对彩色图像,通过色彩直方图具有的简单且随图像的大小、旋转变换不敏感等特点进行分类识别。基于纹理特征的识别方法是通过对图像中非常具有结构规律的特征加以分析或者则是对图像中的色彩强度的分布信息进行统计来完成。 从模式特征选择及判别决策方法的不同可将图像模式识别方法大致归纳为两类:统计模式(决策理论)识别方法和句法(结构)模式识别方法。此外,近些年随着对模式识别技术研究的进一步深入,模糊模式识别方法和神经网络模式识别方法也开始得到广泛的应用。在此将这四种方法进行一下说明。 2.1.1句法模式识别 对于较复杂的模式,如采用统计模式识别的方法,所面临的一个困难就是特征提取的问题,它所要求的特征量十分巨大,要把某一个复杂模式准确分类很困难,从而很自然地就想到这样的一种设计,即努力地把一个复杂模式分化为若干

较简单子模式的组合,而子模式又分为若干基元,通过对基元的识别,进而识别子模式,最终识别该复杂模式。正如英文句子由一些短语,短语又由单词,单词又由字母构成一样。用一组模式基元和它们的组成来描述模式的结构的语言,称为模式描述语言。支配基元组成模式的规则称为文法。当每个基元被识别后,利用句法分析就可以作出整个的模式识别。即以这个句子是否符合某特定文法,以判别它是否属于某一类别。这就是句法模式识别的基本思想。 句法模式识别系统主要由预处理、基元提取、句法分析和文法推断等几部分组成。由预处理分割的模式,经基元提取形成描述模式的基元串(即字符串)。句法分析根据文法推理所推断的文法,判决有序字符串所描述的模式类别,得到判决结果。问题在于句法分析所依据的文法。不同的模式类对应着不同的文法,描述不同的目标。为了得到于模式类相适应的文法,类似于统计模式识别的训练过程,必须事先采集足够多的训练模式样本,经基元提取,把相应的文法推断出来。实际应用还有一定的困难。 2.1.2统计模式识别 统计模式识别是目前最成熟也是应用最广泛的方法,它主要利用贝叶斯决策规则解决最优分类器问题。统计决策理论的基本思想就是在不同的模式类中建立一个决策边界,利用决策函数把一个给定的模式归入相应的模式类中。统计模式识别的基本模型如图2,该模型主要包括两种操作模型:训练和分类,其中训练主要利用己有样本完成对决策边界的划分,并采取了一定的学习机制以保证基于样本的划分是最优的;而分类主要对输入的模式利用其特征和训练得来的决策函数而把模式划分到相应模式类中。 统计模式识别方法以数学上的决策理论为基础建立统计模式识别模型。其基本模型是:对被研究图像进行大量统计分析,找出规律性的认识,并选取出反映图像本质的特征进行分类识别。统计模式识别系统可分为两种运行模式:训练和分类。训练模式中,预处理模块负责将感兴趣的特征从背景中分割出来、去除噪声以及进行其它操作;特征选取模块主要负责找到合适的特征来表示输入模式;分类器负责训练分割特征空间。在分类模式中,被训练好的分类器将输入模式根据测量的特征分配到某个指定的类。统计模式识别组成如图2所示。

研究分析图像识别技术在电力设备监测中的应用

研究分析图像识别技术在电力设备监测中的应用 发表时间:2016-10-10T13:53:58.087Z 来源:《电力设备》2016年第13期作者:周睿 [导读] 在电力设备监测工作中,图像识别技术的应用对于提高监测的效率和质量都有重要的作用。 (大庆油田有限责任公司第九采油厂生产运行部 163000) 摘要:在电力设备监测工作中,图像识别技术的应用对于提高监测的效率和质量都有重要的作用。文章对电力设备监测中图像识别技术的识别与分析功能以及电力设备异常状态监测进行了分析。 关键词:图像识别技术;电力设备检测;应用 在电力系统运行的过程中,电力设备难免会出现各种异常问题,这就需要对电力设备进行必要的监测,为提高电力设备监测效率和质量,图像分析识别技术被应用于其中,并在实际的使用当中取得了良好的效果。 1.图像识别技术应用于电力设备监测的背景 变电站的正常运行是靠高压设备绝缘检测、继电保护装置等各种系统和装置来维持的,这些系统也保证了变电系统的安全和稳定。目前,在电力设备监测系统的运行方面还存在一定不足和缺陷,例如,在数据传输方面存在一定问题,数据的正常传输会受高压电场的影响。还有一种问题是电信号转换方面的问题,即一些征兆信号和运行参数不容易通过接触测量转换电线信号,即使采用微机监测的方式也很难进行获取。在设备运行线监测方面,目前已经有了遥视系统,遥视系统在电力系统的安全运行方面发挥重要作用。随着电网建设规模的不断增加,变电站数量也急剧增加,所以需要进行监测的目标的数量大大增加,相应的需要传输的数据量也在不断增加,这种情况导致电力调度人员在对电力系统进行监测时,需要对远程图像和数据的进行了分析并作出判断,工作量大大增加。在电力行业的很多专家和学者都在致力于远程图像的采集、传输等研究,如何降低工作人员的工作强度,提高工作效率也是研究的中重点。 为提高电力设备自动监测水平,将图像识别技术应用于电力设实时监测的方案被提出。这种方案的以现有的电力设备视频监测系统为基础,利用图像识别系统作为辅助进行工作。这种系统的优势是不需对原有的系统进行更换,不仅增加了功能,还节省了更换设备的成本,经济性很高。 2.图像识别与分析 图像识别系统对图像识别与分析存在很多困难,会受到很多因素的干扰,引入噪声,导致图像的质量变低,为图像识别和分析带来很大的困难,引入噪声的因素通常有电荷耦合元件的畸变、聚焦效果差等,另外,环境方面的干扰也会使对图像的采集质量造成干扰。图像识别系统的工作的第一步是先对图像进行预处理,之后对图像进行分割,把目标电力设备分割出来,增加识别的精细度。 2.1图像预处理 图像识别系统预处理需分很多步骤,第一步要将收集到的原图像进行灰度化处理,处理后的图像就可以叫做灰度图;第二步是对灰度图进行滤波处理,由于滤波处理对消减噪声很有效果,所以采取滤波来消减图像的噪声,使图像质量得到提高,使系统更容易识别。进行滤波处理所要使用的模板是加入权系数的平滑模板。图像平滑滤波处理的过程所采取的是低通滤波,使用这种方式过滤图像,对高频正信号的过滤效果比较好,但在这一过程中也会使图像的边缘部分的高频噪声被过滤掉,进而导致图像的边缘变得模糊不清,降低图像整体质量。解决这种问题的措施是采用直方图均衡处理,平滑滤波处理与方正图均衡处理相结合,不仅可以图像噪音还避免了边缘模糊化问题。 2.2图像分割 图像分割是指将图像表示为具有物理意义的多连通区域的集合。分割图像需要根据一定的依据,不同的图像在颜色、纹理以及亮度这些特征上都有着一定的差异,因此,可以依据这些特征,对图像进行分割。对图像进行分割可以提高地图像识别和分析的效率,分割的准确性也会影响到后续的工作,为了保证图像识别的质量,要严格把握分割的精度。 对图像分割的依据是图像的颜色、几何性质等,将图像中含义不同的区域分割开,每个区域都有相同的特征。例如,对某一物体的图像进行分割,需要把图像中物体的像素与背景进行分离,区分不同物体的像素,分割形成的区域需要满足三个条件。第一,不同但相邻的两个区域之间要存在明显的差异;第二,分割区域边界要保持完整,有利于定位的精准。第三,分割之后的区域应该还要具有均匀性和连通性。均匀性是指区域内的像素点在色彩、纹理等特征上要有相似性,连通性是指在两种区域之间可以进行连接。 3.电力设备异常状态监测 为了实现检测分析方案在实际工作中的应用,提升现有视频监测系统的功能,建立电力设备运行状态的实时监测和分析系统,在采集到的图像中准确快速地识别出电力设备之后,还需要进一步对电力设备的运行状态进行判断,监测运行状态的变化,找出电力设备中存在故障的设备和位置。并及时发出报警信号,方便维修人员尽快对设备故障进行检修。 3.1变电站的图像监测 变电站未来的发展趋势是自动化,要求变电所站无人值守。目前有和很多变电站建立了遥视系统,对图像信号进行单一的采集和传输,但由于当前电网快速发展,这种系统的功能太过简单,无法满足多方面的需求。所以针对图像的监测还需要采取先分类,然后分析,最后根据分析结果来判定是否需要传输。如果设备处于正常运行状态,不传输监测图形,而只传输结果;如果变电站运行不正常,图像信号就会传输到调度端并进行报警,调度工作人员在接到报警以后,可以找出具有问题的变电站的图像,工作人员通过对图像进行观察和分析,找到问题所在,并对采取相应措施来处理问题。用这种方式来进行变电站图像的监测,可以不仅可以提高监测效率。还可以节省大量的资源,减轻工作人员的工作强度,也避免了数据传输拥挤所带来的困难。 变电站图像监测系统中采集图像需要用成像设备进行采集,计算机技术也发挥很大的作用,利用计算机可以对图像进行截取、识别和分析,并且能够准确地获取关于电力设备的很多参数和数据。变电站图像监测技术涉及的领域很广,包括测量规程、视觉理论等,这些学科的知识有利于解决监测自动化运行中出现的很多问题。 3.2电力设备状态检测与分析 在对电力设备的图像进行收集、处理之后,就需要对图像中的电力设备进行识别。计算机是通常使用的工具,计算机具有计算效率

动画片的制作流程及预算

前期: 名词:脚本,故事板: 脚本中不仅是你的故事,还有客户的要求以及最后所要达到的目标即片子的定位、风格、特点等等。 故事板是各部门的工作人员独立作业的依据,所以有必要详细一点(程度要看具体的项目了)。这两样东西组合以后,在电脑里加上时间就是最早的一部样片了。(主要用于初步的讨论) 设定: 角色设定包括角色的造型和主要的表现特性的动作,可能还有一些表情和主角用的特殊道具等等。有的片子里还有特殊的道具设定。 背景设定包括片子里几个大的场景的手绘彩稿等等。 资料收集:如果你的客户已经提供详细的资料,那会非常方便;可实际上手头的资料往往不够,那么收集资料的工作是必要的,这些资料可以成为跟客户确定最后效果的依据。 工作人员: 这时候主要的工作人员都要找齐(包括各个部门或者环节的主要负责人),相关的技术人员也要找到(有的时候你只是这个项目需要一个这方面的技术指导,那么就只要找一个临时的)。 软件清单: 需要使用的软件清单,如:三维软件,办公软件,一般的压缩工具等等,二维的绘图软件,后期软件,所需要的一些重要的插件和一些内码等等。 流程: 主要创作人员根据客户的要求制订脚本;接着开始做出初步的故事板和设定,同时找到所需的资料,并且确定所需要的技术及人员,确定项目的可行性;然后确定脚本,故事板及设定。 注意事项: 前期的内容一定都要确定,大的框架在这时已经形成。制作中很多影响大的改动都是牵一发而动全身的其后果也往往是很严重,而且要对工作人员有相应的补偿。前期的准备往往很花时间在沟通上(包括内部和外部),费心费神,但是会为以后的工作带来很多便利。 样片: 样片里应该包括这个片子里的主要的大场景和主要人物和一些重要的镜头,画面的效果,整体的风格,特点等等这时候应该已经差不多都出来了。 修改意见: 客户这时候给你的应该是关于这部片子的整体风格等各个方面最终的修改意见,这时候就是真正确定的时候。 技术问题: 让客户看到差不多的效果后,主创人员要确定正式制作时不会有大的或者解决不掉并且影响全片的技术问题。尽量不要在已经开始制作以后再加一些技术,有的时间这不一定能提高片子的水平或效率,虽然表面上看起来这个技术是先进的,但是要一个团队的所有人再重新掌握一种技术,花的时间就不一样了。所以做一个样片,不仅是给客户也是给自己的,大部分技术问题应该在这里就要解决掉! 时间表: 通过样片的制作,项目负责人根据样片制作的周期来安排正式的时间表。 流程: 主创人员开始根据前期已经确定的故事版来确定需要做哪几个镜头,部分已经进入团队的工作人员开始制作角色和场景;然后一起完成这个样片。制作的过程基本上跟正式制作是一样的,除了原画要在角色的模型上直接调整动作。 注意事项: 样片其实就是对正式制作的一次演习,并且样片会决定客户对于这个团队的信任程度。所以样

图像识别技术综述

图像处理与识别技术综述 摘要:本文简要介绍了图像处理与识别技术的相关知识,介绍了图像识别过程中的判别函数和判别规则,特征提取和选择的方法。设计一个基于16位处理器MC9S12XS128的图像识别系统在实际中的具体硬件实现。 关键词:图像识别特征提取MC9S12XS128 数字摄像头 An Overview of Image Recognition And Identifying Technology Abstract:This paper introduces some knowledge of image recognition and identifying technology,introduces the discriminant function discriminant rule in the image identifying progress, feature extraction and selection method. Designed an image identifying system based on 16-bit controller MC9S12XS128,and it has specific hardware implementation in fact. Key words: image identifying discriminaut rule MC9S12XS128 digital cameral

1 引言 图像是与视觉相关的最贴近生活的信息,它是客观世界的物体直接或间接作用于人眼而产生视知觉的实体。传统的图像处理技术就是对图像进行保存、处理、压缩、传输和重现。随着信息时代的到来,用于计算机处理的各种信息的需求越来越多,多媒体信息处理技术已经成为日常生活各个领域的迫切需要。人们更希望利用计算机技术处理人类视觉问题,如:人脸、指纹识别技术实现处理与个人有关的一切事物,利用视觉自动监视系统监视环境中发生的非常事件,利用字符识别技术实现文档图像的自动录入与处理。因此把传统的图像处理技术与模式识别处理技术相结合是图像处理的新趋势。 2 传统的图像处理技术 图像处理技术始于20世纪50年代,1964年美国喷射推进实验室(JPL )使用计算机对太空船送回的大批月球照片处理后得到了清晰逼真的图像,这是这门技术发展的里程碑,此后这门技术得到了广泛的发展。 传统图像处理技术包含图像的获取、变换、增强、编码、分割等方面的内容。 2.1 图像获取 图像可以根据其形式或产生方法来分类。 照片图画 光图像连续函数 离散函数 (数字图像)不可见的 物理图像 物体图像 可见的图像图片数学函数 图1 图像的分类 图像的获取[4]是指将其变为计算机可识别的信息。通常是数字化的过程,及扫描、采样、量化三个步骤。经过数字化过程后就得到了一幅图的数字表示,即数字图像。一般这个过程由摄像头等设备完成。反过来还可将数字图像进行显示。 2.2 图像变换 图像变换[6]广泛应用于图像滤波[2]、统计滤波[5]、图像数据压缩以及图像描述等。图像变换是将N ×N 维空间图像数据变换成另外一组基向量(通常是正交向量空间)的坐标参数,我们希望这些离散图像信号坐标参数更集中代表了图像中的有效信息,或者是更便于达到某种处理目的。 通常采用的方法有:傅里叶变换、相关分析、小波变换[7]、离散余弦变换(DCT )、正弦变

设备生产流程

设备生产流程 Company Document number:WUUT-WUUY-WBBGB-BWYTT-1982GT

设备生产流程图 合 格 成 品 根据购买计划购进的原材料和外协加工件,经质检实验室检测合格后办理入库手续。检测配件质量、外形尺寸、材质达到生产设备配件要求。 二、装配部流程 (一)按照生产计划填写领料单,领用配件有装配工保管安装使用。 (二)打开机箱盖进行设备组装 1、电磁阀的组装:将840电磁阀与210mm 波纹管连接、波纹管要用橡胶密封垫、锥形橡胶密封垫、用15/24外丝对接、用16变24的对丝对接、安装喷嘴 。 注意各部件连接时的先后顺序,喷嘴安装时要滴加螺纹胶密封。 2、电磁阀与机箱的连接: 电磁阀用M4*6的不锈钢螺丝连接,注意波纹管的弯曲角度。(注意;锥形密封垫要卡入中间隔板,保证机箱燃烧室与控制室隔离)

3、燃烧杯的组装:注意弹垫的位置,组装时避免波纹管扭曲受力。 4、风压测压口宝塔件的安装(确保螺纹处滴有5071密封胶,螺纹上到底) 5、指示灯的安装,注:螺纹为塑料材质,注意用力不要过猛,橡胶密封圈要加在机箱外延。 6、隔热陶瓷垫与观火孔的安装,观火孔安装时要注意从一边慢慢的往机箱观火孔槽上卡,确保安装的牢固和美观。隔热陶瓷垫在安装时要提前折好,注意用力不要过大,以免对陶瓷垫产生破损。 7、点火针的安装。采用M4的不锈钢螺丝安装,机壳与点火针之间加装陶瓷隔热垫,注意点火针的安装方向。 8、风压开关的安装。采用M4*10的不锈钢螺丝连接,注意安装的方向,风压开关一般调至40pa。 9、风压测压管的安装。长度不宜过长,长度控制在风压管不受力,不打结为准。 10、橡胶密封垫的粘贴。保证机箱盖与机箱接触的部位都要黏贴上,以保证燃烧控制室的密封环境。 11、机箱下侧盖的安装,用M4的不锈钢螺丝连接,确保螺丝上紧。 12、机箱组线的连接,注意每根线的接法和位置,注意接线方式按接线图 13、控制板的安装,将控制板放人注塑方盒内,将组线与控制板连接,注意插口的方向,确保地线连接良好,用螺丝固定好盒盖后安装在机箱内。 14、机箱上盖的安装,用M4的不锈钢螺丝连接,确保螺丝上紧。 (三)设备组装完成的检测 外观检查 1、机箱外壳表面涂层应光滑,色泽均匀,不应有斑痕,划痕及凹陷。 2、各焊接螺帽无松动,连接尺寸符合设计要求。 启动设备检验 1、不开燃气阀进行启动检验:

相关主题