搜档网
当前位置:搜档网 › 基于麦克风阵列的近场声源定位子阵算法研究

基于麦克风阵列的近场声源定位子阵算法研究

基于麦克风阵列的近场声源定位子阵算法研究
基于麦克风阵列的近场声源定位子阵算法研究

第20卷 第5期电子测量与仪器学报

V ol 120 N o 15

JOURNAL O F EL ECTRON I C

 ?50 ?

M EASUR E M EN T AND I N STRUM EN T

 2006年10月

本项目为华为高校科技基金资助项目(编号:YJCB2004013MU )。

本文于2005年4月收到。居太亮:博士研究生;彭启琮:教授,博导;邵怀宗:博士,副教授,硕士生导师。

基于麦克风阵列的近场声源定位子阵算法研究

居太亮 彭启琮 邵怀宗

(电子科技大学通信与信息工程学院,四川成都610054)

摘 要:基于麦克风阵列的声源定位技术在通信、语音处理等领域得到广泛的应用。结合远场窄带信号的子阵算法和麦克风阵列信号处理的特点,提出了基于麦克风阵列的声源三维定位子阵算法。根据室内环境噪声分布特点,把阵列分成两个位置不同的子阵,调节子阵的位置,使阵列接收相同的语音信号和不相关的方向噪声,利用两个子阵的互相关矩阵,实现声源定位。该算法能够抑制混响、干扰等非高斯百噪声,提高声源定位系统的性能。仿真结果表明,该算法比声源三维定位MU 2

SI C 算法有更好的定位性能。

关键词:麦克风阵列,近场DOA 估计,子阵算法,子空间方法,语音信号处理中图分类号:T N911.7 文献标识码:A

Research of Speech Source L oca li za ti on s Sub 2array A lgor ith m s

i n Near F i eld Ba sed on M i crophone Arrays

Ju Tailiang

Peng Q icong

Shao Huaiz ong

(University of Electr onic Science and Technol ogy of China,Cheng Du,Si Chuan,610054)

Abstract:The s peech s ource l ocalizati on technol ogy based on m icr ophone array has been extensively app lied t o co mmunicati ons and s peech signal p r ocessing .I n this paper,a near field s peech s ource three 2di m ensi onal (3D )l ocalizati on sub 2array algorithm has been p r oposed by combining the characteristics of m icr ophone array signal p r o 2cessing and subarray methods based on far field narr owband signal .The array is divided int o t w o sub 2arrays accord 2ing t o the noise πs l ocati on .The sub 2array πs l ocati on can be adjusted s o that the s peech signals cap tured by the arrays are the sa me,and the directi onal noises are non 2correlative .The cr oss correlati on matrix about the t w o sub 2arrays can be calculated .The s peech s ource l ocati on is s olved according t o MUSI C or f ocusing methods .This algorith m can restrain non 2Gauss white noise such as reverberati on and interfere etc .,and i m p r ove the perf or mance of the s peech s ource l ocalizati on syste m.Si m ulati on results show the perf or mance of the l ocalizati on is better than three 2di m ensi onalMUSI C of s peech s ource l ocalizati on when this algorithm used .

Keywords:m icr ophone array,DOA esti m ati on in near field,sub 2array algorithm s,subs pace method,s peech signal p r ocessing .

麦克风阵列技术已经广泛用于各种对语音质量

要求较高的语音拾取系统中,如多媒体通信系统、视

频会议系统和自动语音识别系统等领域[1]

。日本的F .A sano 等人提出了一种基于子空间的近场声源

定位算法[2]

,该算法用于办公室智能机器人系统中[3]

,基本上能够实现二维空间近场声源定位问题,但是距离分辨率和准确性均较低。美国的Joe

C .Chen 等人提出了用极大似然估计算法来实现声

源定位[4-6]

,该算法可以对近场和远场的声源进行定位,在单声源系统中定位性能较好,但是对于多生源系统运算量较大,性能较低。基于时延的定位方法在导航系统、声纳系统等领域都有广泛的应用。该方法主要估计各麦克风之间的相对时延,但是这

类算法一般只用于单声源定位系统[7-9]

第5期基于麦克风阵列的近场声源定位子阵算法研究?51 ?

信号源的DOA 估计问题是阵列信号处理研究的基本问题之一,经典的算法有MUSI C 算法、子阵

(sub 2array )算法、极大似然估计算法以及ESPR I T (Esti m ati on Spectru m Rotati onal I nvariance Tech 2nique )算法等

[10]

。然而基于麦克风阵列的DOA 估

计与普通的DOA 估计有很大的区别,其主要的不同点如下:

(1)宽带和窄带[5]的区别:由于语音信号的最高频率和最低频率之比很大,这导致相同的时间延迟却有不同的相位差。经典的阵列处理算法一般要求相位差大致相同,这使得经典算法不能直接用于麦克风阵列处理中。

(2)平稳和非平稳信源的区别[5]:传统的阵列处理的接收信号,一般为平稳或循环平稳信号;而麦克风阵列的接收信号为短时平稳的语音信号。

(3)近场和远场的区别[5]:传统的阵列处理信源一般位于远场,而在麦克风阵列处理中信源可能位于远场也可能位于近场,且在室内环境中信源常常位于近场。在近场情况下,信号到达每个阵元的方向和幅度均不同。因此,近场阵列处理要综合考虑幅度衰减和相位差两个因素。

此外,在室内环境中,由于非高斯噪声和相干噪声等问题,导致近场MUSI C 算法的性能下降[11]

本文结合传统的子阵算法思想,推导出了适用于基

于麦克风阵列的近场声源三维定位子阵算法。

1 麦克风阵列接收信号模型

在室内环境中,声源一般位于近场,此时阵元接收到的信号不仅有相位的差异,幅度差异也十分显著。此时采用球面波前近似,比采用传统的平面波前近似更加精确[11]

。假设系统有D 个声源,R 个无

差异麦克风,则第i 个麦克风在n 时刻接收到的数

据x i (n )为[4]

:

 x i (n )=

D

j =1

αij x 1j

(n

-ij

)+n i (n )+g i (n )(1)

上式中:

—i =1,…,R;表示第i 个麦克风;

—j =1,…,D;表示第j 个信号源;

αij 表示第i 个麦克风接收到第j 个信号的相对幅度衰减因子:αij =‖ r j ‖‖P →

i - r j ‖,α1j =1, r j 为第j 个声源的位置矢量,P →

i 为第i 个麦克风的位

置矢量,‖?‖表示向量的范数(下同)。

—ij 表示第i 个麦克风接收到第j 个信号的相对时间延迟因子:ij =(‖ r j -P →

i ‖-‖ r j ‖

)

c,1j =0,c 是声波波速,在室温时取345m /s;

—n i (n )和g i (n )分别表示第i 个麦克风接收到的噪声和干扰信号。

在每一个麦克风上取L 点数据并进行2N 点FFT 变换,得到信号的频域表示。选择长度合适的L 十分关键,一般选取30毫秒左右的时间片。如果L 较小,将会导致严重的边缘效应;虽然可以用0填充或加窗函数来减小边缘效应,但是这会影响信号和噪声的正交性。当L 足够大时,可以得到很好的频域近似。但是由于语音信号的非平稳性,L 也不可能取得很大。下面的推导均假设选取的数据长度既能够保证信号的平稳性,又能够得到比较准确的频域信号。

x i (k )=

D

j =1

αij e -j 2

πk ij

/N

x 1j (k )+n i (k )+g i (k )

(2)

(2)式中的x 1j (k )为第一个麦克风接收到来自

第j 个信号源的傅立叶变换,n i (k )和g i (k )分别为噪声和干扰的傅立叶变换,k =1,…,N ,表示第k 个频率点。一般情况下,阵列接收信号为实信号,有意义的频率成分为正频率部分,负频率部分为镜像频率。则整个阵列的接收信号为:

X →

(k )=[x 1(k ) … x M (k ) … x R (k )]

T

=

1

…1

α21e

-j <

21…α2D e

-j

<

2D

……αM 1e

-j <

M 1…αMD e

-j <

M d

αR 1e

-j <

R 1…αRD e

-j <

Rd

x 11(k )x 12(k

)

x 1D (k )

+n 1(k )

n M (k )

n R (k )

+g 1(k )

g M (k )

g R (k )(3)

(3)式中

ij

/2N 。

2 基于麦克风阵列的子阵算法

在传统的阵列处理算法中,一般假设噪声为高

?52 ?电子测量与仪器学报2006年

斯白噪声(空间白)。然而在麦克风阵列处理中,噪声情况比较复杂,例如在室内环境下,典型的噪声有空调风机发出的噪声,工作中的计算机发出的噪声,甚至还可能有突然响起的电话铃声、打印机噪声等。这些噪声显然不满足空间白条件。

把R 个麦克风组成麦克风阵列分成两个子阵列:其中M 个麦克风组成子阵1,接收声源发出的信号和部分噪声和干扰信号,其余L 个麦克风组成子阵2,接收声源发出的信号和其它部分噪声和干扰信号(M +L =R,M ≥L >D )。则子阵1和子阵2的接收信号在频域中表示为:

X →

M (k )=[x 1(k ) … x M (k )]

T

=

1

…1

α21e

-j <21…α2D e

-j <

2D

αM 1e

-j <

M 1…αMD e

-j <

M d

x 11(k )x 12(k )

x 1D (k )

+

n 1(k )…

n M (k )

+

g 1(k )

g M (k )

(4)

=A →

M (k )S →

(k )+N →

M (k )

+G →

M (k )

X →

L (k )=[x M +1(k )…x R (k )]

T

=αM +1,1e -j

-j <

M +1d ……

αR 1e

-j <

R 1

αRD e

-j <

Rd

x 11(k )x 12(k )

x 1D (k )

+

n M +1(k )

n R (k )

+

g M +1(k )

g R (k )

(5)

=A →

L (k )S →

(k )+N →

L (k )+G →

L (k )

定义频域相关矩阵R →

(k )为:

R →

(k )=E{X →

M (k )X →H

L (k )}

(6)

为了简化公式,下面各式中把A →

L (k )简记为A →

L ,

S →

(k )简记为S →

,其余的符号均略去频率因子k 。则

相关矩阵R →

(k )为:

R →

(k )=A →

M P →A →H

L +A →

M E{S →

(N →H

L +G →H

L )}+

E{(N →

M +G →

M )S →H

}A →

L +E{N →

M +G →

M )(N →

L +G →

L )H

}

(7)

其中:P →

=E{S →S →H

}为信号的相关矩阵。第(7)式中的第一项为子阵1接收的信号和子阵2接收的信号

的相关;第二项为子阵1接收的信号和子阵2接收的噪声和干扰的相关;第三项为子阵1接收的噪声和干扰和子阵2接收的信号的相关;第四项为子阵1接收的和子阵2接收的噪声和干扰的相关。选择

适当的阵列结构可以使子阵1接收的噪声和干扰与子阵2接收的噪声和干扰不相关,而子阵1或子阵2接收的噪声可以是相关噪声。即以认为(7)式中

的第二、三和四项相对第一项来说很小,忽略不计。则(7)式可以简化为:

R →

(k )=A →

M P →A →H

L

(8)

对(8)式进行奇异值分解并并按照奇异值排序

得:

R →=U →Λ0

V

→H

(9)Λ=d iag [λ1…,λD ,λD +1,…,λL ](10) 其中,λ1…,λD ,λD +1,…,λL 是R (k )的奇异值,

U →,V →

是由对应的奇异向量组成的矩阵。且λ1>2>

…>λL 。把U →

分解为信号子空间S →

和噪声子空间

G →

,根据子空间理论有

[10]

:A →H M G →

=O →,其中O →

为零矢

量。定义空间谱:

P ( r ,k )=1‖ αH

G →

2

(11)

则对部分的频率点的空间谱进行加权平均:

P ( r )=1

N

∑N k =1

w k P (

r ,k )(12)

其中w k 为第k 个频率点的权,根据声源信号的频率特性来选取,为了简化计算也可以直接取w k =

1。利用(12)式在三维空间θ,<,r 进行谱峰搜索即可找到信号源的位置,即:

< r i (r i ,θi ,=m ax

,<>

P ( r ),i =1,…,D (13)

3 仿真与讨论

下面用MAT LAB 仿真来验证前面的算法。仿真环境设定为普通会议室,房间大小为长800厘米,宽600厘米,高300厘米,用I M AGE 方法

[12]

得到每

个麦克风上的接收数据。设定坐标系X 轴与长平行,坐标原点为地面中心正上方80厘米处。声源采用一段标准普通话录音,采样频率为16kHz,每个样本用16bit 的码字表示。子阵1为12个全向麦克风组成的均匀圆环阵,半径为30c m ,均匀分布于XOY

第5期基于麦克风阵列的近场声源定位子阵算法研究?53 ?

平面的的圆周上;子阵2采用6个全向麦克风组成

均匀圆环阵,半径为20c m ,圆心坐标为(0,0,50),与XOY 平面平行,阵列结构如图1所示。

设声源S 的极坐标(r ,θ,<)为(225,45,20)(距离单位为厘米,角度单位为度,下同),用I M AGE

方法得到的坐标原点处的冲激响应如图1所示。设干扰源为高斯信号,位于房间天花板上(模拟空调风机发出的噪声),极坐标(r ,θ,<)为(343,45,52)。设噪声为高斯白噪声(模拟通道和其它噪声)。在仿真中选择距离搜索范围为50~450厘米,分辨率为15厘米;水平角搜索范围为0°~360°,分辨率为5°;俯仰角搜索范围为0°~90°,分辨率也为5°。当信噪比为10DB ,信干比为0DB 时,采用本文提出的算法得到的部分空间谱如图2所示。在图中(1)~(12)分别是距离R =195厘米,210厘米,……,360厘米的平均空间谱图,由于篇幅所限,文中没有列出其余部分的空间谱(下同)。作为对比,选择半径为35厘米,16个麦克风组成均匀的均匀圆阵,圆心位于坐标原点,采用MUSI C 算法得到的部分空间谱如图4所示。从图3和图4中可以看出本文提出的算法抑制了干扰的定位的影响,而传统的算法确无法解决这个问题

图0 

阵列结构示意图

图1 

仿真房间的冲激响应

图2 信干比0DB ,信噪比10db 子阵算法部分仿真结果

4 算法复杂度分析

从上面的讨论可以看出影响本算法计算复杂度的主要步骤为相关矩阵的特征值分解、求各频率点的空间谱矩阵和三维谱峰搜索。其余的步骤如短时

傅立叶变换(用快速傅立叶变换来实现),相关矩阵

以及特征值的排序等消耗的时间对算法的时间复杂度影响不大。M ×M 维复对称矩阵的特征值分解的

时间复杂度为O (M 3

);设N r ,N θ,N <分别为空间搜

索的次数,则求三维空间谱矩阵的时间复杂度约为:

O (N r N θN

?54 ?电子测量与仪器学报2006

图3 信干比0DB ,信噪比10db,16元均匀圆阵3DMUSI C 算法部分仿真图

个,三维谱峰搜索采用遍历的办法,需要的循环次数为:O (N r N θN <);整个算法的时间复杂度约为:Γ(n )=O (P M 3+PN r N θN

=O (PN r N θN

(14)

按照前面仿真中的搜索步长和搜索范围,采用

通用的DSP 芯片完全可以实现声源定位

[13]

(以T MS320C6713为核心的实时系统正在研制中)。

从上面的分析可以看出,在仿真设定的条件下,具有较好的实时性能。但是如果要进一步提高搜索精度,算法复杂度会显著增加。

5 结 论

基于麦克风阵列的声源定位技术目前的研究热点问题之一,可以广泛用于视频会议系统,语音控制系统以及实际环境中的语音识别系统中。本文结合子空间理论提出了近场宽带声源三维定子阵位算法。仿真结果表明:该算法在存在干扰的情况下定位效果优于MUSI C 算法。但是算法的算法复杂度较高,如何在复杂度与性能之间取得折衷,获得实用的算法,将是下一步的研究工作。参考文献:

[1] Si m on Docl o,Multi 2M icr ophone Noise Reducti on And Der 2

everberati on Techniques For S peech App licati ons,Ph .D.dissertati on,

Katholieke Universiteit Leuven Faculteit

T oegepaste W etenschappen Departe ment Elektr otechniek Kasteel park A renberg 10,3001Leuven (Heverlee ),Bel 2

giu m.

[2] F .A sano,H.A s oh,and T .Matsui 1Sound Source Locali 2

zati on and Separati on in Near Field 1I E I CE Trans .Fun 2da mentals 1200,E83A (11):2286-2294.

[3] F .A sano,H.A s oh and T .M atsui,Sound Source Locali 2

zati on and Signal Separati on f or Office Robot “J ij o 22”,Pr oc .MF I π99,243-248.

[4] J.C .Chen,R.E .Huds on,and K .Yao 1M axi m u m 2likeli 2

hood s ource l ocalizati on and unknown sens or l ocati on esti 2mati on for wideband signals in the near 2field 1I EEE Trans .Signal Pr ocessing,2002,50(8):1843-1854.[5] J.C .Chen,K .Yao,and R.E .Huds on 1Source l ocaliza 2

ti on and bea mf or m ing 1I EEE Signal Pr ocessingMagazine 12002,19(2):30-39.

[6] J.C .Chen,Kung Yao,Huds on ,R.E .,Acoustic Source

Localizati on and Bea mf or m ing:Theory and Practice,

E URASI P Journal on App lied Signal Pr ocessing 2003

(4):359-370.

[7] C .H.Knapp,G .C .Carter 1The generalized correlati on

method for esti m ati on of ti m e delay .I EEE Trans .on A 2coustics,Speech and Signal Pr ocessing,1976,24(4):320-327.

[8] D .H.Youn,N.Ah med,G .C .Carter .On using the

LM S algorith m for ti m e delay esti m ati on 1I EEE Trans .on Acoustics,S peech and Signal Pr ocessing,1982,30(5):798-801.

[9] F . A.Reed,P .L.Feintuch,N.J.Bershad .Ti m e delay

esti m ati on using the LMS adap tive filter 2static behavi or 1I EEE Transacti ons on Acoustics 1Speech and Signal Pr o 2cessing 11981,29:561-571.

第5期基于麦克风阵列的近场声源定位子阵算法研究?55 ?

[10] Harry L.Van Trees,op ti m al array p r ocessing,W iley 2

I nter science 11editi on (M arch 22,2002).

[11] Tailiang Ju,Yiliang Xu and Q icong Peng,S peech s ource

l ocalizati on in near field,Co mmunicati ons,Circuits and Syste m s,I CCC AS 2004.2004,2:27-29,769-772.

[12] J.B.A llen,D.A,Berkley 1I m age method for efficiently

si m ulating s mall r oom acoustics 1Journal of Acoustical S ociety of America,1979,b5(4):943-950.

[13] 彭启琮等1DSP 集成开发环境:CCS 及DSP /B I O S 的

原理与应用[M ]1北京:电子工业出版社,2004.

作者简介:

居太亮:男,1974年出生,1997年至

2002年分别在电子科技大学获工学学士

学位和硕士学位。现为电子科技大学通信与信息工程学院TI 2DSP 技术中心博士生。发表论文10余篇。主要研究方向包括通信中的信号处理、语音信号处理、阵列信号处理和实时信号处理等。

泰克公司推出A W G7000任意波形发生器,积极响应客户的速度需求

世界领先的测试、测量和监测仪器供应商泰克

公司(NYSE:TEK )宣布推出泰克新型AW G7000系列任意波形发生器(AW G )。AW G7000是世界上最快的任意波形发生器,专为满足高速串行数据总线和宽频数字射频设备的测试要求而设计。凭借5.8GHz 的带宽,10位分辨率以及高达20GS/s 的取样速率,AW G7000是唯一能够生成高速、真实波形的AW G,包括预加重/去加重以及高达10Gb /s 的多电平信号。AW G7000是适用于高速串行及宽带射频信号的最快、最强大、易用的全能型信号源。

设计工程师研发S AT A III 、PC I Exp ress 2、2x XAU I 、HDM I 1.3、UWB 、最新存储设备以及雷达等新技术时,必须处理大量的数据,同时速度、带宽和频率都有更高的要求,常常涉及最新的高速规范。工程师在设计及测试过程中,可使用AW G 创建、复现、生成理想、失真或“实际环境”信号,包括噪声、抖动、毛刺以及其他非理想信号,这些信号在最新的串行数据或宽频数字射频设计中,有助于建模、调试、验证以及标准一致性测试。

新型数模转换器(DAC)驱动高速A W G

AW G7000基于一个全新的高性能平台,其包含一个新型数模转换器(DAC ),可以获得更高的精度和性能。该转换器采用I B M 7HP 硅锗(SiGe )工艺,可提高垂直分辨率和取样速率,为信号保真度和定时精度确立新的性能标准。实际上,AW G7000能够灵活地创建、复现、生成任何类型的信号,是目前功能最强大的全能型信号发生器。

AW G7000系列的性能高于其他AW G 产品的4倍,其取样速率从上一代产品的4.2GS/s 提高到现在的20GS/s 。AW G7000能够生成高达10Gb /s 的信号,适用于高速串行数据应用,以及采用5GHz 调制数字RF /I F 信号的宽带应用,包括高级雷达技术。AW G7000领先业界的性能组合,完全能够满足新一代高速串行及宽带数字射频技术的测试需要。

“工程研发一直承受着巨大的压力,既要尽快

开发出新产品,同时成本效益要高”,X -COM sys 2

te m s 首席技术官David Eris man 说,“随着系统设计日益复杂、技术更加先进,能够在现实的测试环境中创建精确的信号越来越重要。AW G7000的用户界面和波形开发工具,能够让工程师在开发的早期,方便地生成精确的波形、数据流或混合信号,以便在交付硬件实现之前测试其设计理念。泰克AW G7000出色的高性能、全能型和易用的特性,使其它信号源都无法与之匹敌。AW G7000无疑会大大提高我们为客户开发更多领先产品及解决方案的能力”。

更高的性能和生产效率

泰克用户体验设计师曾对信号源用户的使用模式和需要求进行调查,以此确定AW G7000的性能要求。根据其调查结果,AW G7000配有10.4英寸的LCD 彩色触摸屏和一个采用W indow XP 的直观用户界面,有助于工程师提高效率。

连接功能配置包括GP I B 及千兆以太网。该产品有1或2个模拟通道和2到4个标尺输出,能够生成混合信号波形,用于模拟信号和数字控制信道。AW G7000还能够方便地和第三方软件进行数据交换,包括Mat L ab 、MathCad 和M icr os oft Excel,这些软件常用于创建和生成波形、数据流和混合信号,以协助完成新产品的设计、建模、调试以及一致性测试。

关于泰克公司

泰克公司是世界领先的测试、测量和监测设备产品的供应商,为全球通讯、计算机和半导体行业以及军事/航空、消费电子、教育以及其他工业领域提供各种测量解决方案和技术服务。泰克公司拥有60年丰富的经验,可为用户设计、构建、配置和管理下一代的全球通讯网络和高级技术设备。泰克公司的总部设在俄勒冈州比佛顿,在全球19个国家和地区设有办事机构。

泰克公司的网址是www .tektron i x .co m,泰克的中文网站是www .tektron i x .co https://www.sodocs.net/doc/6f1440654.html, 。

基于MATLAB的声源定位系统

基于MATLAB的声源定位系统摘要 确定一个声源在空间中的位置是一项有广阔应用前景的有趣研究,将来可以广泛的应用于社会生产、生活的各个方面。 声源定位是通过测量物体发出的声音对物体定位,与使用声纳、雷达、无线通讯的定位方法不同,前者信源是普通的声音,是宽带信号,而后者信源是窄带信号。根据声音信号特点,人们提出了不同的声源定位算法,但由于信号质量、噪声和混响的存在,使得现有声源定位算法的定位精度较低。此外,已有的声源定位方法的运算量较大,难以实时处理。 关键词:传声器阵列;声源定位;Matlab

目录 第一章绪论 (1) 第二章声源定位系统的结构 (2) 第三章基于到达时间差的声源定位原理 (3) 第四章串口通信 (5) 第五章实验电路图设计 (8)

第六章总结 (16) 第七章参考文献 (17) 第一章绪论 1.1基于传声器阵列的定位方法简述 在无噪声、无混响的情况下,距离声源很近的高性能、高方向性的单传声器可以获得高质量的声源信号。但是,这要求声源和传声器之间的位置相对固定,如果声源位置改变,就必须人为地移动传声器。若声源在传声器的选择方向之外,则会引入大量的噪声,导致拾取信号的质量下降。而且,当传声器距离声源很远,或者存在一定程度的混响及干扰的情况下,也会使拾取信号的质量严重下降。为了解决单传声器系统的这些局限性,人们提出了用传声器阵列进行声音处理的方法。

传声器阵列是指由一定的几何结构排列而成的若干个传声器组成的阵列。相对于单个传声器而言具有更多优势,它能以电子瞄准的方式从所需要的声源方向提供高质量的声音信号,同时抑制其他的声音和环境噪声,具有很强的空间选择性,无须移动传声器就可对声源信号自动监测、定位和跟踪,如果算法设计精简得当,则系统可实现高速的实时跟踪定位。 传声器阵列的声音信号处理与传统的阵列信号处理主要有以下几种不同: (1)传统的阵列信号处理技术处理的信号一般为平稳或准平稳信号,相关函数可以通过时间相关来准确获得,而传声器阵列要处理的信号通常为短时平稳的声音信号,用时间平均来求得准确的相关函数比较困难。 (2)传统的阵列信号处理一般采用远场模型,而传声器阵列信号处理要根据不同的情况选择远场模型还是使用近场模型。近场模型和远场模型最主要的区别在于是否考虑传声器阵列各阵元因接收信号幅度衰减的不同所带来的影响,对于远场模型,信源到各阵元的距离差与整个传播距离相比非常小,可忽略不计,对于近场模型,信源到各阵元的距离差与整个传播距离相比较大,必须考虑各阵元接收信号的幅度差。 (3)在传统的阵列信号处理中,噪声一般为高斯噪声(包括白、色噪声),与信源无关,在传声器阵列信号处理中噪声既有高斯噪声,也有非高斯噪声,这些噪声可能和信源无关,也可能相关。 由于上述阵列信号处理间的区别,给传声器阵列信号处理带来了极大的挑战。声波在传播过程中要发生幅度衰减,其幅度衰减因子与传播距离成正比,信源到传声器阵列各阵元的距离是不同的,因此声波波前到达各阵元时,幅度也是不同的。 另外,当声音信号在传播时,由于反射、衍射等原因,使到达传声器的声音信号的路径除了直达路径外还存在着多条其它路径,从而产生接收信号的幅度衰减、音质变差等不

近场声源定位算法研究

Word文档可进行编辑 近场声源定位算法研究 近场声源定位算法研究 引言 近年来,基于麦论文联盟克风阵列得声源定位技术快速进展,同时在多媒体系统,移动机器人,视频会议系统等方面有广泛得应用.例如,在军事方面,声源定位技术能够为雷达提供一个非常好得补充,不需要发射信号,仅靠接收信号就能够推断目标得位置,因此,在定位得过程中就可不能受到干扰和攻击.在视频会议中,讲话人跟踪可为主意拾取和摄像机转向操纵提供位置信息,使传播得图像和声音更清楚.声源定位技术因为其诸多优点以及在应用上得广泛前景成为了一个研究热点.

现有得声源定位方法要紧分为三类:基于时延可能得定位方法、基于波束形成得定位方法和基于高分辨率空间谱可能得定位方法.基于时延可能得定位方法[1]要紧步骤是先进行时刻差可能,也确实是先计算声源分不到达两个麦克风得时刻差,然后依照那个时刻差和麦克风阵列得几何结构可能出声源得位置.该类方法得优点是计算量较小,容易实时实现,在单声源定位系统中差不多得到广泛应用.基于波束形成得定位方法[2]不需要直截了当计算时刻差,而是通过对目标函数得优化直截了当实现声源定位.但由于实际得应用环境中,目标函数往往存在多个极值点,因此如何优化复杂峰值得搜索过程就成为了一个重点.基于高分辨率得空间谱可能得声源定位算法,例如宽带得music(multiplesignalclassification)方法[3]和最大似然方法[4],因其能够同时定位多个声源同时具有比较高得空间分辨率,受到了广泛得关注.

空间谱可能得方法源于阵列信号处理,其中得多重信号分类(music)算法在特定条件下具有非常高得可能精度和分辨力,从而吸引了大量得学者对其进行深入得分析与研究.WwwcOm但与阵列信号处理不同得是,在声源定位中,声源在大多数情况下是位于声源近场得.为了解决这一近场咨询题,许多学者针对传统得信号模型提出了改进算法,asano等人将传统时域得music[5,6]算法应用在频域中,提出了一种基于子空间得近场声源算法[7].下面来看一下近场得声源信号模型. 1近场声源信号模型 传统得阵列信号处理大多是基于远场模型得平面波信号得假设,然而在声源定位得实际应用中,有非常多情况是处于声源近场得[8],例如视频会议,机器人仿真等.同时又由于麦克风阵列阵元拾音范围有限,更多得情况下定位也处于近场范围内,如今信源到达各麦克风阵元得信

基于麦克风阵列的声源定位技术

目录 一、绪论 (1) 1.1 课题研究背景和意义 (1) 1.2 国内外研究现状和发展趋势 (2) 1.2.1研究历史和现状 (2) 1.2.2发展趋势 (2) 1.3本文所要研究的内容 (2) 二、麦克风阵列的处理模型和方法介绍 (4) 2.1麦克风阵列信号处理模型 (4) 2.1.1远场模型 (4) 2.1.2远场麦克风阵列均匀线阵模型 (5) 2.2基于时延估计声源定位方法的介绍 (6) 2.2.1广义互相关时延估计法 (6) 2.2.2互功率谱相位时延估计法 (7) 2.2.3基于基音加权的时延估计法 (7) 2.2.4基于声门脉冲激励的时延估计法 (7) 2.2.5 基于LMS 的自适应时延估计法[8] (8) 2.2.6 基于子空间分解的时延估计法 (9) 2.2.7基于声学传递函数比的时延估计法 (9) 三、麦克风声源定位的研究与设计 (11) 3.1广义互相关时延估计设计流程 (11) 3.2 时延估计定位算法实验研究 (12) 3.3互相关延时估计方法 (12) 3.4互相关延时估计加权函数性能分析 (15) 3.5声源定位的模型分析 (16) 3.6时延估计的测量与计算 (17) 四、总结 (20) 4.1 本文研究的问题与难点 (20) 4. 2课题研究总结 (20) 参考文献 (22) 致谢 (24) 摘要 随着科技的进步和发展,麦克风阵列的声源定位技术已经成为人们研究的重要课题之一。用麦克风阵列接受语音信号就是声源定位技术的一种,接受到的语音技术再输出到计算机,经过计算机技术的分析和处理,然后可以确定声源是从

哪个方位传过来的。声源定位技术的广泛应用在许多领域,如定位技术,在军事上的语音识别,视频会议的定位技术。麦克风阵列对于噪声、声源定位、跟踪这些方面都比单个麦克风要好,从而大大提高语音信号处理质量。 本文主要是用麦克风阵和时延估计声源定位方法对于声源的定位。首先介绍了几种常见的声源定位方法和各自的优缺点,在此基础上研究基于时延估计的声源定位方法(GCC),比较远场定位和近场定位的差别,确定本文研究的方法远场定位法。由于远场定位时,只需要测出声音信号到达各个麦克风阵列的时延(TDOA),剩下的就是简单的数学公式推导。由于该方法计算量小,易于实现的优点,实际应用比较广泛。 关键词:麦克风阵列,声源定位,时延估计,GCC

一种改进的AEDA声源定位及跟踪算法

北京大学学报(自然科学版),第41卷,第5期,2005年9月 Acta Scientiarum Naturalium Universitatis Pekinensis,V ol.41,N o.5(Sept.2005) 一种改进的AEDA声源定位及跟踪算法1) 李承智 曲天书2) 吴玺宏 (北京大学视觉与听觉信息处理国家重点实验室,北京,100871;2)E2mail:qutianshu@https://www.sodocs.net/doc/6f1440654.html,) 摘 要 开展了基于麦克风阵列的真实声场环境声源定位的工作。针对传统的自适应特征值分 解时延估计算法收敛时间慢、对初值敏感以及不能有效跟踪时延变化等问题,提出了一种改进的 自适应特征值分解时延估计算法,该方法通过改进初值设定方法,有效改善了对时延变化的估计。 另外,通过引入一个基于相关运算的语音检测算法,提高了定位系统的抗噪声能力。实验表明在 真实的声场环境下该算法能够对单个声源的三维空间位置进行实时的定位和跟踪,系统在115m 范围内对声源的定位误差小于8cm,声源位置变化时,系统也能准确跟踪声源的位置。 关键词 麦克风阵列;声源定位;声源跟踪;AE DA算法;LMS算法 中图分类号 TP391 0 引 言 基于麦克风阵列的声源定位是声学信号处理领域中的一个重要问题,在视频会议、智能机器人、鲁棒语音识别等领域有着广泛的应用。近年来,在真实声场环境下抗混响的声源定位算法研究成为研究热点。 声源定位大致分为3类方法。第1类是基于波束成型的方法,该方法可以对单声源进行定位[1,2],也可以对多声源进行定位[3],但存在对初值敏感的问题。另外还需要知道声源和噪声的先验知识,该方法存在计算量大,不利于实时处理等缺点。第2类是基于高分辨率谱估计的方法。该方法在理论上可以对声源的方向进行有效的估计,并且适用于多个声源的情况[4]。但由于该算法是针对窄带信号,因此如要获得较理想的精度就要付出很大的计算量代价。另外这些算法无法处理高度相关的信号,因此混响会给算法的定位精度带来较大影响。第3类方法是基于时延估计的方法。该类算法计算量小,易于实时实现,近年来得到了高度重视。 基于时延估计的算法分为2个部分。第1部分为时延估计,即计算声源到两两麦克风之间的时间差;第2部分为方位估计,即根据时延和麦克风阵列的几何位置估计出声源的位置,其中时延估计最为关键。互相关法是最常用的一种时延估计算法,但是它在混响较大的情况下性能下降很多。1982年,D1H.Y oun等[5]提出了最小均方(LMS,Least Mean Square)时延估计算法,其性能和互相关法基本相当。布朗大学于1995年实现了一个实时声源定位系统[6],该系统采用相位变换的时延估计算法和线性插值方位估计算法,在混响较小的情况下能够准确的估计时延但在混响较大情况下误差较大。1997年新泽西州立大学采用相位变换法作为时  1)国家自然科学基金(60305004)中国博士后科学基金(2003033081)资助项目 收稿日期:2004208223;修回日期:2004211211 908

天线阵列在定位中的应用

天线阵列在定位中的应用 12307130317 第五强强12307130103 李熠辉 2012级电子信息科学与技术 摘要:天线作为将高频电流信号转换成电磁波能量并且按要求辐射出去的装置,其特性与光源有相似之处,类比于相干光源的干涉现象,相同激励的天线阵列也会有干涉现象。 通过测量电磁场中某一点的波程差,可以确定采样点和场源之间的位置关系,以此为依据可以将天线阵列应用于定位中。本文从天线阵列产生的电磁场特性出发,研究场中一点电磁量与其位置关系的依赖关系,依此提出一种将天线阵列用于定位的方法,最后利用MA TLAB进行仿真说明。 关键词:天线阵列定位MATLAB Abstract:As a device which can convert high-frequency current signal into electromagnetic wave energy and radiate out it as required, Antenna is similar to the light source in plenty of ways. Compared with the interference of coherent light source, antenna arrays also have the same phenomenon. By measuring the wave path-difference of a point in the electromagnetic field, the positional relationship can be detected, between the sampling point and field source. Therefore the antenna arrays can be applied to locating. To begin with the characteristics of electromagnetic field that generated by the antenna arrays, this paper studies the dependence relationship between the electromagnetic calorimeter and position of a point in the field, and proposes a method for locating by an antenna array. The use of MA TLAB simulation is described in the end. Keyword:antenna arrays, locating, MA TLAB 引言 定位技术一直是机器人和自动化领域中至关重要的一部分,只有获取目标的绝对位置后才能做出对应的操作与控制。在室外环境中,多使用卫星定位技术和基于通讯基站的定位技术,而在室内环境中,利用红外、蓝牙、无线局域网、射频ID等方式的定位技术也在研究与完善过程中,在控制和通信方面已经有了较为成熟的应用。 本文提出了一种基于天线阵列的定位技术,通过测量天线阵列激发的场中一点的电场强度,得到天线阵元辐射的波程差,从而确定该点相对天线阵列的位置,实现定位的功能。 - 1 -

在声源定位地算法中,系统提供了四种算法,它们是:

在声源定位的算法中,系统提供了四种算法,它们是: 1.归一(化)正方形(阵)[1], 2.平面正方形[1], 3.任意三角形[1], 4.修正三角形算法[2]。 【1】归一正方形算法 如图,传感器阵列采用正方形,传感器的位置坐标为(L,L),(-L,L),(-L,-L),(L,-L)。则声源位置(x,y)可由下式算出(式中2L为正方阵的边长,Δt1,Δt2,Δt3分别为传感器2,3,4相对于1的时差,c是传播速度):

【2】平面正方形算法 如图,正方形排列由x和y轴的传感器对组成,位置坐标为S0=(0,L), S1= (-L,0), S2= (0,-L), S3= (L,0);2L是传感器对的距离。这时声源位置(x,y)可由下式算出(C是传播速度):

【3】任意平面三角形算法如图,设传感器阵列的坐标分别为S0=(X0,Y0)=(0,0),S1=(X1,Y1),S2=(X2,Y2)。接收到的时差分别是0,Δt1,Δt2。声源位于(X,Y)或(r,θ),分别是直角或极坐标表示。声波的传播速度是C。 令Δ1=CΔt1,Δ2=CΔt2, A=X2(X12+Y12-Δ12)-X1(X22+Y22-Δ22), B=Y2(X12+Y12-Δ12)-Y1(X22+Y22-Δ22), D=Δ1(X22+Y22-Δ22)-Δ2(X12+Y12-Δ12), Φ=tg-1B/A, 这时声源位置可由极坐标(r,θ)的形式给出:

【4】修正三角形算法 以任意三角形算法为基础,增加一个传感器S3=(X3,Y3),并设测得的时差为Δt3。在【3】中传播速度C是给定的。现给C一个变化范围(C-ΔC,C+ΔC),且给定速度步长δ。这样,每种速度C+nδ(n=±1,±2,…),均可由三角形算法得到一个声源位置(xn,yn),在这些侯选位置中,真实声源应当满足: 由此,不仅可以确定最佳的声源位置,而且可以获得信号的传播速度解。

阵列光纤定位方法及检测

阵列光纤定位方法及检测 积分视场光谱分析已经成为现代天文物理观测的一项重要技术,通过对采样到的天文光谱进行分析,可以得到关于天体各种特性的丰富信息。积分视场单元(IFU)作为天体三维观测技术的重要器件,能够得到二维焦平面上的三维光谱信息,并且可以同时进行图像采集和光谱采集。目前比较常见的IFU结构为微透镜阵列加阵列光纤的组合,阵列光纤作为IFU上的光传输媒介,直接关系到其性能表现的好坏。因此对阵列光纤进行加工处理以及性能测评是IFU制作工艺中不可或缺的几个重要环节。 本文围绕如何在不影响阵列光纤性能的情况下,将其精准定位。并对定位完毕的光纤进行定位精准度和光纤性能的检测。本文以阶跃型多模光纤传输光波导理论为前提,通过对IFU模型进行分析,并结合焦比退化理论,阐述了与光纤出射光斑相关的几个参数。从而为阵列光纤定位加工提出了要求和目标,并提供了理论依据。 针对阵列光纤需要在IFU微透镜端和赝狭缝端两端进行加工,分别讨论了其加工方式。在微透镜端选取了微孔板排列法。在赝狭缝端选取了石英V槽定位方法,提出了光纤错位双排狭缝的排列方式,并对定位好的光纤进行了整体抛磨。然后对准并粘合了石英微孔基板和微透镜阵列。 成功完成了对阵列光纤的精准定位。对光纤效率、光纤整体焦比进行了检测。在未装上微透镜阵列之前,光纤整体效率在86%91%之间,其有效值(用均方根RMS计算得出)为88.7%,达到了望远镜正常工作的指标;在安装上微透镜阵列之后,其出射效率有效值下降了2.7%,但考虑到微透镜反向打光会增大光纤出射角度降低效率,其性能也足以达到正常工作的标准;用光斑标线法测得两个赝狭缝端的出射焦比F/#out1=7.32、 F/#out2=7.23,线性度均为R2=0.999;用光斑图像整体处理法测得2号赝狭缝端出射焦比F/#out2=6.94,线性度为 R2=0.997。两种方法测量结果均显示IFU出射焦比退化能够达到正常工作需求。 对光纤排列精度进行了检测,用CCD拍出光纤整体图像再利用图像处理的方法计算出每个光纤的坐标,并用均方根(RMS)代表光斑偏移量的有效值。实验测

基于麦克风阵列的声源定位技术毕业设计

毕业设计说明书基于麦克风阵列的声源定位技术 学生姓名:学号: 学院: 专业: 指导教师: 2012年 6 月

基于麦克风阵列的声源定位技术 摘要 声源定位技术是利用麦克风拾取语音信号,并用数字信号处理技术对其进行分析和处理,继而确定和跟踪声源的空间位置。声源定位技术在视频会议、语音识别和说话人识别、目标定位和助听装置等领域有着重要的应用。传统的单个麦克风的拾音范围很有限,拾取信号的质量不高,继而提出了用麦克风阵列进行语音处理的方法,它可以以电子瞄准的方式对准声源而不需要人为的移动麦克风,弥补单个麦克风在噪声处理和声源定位等方面的不足,麦克风阵列还具有去噪、声源定位和跟踪等功能,从而大大提高语音信号处理质量。 本文主要对基于多麦克风阵列的声源定位技术领域中的基于时延的定位理论进行了研究,在此基础上研究了四元阵列、五元阵列以及多元阵列的定位算法,并且分别对其定位精度进行了分析,推导出了影响四元、五元阵列目标方位角、俯仰角及目标距离的定位精度的一些因素及相关定位方程,并通过matlab仿真软件对其定位精度进行了仿真;最后在四元、五元阵列的基础上,采用最小二乘法对多元阵列定位进行了计算;通过目标计算值和设定值对比,对多元阵列的定位精度进行了分析,并得出了多元阵列的目标定位的均方根误差。 关键词:麦克风阵列,声源定位,时延,定位精度,均方根误差

Based on Microphone Array for Sound Source Localization Research Abstract Sound source positioning technology is to use the microphone to pick up voice signals, and digital signal processing technology used for their analysis and processing , Then identify and track the spatial location of sound source. Acoustic source localization techniques have a variety of important uses in videoconferencing, speech recognition and speaker identification, targets’ direction finding, and biomedical devices for the hearing impaired. The pick up range of traditional single microphone is limited, the signal quality picked up is not high, then a voice processing methods with the microphone array has been proposed . It may be electronically aimed to provide a high-quality signal from desired source localization and doe s not require physical movement to alter these microphones’ direction of reception. Microphone array has the functions of de-noising, sound source localization and tracking functions, which greatly improved the quality of voice signal processing. The article discusses some issues of sound source localization based on microphone array, On the basis ,it studies a four element array,five element array and an multiple array positioning algorithm, then the positioning precision is analyzed. Derived some factors of the azimuth and elevation angle targets the target range of the estimation precision affected and positioning equation. And through MATLAB simulation software for its positioning accuracy of simulation. finally ,based on four yuan, five yuan of array, using the least square method ,the multiple array localization were calculated. Through the contrast of the target value and set value, multiple array positioning accuracy is analyzed, and the of diverse array target positioning. Keywords: Microphone Array, Sound Source Localization, Time Delay, Positioning precision, root mean square error

机器人的声源定位——基于NAO机器人

Abstract One of the main purposes of having a humanoid robot is to have it interact with people. This is undoubtedly a tough task that implies a fair amount of features. Being able to understand what is being said and to answer accordingly is certainly critical but in many situations, these tasks will require that the robot is first in the appropriate position to make the most out of its sensors and to let the considered person know that the robot is actually listening/talking to him by orienting the head in the relevant direction. The “Sound Localization” feature addresses this issue by identifying the direction of any “loud enough” sound heard by NAO.Related work Sound source localization has long been investigated and a large number of approaches have been proposed. These methods are based on the same basic principles but perform differently and require varying CPU loads. To produce robust and useful outputs while meeting the CPU and memory requirements of our robot, the NAO’s sound source localization feature is based on an approach known as “Time Difference of Arrival”. Principles The sound wave emitted by a source close to NAO is received at slightly different times on each of its four microphones. For example, if someone talks to the robot on his left side, the corresponding signal will first hit the left microphones, few milli-seconds later the front and the rear ones and finally the signal will be sensed on the right microphone (FIGURE 1). These differences, known as ITD standing for “interaural time differences”, can then be mathematically related to the current location of the emitting source. By solving this equation every time a noise is heard the robot is eventually able to retrieve the direction of the emitting source (azimutal and elevation angles) from ITDs measured on the 4 microphones. FIGURE 1Schematic view of the dependency between the position of the sound source (a human in this example) and the different distances that the sound wave need to travel to reach the four NAO’s micro-phones. These different distances induce times differences of arrival that are measured and used to compute the current position of the source. KEY FEATURE SOUND SOURCE LOCALIZATION

声源定位系统毕业设计(论文)

0 前言 声音是我们所获取的外界信息中非常重要的一种。不同物体往往发出自己特有的声音,而根据物体发出的声音,人们可以判断出物体相对于自己的方位。有些应用场合,人们需要用机器来完成声音定位这个功能,并且往往要求定位精度比较高。2003年的美伊战争期间,人民网、CCTV网站的军事频道、国防在线等网站均报道了装配于美军的狙击手探测技术,这项技术其中一部分就包含了声源定位技术。 声源定位作为一种传统的侦察手段,近年来通过采用新技术,提高了性能,满足了现代化的需要,其主要特点是: 1)不受通视条件限制。可见光、激光和无线电侦察器材需要通视目标,在侦察器材和目标之间不能有遮蔽物,而声测系统可以侦察遮蔽物(如山,树林等)后面的声源。 2)隐蔽性强。声测系统不受电磁波干扰也不会被无线电侧向及定位,工作隐蔽性较强。 3)不受能见度限制。其他侦察器材受环境气候影响较大,在恶劣气候条件下工作时性能下降,甚至无法工作。声测系统可以在夜间、阴天、雾天、和下雪天工作,具有全天候工作的特点。 以下对美军装备的报道来自于《“巴格达之战”考验英军巷战武器装备》一文,该文刊登于2003年4月8日国防在线美伊战争专题。“狙击手声测定位系统通过接收并测量膛口激波和弹丸飞行产生的冲击波来确定狙击手的位置,通常仅能探测超音速弹丸。这种系统有单兵佩挂型、固定设置型和机动平台运载型。美国BBN系统和技术公司的声测系统,通过测量弹丸飞行中的声激波特性来探测弹丸并进行分类。该系统为固定设置型,采用2个置于保护区两侧的传声器阵列或6个分布在保护区内的单向传声器。传声器通过电缆或射频链路与指挥节点相连。为了准确定位,需事先确定传声器的距离,精度要在1米以内。该系统可探测到90%的射击,定位精度为方位1.2°、水平3°。此外,美国的“哨兵”和“安全”有效控制城区环境安全系统均是采用声测定位技术的反狙击手系统。

声源定位

声源定位(李子文) #include #include using namespace std; #define c 2982 #define R int main() { double x0,x1,x2,y0,y1,y2,t0,t1,t2,a,b,d,lizard1,lizard2,dt1,dt2,r; x0=0,x1=0,x2=; y0=0,y1=,y2=; int i = 8; while(i--) { cout <<"请输入第"<<8-i<<"组时间数据"<< endl; cin >> t0 >> t1 >> t2; t0 = t0 / 1000000; t1 = t1 / 1000000; t2 = t2 / 1000000; dt1 = t0 - t2; dt2 = t1 - t2; a=x2*(pow(x1,2)+pow(y1,2)-pow(c*dt1,2)) - x1*(pow(x2,2)+pow(y2,2)-pow(c*dt2,2)); b=y2*(pow(x1,2)+pow(y1,2)-pow(c*dt1,2))- y1*(pow(x2,2)+pow(y2,2)-pow(c*dt2,2)); d=c*dt1*(pow(x2,2)+pow(y2,2)-pow(c*dt2,2))-c*dt2*(pow(x1,2)+pow(y1,2)-pow(c*dt1,2));

lizard2 = atan(b/a); if(acos(d/sqrt(pow(a,2)+pow(b,2)))+lizard2 < R/2) lizard1 = acos(d/sqrt(pow(a,2)+pow(b,2)))+lizard2; else lizard1 = lizard2 - acos(d/sqrt(pow(a,2)+pow(b,2))); r = (pow(x1,2)+pow(y1,2)-pow(c*dt1,2))/(2*(x1*cos(lizard1)+y1*sin(lizard1)+c*dt1)); cout << "声源坐标为:("<

声源定位源程序

#include #include #define c 0.002982 #define PI 3.14159 double main() { double tz[10],to[10],tt[10]; double x0=0,x1=0,x2=0.3,y0=0,y1=0.45,y2=0.45; double A,B,D,t1,t2,a1,a2,r,x,y; inti; for (i=0;i<10;i++) { printf("please enter the time of group %d\n",i+1); scanf ("%lf %lf %lf",&tz[i],&to[i],&tt[i]); t1=to[i]-tz[i]; t2=tt[i]-tz[i]; A=x2*(pow(x1,2)+pow(y1,2)-pow(c*t1,2))-x1*(pow(x2,2)+po w(y2,2)-pow(c*t2,2)); B=y2*(pow(x1,2)+pow(y1,2)-pow(c*t1,2))-y1*(pow(x2,2)+po w(y2,2)-pow(c*t2,2));

D=c*t1*(pow(x2,2)+pow(y2,2)-pow(c*t2,2))-c*t2*(pow(x1,2 )+pow(y1,2)-pow(c*t1,2)); a2=atan(B/A); if((acos(D/sqrt(pow(A,2)+pow(B,2)))+a2)

用HRTF进行虚拟声源定位实验

用HRTF进行虚拟声源定位实验 杨飞然, 葛延增, 吴镇扬 (东南大学信息科学与工程学院,南京 210096) 摘要:介绍了传统的音频定位理论及存在的缺陷,引出了HRTF的定义,分析了HRTF包含的方位信息,并用我们开发的虚拟听觉空间系统Vasaudio对虚拟声源定位进行了实际测试,最后对测试结果做了分析。 关键词:HRTF;ITD;IID;虚拟声源定位 Virtual Sound Source Position of HRTF Yang Fei Ran, Ge Yan Zeng, Wu Zhen Yang (Department of of Information Science and Engineering, Southeast University, Nanjing 210096) Abstract: We introduce the traditional theory of audio position and its limitations first , then we give the definition of HRTF,analyse the position information in HRTF,we also do experiment using Vasaudio system, at last we make a analysis of the experiment result. key words: HRTF; ITD; IID; virtual sound source position 我们日常听到的立体声录音,虽然有左右声道之 分,但就整体效果而言,立体声音乐来自听者面前的某个平面。但希望的是一个在虚拟环境中能辨别声源精确位置的声音系统,而当您听到三维虚拟声音时,音乐声是来自围绕您的一个球形中的任何地方,即声音出现在您头的上方、后方或者在您的鼻子前方。我们把在虚拟场景中的能使用户准确地判断出声源精确位置、符合人们在真实境界中听觉方式的声音系统称为三维虚拟声音。 基金项目:国家973计划资助项目(2002CB312102) 作者简介:杨飞然,1982年,男,硕士研究生,afeizaixian@https://www.sodocs.net/doc/6f1440654.html,;葛延增,1982年,男,硕士研究生;吴镇扬(联系人),男,教授,博士生导师,zhenyang@https://www.sodocs.net/doc/6f1440654.html, 。1 传统音频定位理论 耳间时间差(ITD):从声源发出的声音到达人的左耳和右耳时,有一个先后的过程,这段时间差就是耳间时间差。耳间时间差与声音信号的频率有关,是声源角位置 ,头部半径r和声速c的函数,在人类听觉定位中占有重要位置。 耳间强度差(IID):由于声音的传播媒质对声波的衰减作用,声音的强度随距离而变化,再加上耳廓和头部的遮挡,最终到达两耳的声音所经过的路径是不同的,使得距离声源近的耳朵听到的声音要强一些,这就是耳间强度差。 在中、低频(f<1.6 kHz),ITD是定位的主要因素;在中频段(f在1.5-4.0 kHz), ITD和IID共同起作

LMS声源定位技术_All

LMS声源定位技术
Dr. Wei Chen, LMS China, Shanghai office 1 LMS Sound Source Localization Techniques

Sound sources localization
1 2
技术介绍
产品介绍
3
应用实例
4
发展方向
2 LMS Sound Source Localization Techniques

Challenges
To locate a maximum number of sound sources : To have the best spatial resolution to separate the sources To quantify each source power (sufficient dynamic range) To minimize the cost of measurements : In time In material Cover a wide range of applications
3 LMS Sound Source Localization Techniques

Sound Source Localization Techniques at LMS
Acoustic Intensity 声强 Beam-Forming 波束成形 Near Field Focalization 近场聚焦 Acoustic Holography 声全息 Airborne Source Quantification 传递路径分析 3D 3D Result
Sound Source Result
3D 2D Result
3D 3D Result
3D 3D Result
3D 3D Result
Distance to source
Not determined
Far > 0.5 m
Near < λ
Ideal < λ
Not relevant
Measurement Result
Intensity
Pressure
Intensity
Sound Power, Intensity, Velocity
Source Strength
Environment
Far-field (ISO 9614)
Free Field
Free Field Near Field
Free Field Near Field
Operational Field
Spatial Resolution
Low
Low
High
High
High
What if Games
No
No
No
Yes No for Pass-by
Yes
Stationary
Stationary/ Transient
Stationary/ Transient
Stationary/ Transient
Stationary/ Transient
4 LMS Sound Source Localization Techniques

相关主题