搜档网
当前位置:搜档网 › 智能语音系统及其语音处理方法与相关技术

智能语音系统及其语音处理方法与相关技术

智能语音系统及其语音处理方法与相关技术
智能语音系统及其语音处理方法与相关技术

本技术提出一种智能语音系统及其语音处理方法,包括蓝牙终端和智能设备;蓝牙终端包括麦克风阵列、语音预处理装置、第一传输装置、回放装置;智能设备包括第二传输装置和智能处理器;语音预处理装置包括存储装置和编码装置,编码装置和麦克风阵列相连,用于对麦克风阵列获取的第一音频信号进行编码,并将第一音频信号通过编码装置进行编码后存储在存储装置中,并当HFP通信连接建立后通过第一HFP通信装置将存储装置中的第一音频信号发送给第二HFP通信装置。可以让系统在手机服务切换的同时将语音唤醒信息和上传信息进行保存,这样仍然可以在切换服务的时候,获取到流畅的交互体验。

技术要求

1.一种智能语音系统,其特征在于,包括蓝牙终端和智能设备;所述蓝牙终端包括麦克风阵列、语音预处理装置、第一传输装置、回放装置;所述智能设备包括第二传输装置和智能处理器;所述第一传输装置包括第一HFP通信装置和第一A2DP通信装置,所述第二传输装置包括第二HFP通信装置和第二A2DP通信装置;所述语音预处理装置包括存储装置和编码装置,所述编码装置和所述麦克风阵列相连,用于对所述麦克风阵列获取的第一音频信号进行编码,并将所述第一音频信号通过编码装置进行编码后存储在所述存储装置中,并当HFP通信连接建立后通过所述第一HFP通信装置将所述存储装置中的第一音频信号发送给所述第二HFP通信装置;所述回放装置与所述第一A2DP通信装置相连,用于通过所述第一A2DP通信装置接收所述第二A2DP通信装置发送的第二音频信号。

2.根据权利要求1所述的智能语音系统,其特征在于,所述编码装置进一步包括PCM编码装置和音频编码装置,所述PCM编码装置用于对所述麦克风阵列获取的第一音频信号进行PCM编码后存储在所述存储装置中,当第一HFP通信装置与第二HFP通信装置建立连接后,所述音频编码装置将所述第一音频信号的PCM编码进一步进行音频编码并通过第一HFP通信装置传输到第二HFP通信装置。

3.根据权利要求1所述的智能语音系统,其特征在于,所述编码装置进一步包括音频编码装置,所述音频编码装置用于对所述麦克风阵列获取的第一音频信号进行音频编码后存储在所述存储装置中,当第一HFP通信装置与第二HFP通信装置建立连接后,将所述进行音频编码的第一音频信号通过第一HFP通信装置传输到第二HFP通信装置。

4.根据权利要求1所述的智能语音系统,其特征在于,所述智能语音系统进一步包括语音云服务器,所述语音云服务器与所述智能设备进行远程通信并获取智能设备发送的所述第一音频信号,用于对所述第一音频信号进行处理。

5.根据权利要求4所述的智能语音系统,其特征在于,所述语音云服务器和所述智能设备之间通过无线网络进行数据传输。

6.根据权利要求1~5任一所述的智能语音系统,其特征在于,所述麦克风阵列为模拟麦克风阵列或数字麦克风阵列,所述麦克风阵列包括1~8个麦克风。

7.根据权利要求1~5任一所述的智能语音系统,其特征在于,所述智能设备为智能手机、平板电脑、智能电视或智能机顶盒。

8.根据权利要求1~5任一所述的智能语音系统,其特征在于,所述语音预处理装置进一步包括:

唤醒装置,与所述麦克风阵列连接,用于唤醒所述语音预处理装置和第一传输装置;

降噪装置,连接在所述麦克风阵列和所述第一传输装置之间,用于对采集到的所述音频信号进行降噪处理;

波束形成装置,与所述麦克风阵列连接,用于加强特定方向的语音采集;

回声消除装置,连接在所述降噪装置和所述第一传输装置之间,用于对采集到的所述音频信号进行回声消除处理。

9.根据权利要求1~5任一所述的智能语音系统,其特征在于,所述智能设备进一步包括:

唤醒装置,用于唤醒所述语音预处理装置和第一传输装置;

降噪装置,用于对采集到的所述音频信号进行降噪处理;

波束形成装置,用于加强特定方向的语音采集。

10.一种用于智能语音系统中的语音处理方法,其特征在于,包括如下步骤:

(1)麦克风阵列获取第一音频信号并发送给语音预处理装置;

(2)所述语音预处理装置对所述第一音频信号进行编码后将所述第一音频信号存储在所述存储装置中;

(3)当HFP通信连接建立后通过所述第一HFP通信装置将所述存储装置中的第一音频信号发送给所述第二HFP通信装置;

(4)智能设备对所述第一音频信号处理后返回控制信号到所述语音预处理装置。

11.根据权利要求10所述的语音处理方法,其特征在于,所述步骤进一步包括:

(201)对所述麦克风阵列获取的第一音频信号进行PCM编码后存储在存储装置中;

(202)当第一HFP通信装置与第二HFP通信装置建立连接后,将所述第一音频信号的PCM编码进一步进行音频编码;

(203)将所述进行音频编码的第一音频信号通过第一HFP通信装置传输到第二HFP通信装置。

12.根据权利要求10所述的语音处理方法,其特征在于,所述步骤进一步包括:(204)对所述麦克风阵列获取的第一音频信号进行音频编码后存储在所述存储装置中;

(205)当第一HFP通信装置与第二HFP通信装置建立连接后,将所述进行音频编码的第一音频信号通过第一HFP通信装置传输到第二HFP通信装置。

技术说明书

一种智能语音系统及其语音处理方法

技术领域

本技术涉及多媒体技术领域,尤其涉及一种智能语音系统及其语音处理方法。

背景技术

随着语音人机交互界面的出现,越来越多的产品需要智能语音的交互。目前市场上的智能语音交互产品都是基于wifi的产品,但wifi功耗大,便携性不好。而且智能手机的发展已经在形成了一个便携式的计算中心。所以依托蓝牙技术实现便携性的智能语音交互产品会是一个重要的发展趋势。而传统蓝牙和手机之前传语音采用的是经典蓝牙的方式,会存在手机经典蓝牙模式频繁切换的问题,导致体验不佳。

经典蓝牙的音频传输是通过HFP(Hands-free Profile,免提配置文件),和A2DP(Advanced Audio Distribution Profile,蓝牙音频传输模型协定)两种蓝牙profile实现。HFP用在打电话场景,其特点是实时双向语音通信,而ad2p是用在听立体声音乐场景,其特点是单向音频推送。这两种蓝牙的音频通信占用了经典蓝牙的通道,而且在目前的实现中是根据场景相互切换的。所以目前有蓝牙音频产品的语音需求是通过将模式从听歌的a2dp场景切换到hfp的场景进行语音数据采集,这样会有两个问题,1,建立新的系统链接需要时间,需要等待接近2秒时间,体验很差。2,采集语音的数据需要在发出采集指令后立即进行采集和传输,旧有的模式切换方式会导致前面的数据丢失。

亟待一种新的语音处理技术解决现有技术的缺陷。

技术内容

基于以上问题,本技术提出一种智能语音系统,可以让系统在手机服务切换的同时将语音唤醒信息和上传信息进行保存,这样仍然可以在切换服务的时候,获取到流畅的交互体验。

本技术实施例是这样实现的,一种智能语音系统,包括蓝牙终端和智能设备;所述蓝牙终端包括麦克风阵列、语音预处理装置、第一传输装置、回放装置;所述智能设备包括第二传输装置和智能处理器;所述第一传输装置包括第一HFP通信装置和第一A2DP通信装置,所述第二传输装置包括第二HFP通信装置和第二A2DP通信装置;所述语音预处理装置包括存储装置和编码装置,所述编码装置和所述麦克风阵列相连,用于对所述麦克风阵列获取的第一音频信号进行编码,并将所述第一音频信号通过编码装置进行编码后存储在所述存储装置中,并当HFP通信连接建立后通过所述第一HFP通信装置将所述存储装置中的第一音频信号发送给所述第二HFP通信装置;所述回放装置与所述第一A2DP通信装置相连,用于通过所述第一A2DP通信装置接收所述第二A2DP通信装置发送的第二音频信号。

进一步地,所述编码装置进一步包括PCM编码装置和音频编码装置,所述PCM编码装置用于对所述麦克风阵列获取的第一音频信号进行PCM编码后存储在所述存储装置中,当第一HFP通信装置与第二HFP通信装置建立连接后,所述音频编码装置将所述第一音频信号的PCM编码进一步进行音频编码并通过第一HFP通信装置传输到第二HFP通信装置。

进一步地,所述编码装置进一步包括音频编码装置,所述音频编码装置用于对所述麦克风阵列获取的第一音频信号进行音频编码后存储在所述存储装置中,当第一HFP通信装置与第二HFP通信装置建立连接后,将所述进行音频编码的第一音频信号通过第一HFP通信装置传输到第二HFP通信装置。

进一步地,所述智能语音系统进一步包括语音云服务器,所述语音云服务器与所述智能设备进行远程通信并获取智能设备发送的所述第一音频信号,用于对所述第一音频信号进行处理。

进一步地,所述语音云服务器和所述智能设备之间通过无线网络进行数据传输。

进一步地,所述麦克风阵列为模拟麦克风阵列或数字麦克风阵列,所述麦克风阵列包括1~8个麦克风。

进一步地,所述智能设备为智能手机、平板电脑、智能电视或智能机顶盒。

进一步地,所述语音预处理装置进一步包括:

唤醒装置,与所述麦克风阵列连接,用于唤醒所述语音预处理装置和第一传输装置;

降噪装置,连接在所述麦克风阵列和所述第一传输装置之间,用于对采集到的所述音频信号进行降噪处理;

波束形成装置,与所述麦克风阵列连接,用于加强特定方向的语音采集;

回声消除装置,连接在所述降噪装置和所述第一传输装置之间,用于对采集到的所述音频信号进行回声消除处理。

进一步地,所述智能设备进一步包括:

唤醒装置,用于唤醒所述语音预处理装置和第一传输装置;

降噪装置,用于对采集到的所述音频信号进行降噪处理;

波束形成装置,用于加强特定方向的语音采集。

根据本技术实施例的另一方面,本技术还提供一种用于智能语音系统中的语音处理方法,可以让系统在手机服务切换的同时将语音唤醒信息和上传信息进行保存,这样仍然可以在切换服务的时候,获取到流畅的交互体验。

本技术实施例是这样实现的,一种用于智能语音系统中的语音处理方法,包括如下步骤:

(1)麦克风阵列获取第一音频信号并发送给语音预处理装置;(2)所述语音预处理装置对所述第一音频信号进行编码后将所述第一音频信号存储在所述存储装置中;(3)当HFP通信连接建立后通过所述第一HFP通信装置将所述存储装置中的第一音频信号发送给所述第二HFP通信装置;(4)智能设备对所述第一音频信号处理后返回控制信号到所述语音预处理装置。

进一步地,所述步骤进一步包括:(201)对所述麦克风阵列获取的第一音频信号进行PCM 编码后存储在存储装置中;(202)当第一HFP通信装置与第二HFP通信装置建立连接后,将所述第一音频信号的PCM编码进一步进行音频编码;(203)将所述进行音频编码的第一音频信号通过第一HFP通信装置传输到第二HFP通信装置。

进一步地,所述步骤进一步包括:(204)对所述麦克风阵列获取的第一音频信号进行音频编码后存储在所述存储装置中;(205)当第一HFP通信装置与第二HFP通信装置建立连接后,将所述进行音频编码的第一音频信号通过第一HFP通信装置传输到第二HFP通信装置。

采用上述技术方案,具有以下有益效果:将唤醒后的语音编码缓冲保存在蓝牙终端上,直到HFP通路建立起来,再将语音传给系统的HFP服务通道。这里对语音编码缓冲保存采用的编码格式可以是PCM格式,也可以是cvsd、msbc等音频格式,这样既适用于手机系统原生的助手的产品,又不影响助手的使用体验,和直接使用手机的原生助手起到类似的效果。在原有的A2DP的蓝牙音频通路上,将HFP切换后需要传输的语音信息传送给手机端,可改善A2DP的蓝牙音频切换时候导致的体验下降。

附图说明

图1是根据本技术一个实施例提供的智能语音系统的结构框图;

图2是根据本技术另一实施例提供的智能语音系统的结构框图;

图3是根据本技术另一实施例提供的智能语音系统中语音处理方法的流程图。

具体实施方式

为使本技术实施例的目的、技术方案和优点更加清楚,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。

本技术实施例提出一种智能语音系统,参考图1,为本技术实施例提出的智能语音系统的结构框图,包括蓝牙终端1和智能设备2;所述蓝牙终端1包括麦克风阵列101、语音预处理装置102、第一传输装置103、回放装置104;所述智能设备2包括第二传输装置202和智能处理器201;所述第一传输装置103包括第一HFP通信装置1032和第一A2DP通信装置1031,所述第二传输装置202包括第二HFP通信装置2022和第二A2DP通信装置2021;所述语音预处理装置102包括存储装置1021和编码装置1022,所述编码装置1022和所述麦克风阵列101相连,用于对所述麦克风阵列101获取的第一音频信号进行编码,并将所述第一音频信号通过编码装置1022进行编码后存储在所述存储装置1021中,并当HFP通信连接建立后通过所述第一HFP通信装置1032将所述存储装置1021中的第一音频信号发送给所述第二HFP通信装置2022;所述回放装置104与所述第一A2DP通信装置1031相连,用于通过所述第一A2DP通信装置1031接收所述第二A2DP通信装置2021发送的第二音频信号。

上述所述智能设备为智能手机、平板电脑、智能电视或智能机顶盒。下面以手机为例进行详细说明。

具体来说,当手机端正在利用A2DP模式与蓝牙终端(例如蓝牙音箱)进行连接并播放歌曲时,手机端通过第二A2DP通信装置与蓝牙终端的第一A2DP通信装置进行通信连接将手机端的歌曲(也就是本技术所述的第二音频信号)传输到蓝牙终端,并由蓝牙终端的回放装置进行播放,此时两者之间建立的连接是A2DP协议。当蓝牙终端接收到语音控制请求,也就是第一音频信号时,马上对采集到到第一音频信号进行缓存,通过语音预处理装置中的编码装置对第一音频信号进行编码,并将其存储在存储装置中,然后蓝牙终端与手机进行HFP通信连接,当连接完成时,将缓存在存储装置中的第一音频信号数据发送到手机端进行处理,这样可以保证在等待进行HFP通信连接前接收到的语音控制信号不会丢失。

下面以一个具体的实例来对上述本技术实施例进行具体说明,当手机端与蓝牙终端进行连接,蓝牙终端播放手机中的歌曲时,此时两者之间通过A2DP传输装置建立了连接,进行了第二音频数据的传输,单向的由手机端发送到蓝牙终端,蓝牙终端的回放装置进行解码后进行播放。此时,当用户对蓝牙终端发出语音指令:“请播放邓丽君的歌曲”,该语音指令为技术实施例所述的第一音频信号,此时蓝牙终端的多阵列麦克接收到该语音指令时,首先将该语音指令信号“请播放邓丽君的歌曲”,进行编码后存储在存储装置中,与此同时手机与蓝牙终端进行通信链路的切换,从A2DP模式转换到HFP模式,当传输链路转换完成时,蓝牙终端将存储在存储装置中的第一音频信号通过HFP通信模式发送到手机端,手机端的智能处理器对该指令进行处理,反馈给蓝牙终端,蓝牙终端接收反馈回的指令开始播放邓丽君的歌曲。在上述过程中,如果采用传统的方式,由于指令时间过短,未等到HFP通信链路建立,语音指令已经停止,则会导致语音指令无法拾取。可以理解,如果语音指令为比较简单的指令,例如:播放,停止,增大音量,减小音量,下一首,上一首,接听电话,挂断电话类指令,则可以直接由蓝牙终端进行识别处理。只有语音命令较为复杂,例如:请帮我查找最近加油站在哪里?今天天气如何?等指令时,需要传输到手机端或者语音云服务器进行处理。

本技术实施例中,对第一音频信号进行编码,并将所述第一音频信号通过编码装置1022进行编码后存储在所述存储装置1021中,在实现上有两种方式,下面进一步地对两种方式进行详细说明。

本技术实施例提供的另一实施例,在上述实施例的基础上,所述编码装置进一步包括PCM编码装置和音频编码装置,所述PCM编码装置用于对所述麦克风阵列获取的第一音频信号进行PCM编码后存储在所述存储装置中,当第一HFP通信装置与第二HFP通信装置建立连接后,所述音频编码装置将所述第一音频信号的PCM编码进一步进行音频编码并通过第一HFP通信装置传输到第二HFP通信装置。具体来说,先将采集到的第一音频信号使用PCM编码装置进行PCM编码,并先缓存起来,等建立好了HFP连接以后从将缓存的PCM数据里面取数据进行编码成cvsd或msbc格式,通过HFP通信装置向智能终端的HFP接口上发送。

本技术实施例提供的另一实施例,在上述实施例的基础上,所述编码装置进一步包括音频编码装置,所述音频编码装置用于对所述麦克风阵列获取的第一音频信号进行音频编码后存储在所述存储装置中,当第一HFP通信装置与第二HFP通信装置建立连接后,将所述进行音频编码的第一音频信号通过第一HFP通信装置传输到第二HFP通信装置。与上述实施例的区别在于,该编码装置中不需要PCM编码装置,而是直接对采集到的第一音频信号进行音频编码。第一音频信号采集后就进行音频编码成cvsd或msbc,将编码后的语音缓存起来,建立了HFP接后,再将编码后的第一音频信号送上传输链路,发送到手机端进行处理。

存储装置一般可以是语音预处理装置的芯片内部的SRAM,也可使用芯片外部比如蓝牙终端的SRAM、DDR或者NAND FLASH等存储介质。

本技术提供另一实施例,当手机端智能处理器无法完成语音识别处理的要求时,需要进一步使用语音云服务器3的语音识别功能,本技术实施例在上述系统的基础上还进一步包括语音云服务器,所述语音云服务器与所述智能设备进行远程通信并获取智能设备发送的所述第一音频信号,用于对所述第一音频信号进行处理。所述语音云服务器和所述智能设备之间通过无线网络进行数据传输。根据语音计算量的大小,通常简单的语音处理在手机端智能处理器可以完成,可以满足大部分前端设备的语音识别功能应用,但是在手机端智能处理器仍不能满足运算或处理的情况下,可以利用语音云服务器完成。

根据本技术实施例,所述麦克风阵列为模拟麦克风阵列或数字麦克风阵列,通常麦克风阵列包括1~8个麦克风,这是标准的远场语音采集的配置,通常状态下一般会使用2个麦克风组成麦克风阵列,在某些安静情况下的只使用1个麦克风也可以。

本技术还提供另一实施例,所述语音预处理装置进一步包括:

唤醒装置1025,与所述麦克风阵列连接,用于唤醒所述语音预处理装置和第一传输装置;

降噪装置1023,连接在所述麦克风阵列和所述第一传输装置之间,用于对采集到的所述音频信号进行降噪处理;

波束形成装置1024,与所述麦克风阵列连接,用于加强特定方向的语音采集;

回声消除装置1026,连接在所述降噪装置和所述第一传输装置之间,用于对采集到的所述音频信号进行回声消除处理。

本技术提供的实施例,为了提供更进一步的高级的语音处理,如图2所示,语音预处理装置102进一步包括唤醒装置1025,与所述麦克风阵列101连接,用于唤醒所述语音预处理装置102和第一传输装置103。所述语音预处理装置102进一步包括降噪装置1023,连接在所述麦克风阵列101和所述第一传输装置103之间,用于对采集到的所述音频信号进行降噪处理。所述语音预处理装置103进一步包括波束形成装置1024,与所述麦克风阵列101连接,用于麦克风阵列101加强特定方向的语音采集。所述语音预处理装置102进一步包括回声消除装置1026,连接在所述降噪装置1023和所述编码装置1035之间,用于对采集到的所述第一音频信号进行回声消除处理。上述唤醒装置用于麦克风阵列采集的语音信号,根据能量,或人声的特征(过零点检测,频谱分析等),确定开启语音唤醒的算法,对比输入的语音和之前大批量训练序列的最大似然算法,确定语音输入是否为唤醒词,如果是则开启后续处理。上述波束形成装置1024,用于对有多麦克语音输入时候的各麦克的语音数据的时延和相位差,来判断声音信号相对麦克阵列的输入方向,并依据此信息,确定降噪装置的参数。上述降噪装置1023,根据波束形成算法的降噪参数,或预定的降噪方向图曲线,对不同方向上的信号做加强或减弱,突出最近一次方向上的信号强度。同时根据人声和环境音(周期噪声,音乐)的频谱差异,和时域相关性的差异,对信号做频域或时域的处理,将人声从背景音,或噪声中提取和加强出来。上述回声消除装置1026,当回放模块存在时,从回放解码出来的数据,加上预定,或预测的传递函数的处理,在麦克采集的数据中将喇叭放出的声音的反射部分消除掉,得到无回声的干净人声。

可以理解,当语音语音预处理装置的计算能力不足,不适于进行上述处理时,可以将唤醒装置、降噪装置、波束形成装置设置在智能设备中2进行处理,降低语音预处理装置102的运算量。智能设备进一步包括:唤醒装置,用于唤醒所述语音预处理装置和第一传输装置;降噪装置,用于对采集到的所述音频信号进行降噪处理;波束形成装置,用于加强特定方向的语音采集。上述装置可以设置在智能设备的智能处理器中。

根据本技术实施例的另一方面,本技术还提供一种用于智能语音系统中的语音处理方法,可以让系统在手机服务切换的同时将语音唤醒信息和上传信息进行保存,这样仍然可以在切换服务的时候,获取到流畅的交互体验。

本技术实施例是这样实现的,如图3所示,一种用于智能语音系统中的语音处理方法,包括如下步骤:(S101)麦克风阵列获取第一音频信号并发送给语音预处理装置;(S102)所述语音预处理装置对所述第一音频信号进行编码后将所述第一音频信号存储在所述存储装置中;(S103)当HFP通信连接建立后通过所述第一HFP通信装置将所述存储装置中的第一音频信号发送给所述第二HFP通信装置;(S104)智能设备对所述第一音频信号处理后返回控制信号到所述语音预处理装置。

上述步骤可以进一步包括两种编码方式,第一种是:对所述麦克风阵列获取的第一音频信号进行PCM编码后存储在存储装置中;当第一HFP通信装置与第二HFP通信装置建立连接后,将所述第一音频信号的PCM编码进一步进行音频编码;将所述进行音频编码的第一音频信号通过第一HFP通信装置传输到第二HFP通信装置。具体来说,先将采集到的第一音频信号使用PCM编码装置进行PCM编码,并先缓存起来,等建立好了HFP连接以后从将缓存的PCM数据里面取数据进行编码成cvsd或msbc的音频格式,通过HFP通信装置向智能终端的HFP接口上发送。

第二种方式是:对所述麦克风阵列获取的第一音频信号进行音频编码后存储在所述存储装置中;当第一HFP通信装置与第二HFP通信装置建立连接后,将所述进行音频编码的第一音频信号通过第一HFP通信装置传输到第二HFP通信装置。与上述实施例的区别在于,该编码装置中不需要PCM编码装置,而是直接对采集到的第一音频信号进行音频编码。第一音频信号采集后就进行音频编码成cvsd或msbc格式,将编码后的语音缓存起来,建立了HFP接后,再将编码后的第一音频信号送上传输链路,发送到智能终端进行处理。

下面以手机为例进行详细说明。

具体来说,当手机端正在利用A2DP模式与蓝牙终端进行连接并播放歌曲时,手机端通过第二A2DP通信装置与蓝牙终端的第一A2DP通信装置进行通信连接将手机端的歌曲(也就是本技术所述的第二音频信号)传输到蓝牙终端,并由蓝牙终端的回放装置进行播放,此时两者之间建立的连接是A2DP协议。蓝牙终端的麦克风阵列获取第一音频信号并发送给语音预处理装置;语音预处理装置经过预处理后将所述第一音频信号进行编码后先缓存在存储装置中,等待传输至手机端;当手机端与蓝牙终端的HFP通信连接后,将所述进行音频编码的第一音频信号通过HFP通信传输到手机端。手机端智能处理器对所述第一音频信号进行识别后返回控制信号到所述语音预处理装置,语音预处理装置获得返回的控制信号后对蓝牙终端进行按照第一音频信号进行控制。

本技术是将唤醒后的语音编码保存在蓝牙终端上,直到HFP通路建立起来,再将语音传给系统的HFP服务通道。这里可缓冲采用的编码格式可以是pcm,可以是cvsd,msbc。这样既适用于手机系统原生的助手的产品,又不影响助手的使用体验,和直接使用手机的原生助手起到类似的效果。在原有的A2DP的蓝牙音频通路上,将HFP切换后需要传输的语音信息传送给手机端,可改善A2DP的蓝牙音频切换时候导致的体验下降。

最后应说明的是:以上实施例仅用以说明本技术的技术方案,而非对其限制;尽管参照前述实施例对本技术进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本技术各实施例技术方案的精神和范围。

智能健康管理系统方案可行性研究报告(综合版)

智能健康管理系统方案可行性研究报告 (综合版) 目录 一、智能健康管理系统方案介绍 二、智能健康管理系统方案优势与价值 三、智能健康管理系统设计原则 四、智能健康管理系统功能介绍 五、智能健康管理系统客户端APP开发 六、智能健康管理系统子系统组成 七、智能健康管理系统子系统功能 八、智能健康管理系统特点 九、智能健康管理系统服务流程 十、智能健康管理系统应用人群 十一、智能健康管理系统检测设备 十二、智能健康管理系统发展前景 前言 随着人们对健康管理意识的提高及老龄化社会的到来,医院仅仅为患者提供疾病治疗的服务已不能满足大众对健康的需求,这就要医院将智能健康管理系统融入到医疗卫生服务体系中,对居民人体健康状况进行长时间监护管理,并通过相关的健康信息进行疾病的预分析诊断,为居民提供更深层次的健康管理服务。健康管理服务包括健康人群、亚健康人群、疾病人群,以控制健康危险因素为核

心,通过病因预防、临床前期预防、临床预防三级预防并举,实现良性环形运转循环,为居民提供更加系统的健康管理。 正文 一、智能健康管理系统方案介绍 健康管理是一个连续的、长期的、循环往复、始终贯穿的过程,依托互联网+实时健康监测智能穿戴设备+云数据为基础,利用智能健康检测设备、无线通讯、互联网+实体、云计算+人工智能等诸多领域的前沿技术,智能健康管理系统通过对健康大数据的科学运用,为国人提供精准智能健康管理和个体化健康方案,让每个人都享受到带来的健康生活。为老年人群体、亚健康人群、慢性病患者(高血压、心脏病等)。实现院外监测,对亚健康人群和社区居民健康状况进行集中有效的管理(评估、预测和控制),实现个人对慢性病的早监测、早发现、早诊断和早治疗,实现对老年人和特殊人群的长期有效的病情监控和护理,同时智能健康管理平台为病人建立终身动态电子健康档案。通过物联网和云计算的应用促进健康保健水平的提升,促进资源的高度共享,完善健康保障体系,为医疗改革提供新型的网络化的支撑平台。 二、智能健康管理系统方案优势与价值 健康管理是一种对个人及人群的健康危险因素进行全面管理的过程,提供科学的健康指导、健康生活方式的干预,调动其自觉性和主动性,有效地利用有限的资源来达到最大的健康改善效果,保护和促进人类的健康,真正达到防治疾病的发生,提高生命质量、降低医疗费用的目的。

智能健康管理系统设计与实现

智能健康管理系统设计与实现

目录 1 智能健康管理系统概述 (4) 1.1背景资料 (4) 1.2系统特点 (4) 1.3系统功能 (4) 1.4系统结构及业务流程图 (5) 1.5系统的运行环境 (6) 2 访问系统 (6) 2.1登录系统 (6) 3 首页 (6) 3.1 基本信息统计 (6) 3.2 慢病趋势图 (6) 3.3 人群分类占比 (7) 3.4 租户区域信息 (7) 3.5 疾病人数 (7) 3.6 签约人数 (7) 4 会员档案 (7) 4.1 用户画像 (7) 4.2 基本信息 (8) 4.3 评估报告 (8) 4.4 体检报告 (8) 4.5 健康监测 (8) 4.6 干预促进 (8) 4.7 服务签约 (9) 5 家医签约 (9) 5.1 新增签约 (9) 5.2 签约审核 (9) 5.3 签约记录 (9) 6 健康建档 (9) 6.1 建档 (9) 6.2 档案筛选 (10) 6.3 建档情况 (10) 6.4 分布统计 (10) 6.5 新增档案 (10) 6.6 个人健康管理 (11) 6.7 健康素养 (11) 7 健康评估 (11) 7.1 慢病风险 (12) 7.2 中医体质 (12) 7.3 心理健康 (13) 7.4 膳食营养 (17) 7.5 体力活动 (17) 7.7 一般风险 (17) 7.8 综合评估 (18)

8 健康指导 (18) 8.1 指导详情 (18) 8.2 指导筛选 (18) 8.3 指导人群分类 (18) 8.4 待指导 (19) 8.5 已指导 (19) 9 健康干预 (19) 9.1 干预详情 (19) 9.2 待干预 (19) 9.3 已干预 (20) 10 健康评价 (20) 11 统计分析 (20) 12 知识库 (21) 12.1 食材库 (21) 12.2 成品菜库 (21) 12.3 食谱库 (21) 12.4 膳食方案 (21) 12.5 运动项目 (22) 12.6 运动方案 (22) 12.7 运动处方 (22) 13. 字典管理 (22) 14 社康管理员 (22) 14.1 添加社康管理员 (22) 14.2 编辑社康管理员 (23) 15 管理机构 (23) 15.1 添加管理机构 (23) 15.2 编辑管理机构 (23) 15.3 查看 (23) 15.3.1 医生 (23) 15.3.2 医组 (24) 15.3.3 档案 (24) 15.3.4 签约 (24) 15.3.5 社区 (25) 16 用户管理 (25) 16.1 添加用户 (25) 16.2 查看用户人员 (25) 16.2.1 角色列表 (25) 16.3 编辑用户信息 (26) 17.服务包 (26) 18.服务项目 (26)

基于语音识别的家居智能监控系统

内蒙古科技大学 本科生毕业设计说明书(毕业论文) 题目:基于语音识别的家居智能监控系统 学生姓名: 学号: 专业:测控技术与仪器 班级: 指导教师:

基于语音识别的家居智能监控系统 摘要 智能家居系统大体而言可分为高层的信息娱乐网络和底层的数据采集与网络控制,在底层以微控制器为核心作为智能家居网络结点是目前智能家居的主要实现方式,语音识别技术在我国的研究成果也不是很高,但是用语音识别技术来与家居智能控制相结合是非常创新的。 本设计是采用AT89C52单片机为核心控制器的智能家居监控系统,系统通过无线nrf905作为信息传输媒介,将语音识别软件收到的具体指令发送至现场对单片机进行控制,从而控制家居的动作;同时现场单片机将数据通过无线发送至主控单片机,通过PC 界面实时监控家居各模块的运行状态。 该系统的功能模块分为:语音控制窗帘模块、温度检测模块、火焰检测模块和防盗报警模块。通过C#编程,在Microsoft Speech SDK的基础上实现对家具的智能监控,在PC机界面上直观的看到家居所有情况。 关键字:单片机;语音识别;nrf905;温度检测;防盗报警

Speech recognition-based smart home monitoring system Abstaract Generally speaking the smart home system can be divided into high-level information and entertainment network,the underlying data collection and network control in the bottom to the microcontroller as the core as a smart home network node,this is the main achievement of smart home way,the speech recognition technology inour research is not very high,but the voice recognition technology to the home intelligent combination of the control is very innovative. The design is using AT89S52 MCU core controller intelligent home monitoring system,the system through wireless nrf905 as information transmission medium,that specific instructions received by the voice recognition software is sent to the scene to control the MCU to control the actions of home;at the same time the scene SCM data through the wireless sent to the host microcontroller,real-time monitoring via a PC interface home run of the module state. The functional modules of the system is divided into,the voice control the curtains module temperature detection module,the flame detection module,and burglar alarm module. On the basis of the Microsoft Speech SDK,C # Programming,intelligent monitoring of the furniture intuitive interface of the PC,see the home in all cases. Keywords: SCM;speech recognition;nrf905;temperature detection;burglar alarm

智慧健康管理系统建设方案报告

智慧健康管理系统建设方案报告 现代人要应付快节奏的学习、工作和生活,要面临越来越多的竞争和挑战,人们的生理和心理随时都有可能发生老化和病变;加上环境污染,慢性病发病率连年上升,亚健康人群与日俱增,心理问题更是屡见不鲜,这些都严重地威胁到了人类的健康。因此健康管理随之应运而生。 智慧健康管理系统建设原则 在充分利用现有设施和资源的条件下,力求高起点的设计,既满足近期需求,又适应长远发展需要,以实现信息互通、资源共享、服务协同的建设目标。 1、顶层设计与统筹协调原则 建设按照总体部署和要求,结合实际情况进行信息资源统筹规划,遵循统一的建设规范、标准,明确信息化建设目标和任务,综合不同机制和措施,因地制宜、分类指导、分步推进,促进工作协调发展。 2、先进性与实用性原则 系统技术水平在保证其成熟性的前提下,充分考虑到其先进性。宜采用业界先进系统架构理念和技术,为方案升级和迁移打下扎实基础。平台各系统供应商应有能力进行该项产品的持续性开发,可以保证该项技术不断地更新并可顺利升级以维持系统的先进性。

在满足区域健康信息化系统整体性能的前提下,要充分利用已有的设备、软件和数据资源,采用最优化的方案,在硬件投资方面不追求超前,在软件投入方面必须满足需要,追求最佳性价比。 3、开放性与扩充性原则 项目建设是一个系统工程,除了与各类医疗健康机构内的有关信息系统互联互通外,有很多基础数据还需要从政府的其它信息系统如公安、社保、计生、民政、教育等信息系统中获取,与这些系统均需要保持双向的信息交互能力,因此系统设计必须保持开发性、具有良好的互连、互操作能力,必须遵循最新的国际标准、国家标准和行业标准,必须遵循开放的原则。 在平台实际使用过程中,用户的需求是会不断变化的,因此平台应当具有良好的可扩充性,便于用户根据自己的需要进行二次开发来满足用户不断变化的实际需要,使应用可以根据业务的发展和变化而平滑扩展。 4、可靠性和安全性原则 平台在设计时将充分考虑到系统的安全防护与冗余措施,提供较强的管理机制和控制手段,提供系统备份、数据恢复、事故监控和网络安全保密等技术措施。 应可实现7x24小时连续不间断安全运行,性能可靠,易于维护,防病毒的能力强。与外网连接采用防火墙+代理服务器方式,防止外部病毒入侵和外界恶意攻击。 5、规范化和标准性原则

基于语音识别的家居智能监控系统

基于语音识别的家居智能监控系统

————————————————————————————————作者:————————————————————————————————日期:

内蒙古科技大学 本科生毕业设计说明书(毕业论文) 题目:基于语音识别的家居智能 监控系统 学生姓名: 学号: 专业:测控技术与仪器 班级: 指导教师:

基于语音识别的家居智能监控系统 摘要 智能家居系统大体而言可分为高层的信息娱乐网络和底层的数据采集与网络控制,在底层以微控制器为核心作为智能家居网络结点是目前智能家居的主要实现方式,语音识别技术在我国的研究成果也不是很高,但是用语音识别技术来与家居智能控制相结合是非常创新的。 本设计是采用AT89C52单片机为核心控制器的智能家居监控系统,系统通过无线nrf905作为信息传输媒介,将语音识别软件收到的具体指令发送至现场对单片机进行控制,从而控制家居的动作;同时现场单片机将数据通过无线发送至主控单片机,通过PC 界面实时监控家居各模块的运行状态。 该系统的功能模块分为:语音控制窗帘模块、温度检测模块、火焰检测模块和防盗报警模块。通过C#编程,在Microsoft Speech SDK的基础上实现对家具的智能监控,在PC机界面上直观的看到家居所有情况。 关键字:单片机;语音识别;nrf905;温度检测;防盗报警 Speech recognition-based smart home monitoring system

Abstaract Generally speaking the smart home system can be divided into high-level information and entertainment network,the underlying data collection and network control in the bottom to the microcontroller as the core as a smart home network node,this is the main achievement of smart home way,the speech recognition technology inour research is not very high,but the voice recognition technology to the home intelligent combination of the control is very innovative. The design is using AT89S52 MCU core controller intelligent home monitoring system,the system through wireless nrf905 as information transmission medium,that specific instructions received by the voice recognition software is sent to the scene to control the MCU to control the actions of home;at the same time the scene SCM data through the wireless sent to the host microcontroller,real-time monitoring via a PC interface home run of the module state. The functional modules of the system is divided into,the voice control the curtains module temperature detection module,the flame detection module,and burglar alarm module. On the basis of the Microsoft Speech SDK,C # Programming,intelligent monitoring of the furniture intuitive interface of the PC,see the home in all cases. Keywords: SCM;speech recognition;nrf905;temperature detection;burglar alarm 目录 摘要 ......................................................................................................................................... I

基于单片机的语音识别系统_毕业设计 推荐

基于单片机的语音识别系统

基于单片机的语音识别系统 摘要 近几年来,智能化和自动化技术在玩具制造领域中越来越被关注。本文介绍一种智能化小车控制系统的设计——语音控制小车。语音控制小车是基于SPCE061A的代表性兴趣产品,它配合61板推出,综合应用了SPCE061A的众多资源,小车采用语音识别技术,可通过语音命令对其行驶状态进行控制。首先介绍了SPCE061A的主要性能及其引脚的功能;接着完成了电源电路、复位电路、键盘电路、音频输入电路,音频输出电路和无线控制电路等硬件功能模块的设计。软件设计模块能实现智能小车的前进、后退、转向、停止、避障、表演动作以及循线等功能。测试表明,在环境背景噪音不太大,控制者的发音清晰的前提下,语音控制小车的语音识别系统能对特定的语音指令做出智能反应,做出预想中的有限的动作 关键词:spec061a 语音识别驱动电路声控小车智能反应

Abstract In recent years, Intelligent and automation technology in the toy manufacture have been paid more and more attention.Introduce an intelligent vehicle control system design. SPCE061A program the system to single-chip, based on implementation of the car's voice control, This paper introduces the hardware sub-system design and implementation. The SPCE061A's main characters and pin function are introduced firstly. Completed the power circuit, reset circuit, keyboard circuitry, audio input circuits, audio output circuit and control circuit of wireless hardware such as the design of function modules. Software design module can achieve smart car forward, backward, turn, stop, obstacle avoidance, performing actions, as well as on-line functions. Test showed that the background noise in the environment is not too great, control persons under the premise of clear pronunciation, voice control car speech recognition systems for specific voice commands to make intelligent reaction, limited to the desired action. Keywords: spec061a 、voice recogniton、Driving circuit、Voice control dolly、intelirent response

用于智能家居语音识别系统设计

仪器科学与电气工程学院 本科毕业论文(设计)开题报告题目:用于智能家居的语音识别系统设计 学生姓名:学号: 专业:电气工程及其自动化 指导教师:讲师 2015年1月3日

1. 选题依据 1.1选题背景 语言作为人类信息交流中最重要的和最方便的方式,人与机器的交流能否像人与人一样自如,是人们研究的问题。控制论创始人维纳在1950年就曾指出:“通常,我们把语言仅仅看作人与人之间的通信手段,但是,要使人向机器,机器向人以及机器向机器讲话,那也是完全办得到的”。 随着现代科学技术的进一步发展和人民生活水平不断的提高,人们对家庭住宅需求的概念也发生了彻底的改变。人们正在从以往追求房屋空间的宽阔和装饰的亮丽、豪华,向着追求品味、安全、舒适、便捷和智能方向发展。现在的家庭不仅要满足人们生活、工作、娱乐和交流的需要,同时还可以提供充分的安全防护、物业管理等手段。智能家居是建筑艺术、生活理念与信息技术、电子技术等现代高科技手段完美结合的产物,它的出现满足了人们对住宅高性能、智能化的要求21世纪信息时代的到来,IT产业的发展和人们生活水平的提高,“智能家居”、“家庭自动化”、“网络家电”、“家庭网络”等技术的推动,智能家居的生活已经近在咫尺。 在智能家居中传统的家用电器的控制,无外乎两种控制方式:手动或遥控。随着家用电器的增多,开关和遥控越来越多,使用极不方便。这时,我们可以釆用语音识别的方式控制,例如,在观看电视频道时,我们可以很方便地直接说出“中央一套”来,所以语音识别及控制在智能家居中尤其重要。 1.2国内外研究现况 1、语音识别技术的发展 就技术而言,目前国内外对语音识别理论及各种实用算法的研究是一热点。人们普遍关心的问题是不断提高语音识别的识别率、识别更多的词汇量、扩大语音识别的应用等研究。语音识别技术发展到今天,PC 机的语音识别系统己经趋于成熟,而且还出现了一些具有实用价值和市场语音识别前景的语音识别芯片。近几年来,个人消费类电子产品的广泛使用,使大量的识别系统从实验室 PC 平台转移到嵌入式平台设备中,现在嵌入式对特定人语音识别系统的识别精度己经达到 98%以上。嵌入式语音识别系统和 PC 机的语音识别系统相比,虽然其运算速度和内存容量有一些限制,但是它也有各自的特点。嵌入式系统体积小、可靠性高、耗电低、投入小、便于移动等优点,是嵌入式语音识别系统和 PC 机的语音识别系统相比的最大优势。而且嵌入式语音识别系统多为实时系统,当用户讲话后,系统能够立即完成词条识别并作出反应。这些特点决定了嵌入式语音识别系统的应用十分广泛。可以预测在近几年内,嵌入式语音识别系统的应用将更加广泛。各种语音识别系统将出现在市场上。根据美国专家预测,具有语音识别功能的产品可达 50 亿美元。在短期内还不可能具

养老院智能管理系统解决方案报告书

智能养老系统 1、系统概述 智能养老系统是由五维科技集团研发,本系统采用了Zigbee、传感网络、云计算、医疗物联网、移动互联网等先进技术和理念,以养老院实际管理和服务需求为出发点,建立了一套成熟完善的养老院智能化管理系统。系统涵盖了养老院日常基本信息管理、老人安全监护、老人健康监护、老人外出看护、以及便捷的关怀服务等一系列功能模块。确保养老院工作人员能够实时准确的监测和管理老人的生活起居和健康状况,在出现特殊的情况的时候能最快的响应,从而为老人的生命安全与健康舒适的生活提供保障。从老人、护理人员到养老院的管理人员,此解决方案为广泛的应用提供了强有力的支持。从真正意义上实现养老院管理智能化,步入“智能管理,品质养老”的全新阶段。 2、系统特色 养老院智能化管理系统采用国际领先的ZigBee无线通信技术,可实现对老年人实时,全方位的看护,并能有效整合现有看护资源,可从根本上解决传统的老人看护系统存在的诸多问题。本系统主要功能特性包括: (1)灵活的模块化设计:系统采用SOA架构,采用模块化设计,用户可以自由组合的功能模块,可根据养老院的具体业务范围和工作流程进行定制、重组和改造。 (2)全范围无缝监测:每个老人随身佩戴多功能监测腕表,无论室内还是室外均可实时监测老人的活动位置。系统信号覆盖全面,无死角。 (3)系统及时响应:当老人在遇到紧急情况需要救助时,可随时用腕表进行呼救。响应时间小于3秒。 (4)智能分析:可对老人的行为活动进行智能分析,对可能发生的危险进行预警。如当老人长时间处于卫生间内时,系统可发出预警。 (5)实时监护:对老人的安全情况和身体健康状况(生理体征数据)进行实时跟踪监测。对监测和跟踪的结果,采用先进的数据分析系统,将分析结果及时通知家属和护理人员,以便于家属及时掌握病人情况和医护人员及时制定有针对性的医疗护理方案。 (6)有效整合看护资源:除老人外,系统也可实现对看护人员的实时位置定位与追踪,当有老人求助时,系统可显示离求助老人最近的看护人员,可便在最短的时间内使老人得到求助。 (7)安装、改造方便:系统设备采用基于ZigBee的无线MESH自组网无线技术,施工时无需布线,可有效降低初装特别是系统改造的难度及成本。 (8)完备的管理平台:除实时对老人的安全、健康监护管理功能外,系统还可建立完善的老年人信息数据库,对于每个老人的身体状况,个人喜好,病历信息等都可集成的数据库之内。 (9)便于系统整合:系统采用开放式接口,易于同电子消费,电子门禁、一卡通、环境保障、视频监控等已有系统的整合集成。 3、养老院智能化管理系统 养老院综合信息管理系统是一个接待管理、人事管理、床位管理、仓库管理、费用管理、老人管理、药品管理、基本管理等等的资源共享的信息化管理系统。系统全面提高养老经营管理水平;规范收费管理,实现精准、迅捷的电脑自动化计费、结账,提高收费工作效率,提升财务管理质量;加强老人档案资料和服务项目的管理,提供多角度的老人情况分析功能,辅助管理层随时全方位掌握老人信息,提升服务质量;提高仓库物品周转效率,规范仓库管理运作,降低库存和运营成本;通过系统的实时的数据统计分析,给管理人员提供全面、准确的、科学的决策依据。

人工智能 语音识别 论文

基于神经网络的语音信号识别 摘要 语言是人类之间交流信息的主要手段之一,自电脑发明以来,人们就一直致力于使电脑能够理解自然语言。语音识别技术是集声学、语音学、语言学、计算机、信息处理和人工智能等诸领域的一项综合技术,应用需求十分广阔,长期以来一直是人们研究的热点。神经网络是在现代科学研究成果的基础上提出来的模拟人脑结构机制的一门新兴科学,它模拟了人类神经元活动的原理,具有自学习、联想、对比、推理和概括能力,为很好地解决语音识别这样一个复杂的模式分类问题提供了新的途径。本文针时语音识别的特点.BP 神经网络在语音识别技术中的应用进行了探索性研究,对进而结合人工智能领域较为有效的方法——遗传(GA)算法。针对传统BP 算法识别准确率高但训练速度慢的缺点,对BP 网络进行改进,构建了一种基于遗传神经网络的语音识别算法(GABP),并建立相应的语音识别系统。仿真实验表明,该算法有效地缩短了识别时问,提高了网络训练速度和语音的识别率。关键词:语音识别,神经网络,遗传算法,遗传神经网络,BP 网络RECOGNITIO THE RSREARCH OF SPEECH RECOGNITION BASED ON THE NEURAL NETWORK ABSTRACT Language is one of the most important means of exchanging information among the mankind.Since the computer was invented,many scientists have been devoted to enabling the computer to understand the natural language.Speech recognition is a comprehensive technology of such areas as acoustics,phonetics,linguistics,computer science,information processing and artificial intelligence,which can be used widely.The research of speech recognition technology has been focused by the world for a long time.The neural network is a new developing science,which simulates the mechanism of human brain and was putted forward by the developing of modern science.is not the overall description of human brain,the abstract,It but simulation and simplifying of the physical neural networks of human beings. The purpose of the research in this area is exploring the human brain mechanisms in information processing,storing and searching.If people can understand these mechanisms,a new way for the research of artificial intelligence,information processing and etc. can be opened up. Artificial neural network is a system which using a physically feasible system to imitate the structure and function of nerve cells in human brain,which has the ability of self—learning,contrasting,reasoning and summarizing .It have offered a new way in solving such complicated pattern classification problems as speech recognition.This paper mainly studies the application of the BP neural network in the research of speech recognition. BP neural network can get higher identification precision, but its training speed is very low, a new recognizing algorithm based on BP algorithm by combining with good effect method in ANN which named genetic algorithm (GA) was proposed and used to improve the BP neural network. Experiments results show that the training speed can be accelerated by the method and the recognition performance is also promoted.words: Key words speech recognition, neural network, genetic algorithm, genetic neural network, BP network 1.绪论1.1 1.1 课题背景1.1.1 语音识别概述随着计算机技术的发展,人与机器之间的交流也越来越广泛和深入,计算机己经渗透到人们生活的各个方面。在现代社会中,人们逐渐习惯借助计算机来完成各项事务。在这种情况下,如何让计算机智能化地与人进行通信,使人机交互更加自然方便成为现代计算机科学的重要研究课题之一。语音识别(Speech Recognition)主要是指让机器听懂人说的话,即在各种情况下,准确地识别出语音的内容,从而根据其信息,执行人的各种意图。语音识别是一门涉及面很广的交叉学科,它是目前发展最为迅速的信息研究诸领域中的一个。语音识别的最大优势在于使得人机用户界面更加自然和容易使用。随着计算机技术、模式识别和信号处理技

智能语音识别机器人——文献翻译

改进型智能机器人的语音识别方法 2、语音识别概述 最近,由于其重大的理论意义和实用价值,语音识别已经受到越来越多的关注。到现在为止,多数的语音识别是基于传统的线性系统理论,例如隐马尔可夫模型和动态时间规整技术。随着语音识别的深度研究,研究者发现,语音信号是一个复杂的非线性过程,如果语音识别研究想要获得突破,那么就必须引进非线性系统理论方法。最近,随着非线性系统理论的发展,如人工神经网络,混沌与分形,可能应用这些理论到语音识别中。因此,本文的研究是在神经网络和混沌与分形理论的基础上介绍了语音识别的过程。 语音识别可以划分为独立发声式和非独立发声式两种。非独立发声式是指发音模式是由单个人来进行训练,其对训练人命令的识别速度很快,但它对与其他人的指令识别速度很慢,或者不能识别。独立发声式是指其发音模式是由不同年龄,不同性别,不同地域的人来进行训练,它能识别一个群体的指令。一般地,由于用户不需要操作训练,独立发声式系统得到了更广泛的应用。所以,在独立发声式系统中,从语音信号中提取语音特征是语音识别系统的一个基本问题。 语音识别包括训练和识别,我们可以把它看做一种模式化的识别任务。通常地,语音信号可以看作为一段通过隐马尔可夫模型来表征的时间序列。通过这些特征提取,语音信号被转化为特征向量并把它作为一种意见,在训练程序中,这些意见将反馈到HMM的模型参数估计中。这些参数包括意见和他们响应状态所对应的概率密度函数,状态间的转移概率,等等。经过参数估计以后,这个已训练模式就可以应用到识别任务当中。输入信号将会被确认为造成词,其精确度是可以评估的。整个过程如图一所示。 图1 语音识别系统的模块图

语音识别系统实验报告

v1.0 可编辑可修改 语音识别系统实验报告 专业班级:信息安全 学号: 姓名:

目录 一、设计任务及要求 (1) 二、语音识别的简单介绍 语者识别的概念 (2) 特征参数的提取 (3) 用矢量量化聚类法生成码本 (3) 的说话人识别 (4) 三、算法程序分析 函数关系 (4)

代码说明 (5) 函数mfcc (5) 函数disteu (5) 函数vqlbg (6) 函数test (6) 函数testDB (7) 函数train (8) 函数melfb (8) 四、演示分析 (9) 五、心得体会 (11) 附:GUI程序代码 (12)

一、设计任务及要求 实现语音识别功能。 二、语音识别的简单介绍 基于VQ的说话人识别系统,矢量量化起着双重作用。在训练阶段,把每一个说话者所提取的特征参数进行分类,产生不同码字所组成的码本。在识别(匹配)阶段,我们用VQ方法计算平均失真测度(本系统在计算距离d时,采用欧氏距离测度),从而判断说话人是谁。 语音识别系统结构框图如图1所示。

图1 语音识别系统结构框图 语者识别的概念 语者识别就是根据说话人的语音信号来判别说话人的身份。语音是人的自然属性之一,由于说话人发音器官的生理差异以及后天形成的行为差异,每个人的语音都带有强烈的个人色彩,这就使得通过分析语音信号来识别说话人成为可能。用语音来鉴别说话人的身份有着许多独特的优点,如语音是人的固有的特征,不会丢失或遗忘;语音信号的采集方便,系统设备成本低;利用电话网络还可实现远程客户服务等。因此,近几年来,说话人识别越来越多的受到人们的重视。与其他生物识别技术如指纹识别、手形识别等相比较,说话人识别不仅使用方便,而且属于非接触性,容易被用户接受,并且在已有的各种生物特征识别技术中,是唯一可以用作远程验证的识别技术。因此,说话人识别的应用前景非常广泛:今天,说话人识别技术已经关系到多学科的研究领域,不同领域中的进步都对说话人识别的发展做出了贡献。说话人识别技术是集声学、语言学、计算机、信息处理和人工智能等诸多领域的一项综合技术,应用需求将十分广阔。在吃力语音信号的时候如何提取信号中关键的成分尤为重要。语音信号的特征参数的好坏直接导致了辨别的准确性。 特征参数的提取 对于特征参数的选取,我们使用mfcc的方法来提取。MFCC参数是基于人的听觉特性利用人听觉的屏蔽效应,在Mel标度频率域提取出来的倒谱特征参数。 MFCC参数的提取过程如下: 1. 对输入的语音信号进行分帧、加窗,然后作离散傅立叶变换,获得频谱分布信息。 设语音信号的DFT为:

语音识别技术人工智能论文_大学论文

一:前沿 语音识别技术是2000年至2010年间信息技术领域十大重要的科技发展技术之一。它是一门交叉学科,正逐步成为信息技术中人机接口的关键技术。语音识别技术与语音合成技术结合使人们能够甩掉键盘,通过语音命令进行操作。语音技术的应用已经成为一个具有竞争性的新兴高技术产业。 二:语音识别技术概述 语音识别技术,也被称为自动语音识别Automatic Speech Recognition,(ASR),其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。与说话人识别及说话人确认不同,后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。语音识别技术的应用包括语音拨号、语音导航、室内设备控制、语音文档检索、简单的听写数据录入等。语音识别技术与其他自然语言处理技术如机器翻译及语音合成技术相结合,可以构建出更加复杂的应用,例如语音到语音的翻译。语音识别技术所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。 语音识别是解决机器“听懂”人类语言的一项技术。作为智能计算机研究的主导方向和人机语音通信的关键技术,语音识别技术一直受到各国科学界的广泛关注。如今,随着语音识别技术研究的突破,其对计算机发展和社会生活的重要性日益凸现出来。以语音识别技术

开发出的产品应用领域非常广泛,如声控电话交换、信息网络查询、家庭服务、宾馆服务、医疗服务、银行服务、工业控制、语音通信系统等,几乎深入到社会的每个行业和每个方面。 三.语音识别的研究历史 语音识别的研究工作始于20世纪50年代,1952年Bell 实验室开发的Audry系统是第一个可以识别10个英文数字的语音识别系统。1959年,Rorgie和Forge采用数字计算机识别英文元音和孤立词,从此开始了计算机语音识别。60年代,苏联的Matin等提出了语音结束点的端点检测,使语音识别水平明显上升;Vintsyuk提出了动态编程,这一提法在以后的识别中不可或缺。60年代末、70年代初的重要成果是提出了信号线性预测编码(LPC)技术和动态时间规整(DTW)技术,有效地解决了语音信号的特征提取和不等长语音匹配问题;同时提出了矢量量化(VQ)和隐马尔可夫模型(HMM)理论。 80年代语音识别研究进一步走向深入:HMM模型和人工神经网络(ANN)在语音识别中成功应用。1988年,FULEE Kai等用VQ/I-IMM方法实现了997个词汇的非特定人连续语音识别系统SPHINX。这是世界上第1个高性能的非特定人、大词汇量、连续语音识别系统。 进入90年代后,语音识别技术进一步成熟,并开始向市场提供产品。许多发达国家如美国、日本、韩国以及IBM、Apple、AT&T、Microsoft等公司都为语音识别系统的实用化开发研究投以巨

智能家居下的语音控制系统

智能家居系统巧妙地运用前沿的计算机相关技术以及布线通讯技术等相关控制理论及实操技术使日常家居设备有机结合在一起。其优点在于可以提升用户体验,丰富家居生活。用人类最自然、最方便的交流信息方式将人融入家居,智能家居产品的开发和使用一定会成为未来的趋势。 智能家居下的语音控制系统 杨 威 吴 建 李珊珊 孙佳钰 张旭彤 刘英博 沈阳城市学院机电工程学院计算机系 辽宁沈阳 110112 耿立明 沈阳城市学院机电工程学院自动化系 辽宁沈阳 110112 1 当前已有的语音识别软件 当前已有的几种比较知名的语音识别软件有:使用了微软公司的语音识别引擎的语音大师2008 2.4。更加适应普通大众的宏乐语音识别控件9.1.642。KIKI 语音识别系统1.0。还有素有最好用的语音输入软件之称的IBM ViaVoice Pro 9.1。 2 语音识别的关键技术 特征参数提取技术、模式匹配技术、模型训练技术、选取语音识别技术单元都是语音识别的关键技术。2.1特征参数提取 由于人与人之间的说话方式以及说话声音等方面都不尽相同,所以研究人员对此进行了个人说话特征的研讨,其目的就在于说话习惯的个人特征的统一。 2.2模式匹配及模型训练技术 模式匹配就是使语音片段在语音库中获得最适合的匹配。而模型训练就是指从已知模式中提取符合该模式特征的模型参数。 3 ZigBee/SmartRoom 无线技术 SmartRoom 是一种无线通信技术。它的 快速发展得益于它的低速率、低能耗、短距等 优势。主要用于智能产品的近距离无线连接,智能照明、智能安防等,方便好用。 ZigBee 是类似蓝牙又强于蓝牙的一种新型的短距离无线通讯技术。它的传输距离为十米到七十五米的可增的有效范围内。 4 语音控制系统的设计 智能家居的语言控制装置如图1所示,其特征在于,包括装置本体,装置本体的左侧面设置有排风口(1)和电源接口(2),装置本体的右侧设置有启动开关(3)、重启开关(4),装置本体的上表面设置有控制线接口及网络入口(5)、第一无线发射点(6)、语音探测器网络接口(7),装置本体的下表面设置有控制线接口及网络出口(8)、第二无线发射点(9),装置本体内部安装有可拆卸的备用电源(10)。 本体内部设置有中央处理器、网络适配器、扇热模块、内部存储器,中央处理器分别与网络适配器、扇热模块、内部存储器连接。 本系统实施方式采用ZigBee/SmartRoom 无线技术,装载IBM 语音识别系统,搭配高效低耗能语音探头,且自带电源,通过语音控制智能家居,用特定词汇启动命令,录入关键字,让智能家居的控制不仅仅局限于通过联网设备的第三方控制,使其更加智能化、人性化,用户可以像与人说话一样,用自然化的人类语言操作语音控制系统,从而实现语音控制系统的人机交互,语言控制装置可作家庭路由器,也作为家庭局域网的控制中心,是家庭局域网与Internet 的连接枢纽,也是智能家居的控制中心。 5 结语 通过对本系统硬件和软件部分的设计,能够实现基于互联网智能家居环境下的语音控制系统,为智能家居提供更有效的输入模块。 图1整体结构示意图

相关主题