搜档网
当前位置:搜档网 › 智能语音自动化测试解决方案-Mario-06

智能语音自动化测试解决方案-Mario-06

智能语音自动化测试解决方案-Mario-06
智能语音自动化测试解决方案-Mario-06

易诚高科-智能语音自动化测试解决方案

——提高智能语音产品质量,降低人为误差、提升测试管理水平

随着社会信息化的加快,智能产品的语音测试与问题定位需求剧增。为了提升测试效率,降低测试人员人为操作误差,最佳测试方式就是采用自动化测试。但由于智能产品的产品形态、语音反应、智能化操作等方面形式不尽相同,在自动化测试的前提下,问题的定位和状态断言的准确性就成为了一个新的挑战。

作为AIoT场景仿真服务商,易诚高科专注于为AIoT行业提供基于场景仿真的产品研发、测试、验收以及预认证等软硬结合的全栈式解决方案。在拥有1200+Lab仿真场景、2000+室外场景、1000万行业场景数据基础上,易诚高科充分理解智能语音产品自动化测试痛点和需求。依托人工智能和数字孪生技术,从应用、架构和用户体验三个维度出发,易诚高科推出了智能语音产品自动化测试解决方案及智能语音慧测仪Mario,帮助企业提高智能语音产品质量,降低人为误差、提升测试管理水平。

1.解决方案-慧测仪Mario的功能

整体架构由下而上依次分为多模态组件及算法、主控设备的各项管理模块、测试任务创建及管理、数据汇总及报告管理。产品在基础数据分析和整理的基础上,适用于各种智能语音产品的真实用户场景,将自动化、自由化与真实用户场景整合为一个统一的整体, 实现测试效率提升、测试数据准确、测试场景真实的三维综合效果。

图1Mario功能界面

如上图Mario的主要功能包含新增测试任务、测试报告记录、设备管理、产品管理、评级管理以及系统管理。其中

●新增任务模块

分为自定义任务和场景任务两类,其中自定义任务分为唤醒任务、误唤醒任务、识别任务和链路任务,链路任务又分为语音交互和触控交互;场景任务分为场景任务管理和场景任务测试。每类新增任务的数据参数依据各自测试任务需求调整。

●测试报告记录模块

记录报告模块是对所有测试结束的任务报告进行处理的管理模块,在该模块中,测试报告可实现详情查看、报告导出、按照之前报告的参数配置重复测试、删除等系列操作。

●设备管理模块

设备管理模块是测试用多模态组件的管理模块,包含信息包含对多模态组件名称的自定义、电量展示、MAC地址信息、在线状态、设备类型、所关联的被测产品以及所属的测试空间信息,功能主要对多模态组件的增、删、查。

●产品管理模块

产品管理为对被测试产品的管理,相关信息包含被测产品的品牌名称、功能分类、设备类型、产品名称及型号,以及对被测产品的增、删、改、查。

●评级管理模块

评级管理包含对唤醒测试、误唤醒测试、识别测试以及链路测试的评级标准的设置,可以实现对相关标准的增、删、改、查。测试结果数据会依据自定义的标准对测试结果和报告进行相应的评级结果展示。

●系统管理模块

系统管理包括各项测试的存储路径和系统信息及管理。

2.方案优势

2.1.无线通讯设计

慧测仪与多模态组件、多模态组件与被测设备之间在保证测试精度和传输效率的前提下实现无线通讯,保证了被测设备在空间多变、形态多变和测试结果反馈多变的情况下,实现通讯数据的收集。

2.2.强大的扩展能力

慧测仪多模态组件是通过无线通讯实现的,不受制于数据线或者连接端口的限制,使用多模态组件对被测设备的扩展能力大大加强。

2.3.全场景应用

针对不同种类测试,语音唤醒测试、语音识别测试和链路测试等各种语音交互测试涉及的家居场景、车机场景、商场场景等需要保证产品用户场景一致性的测试需求均可满足。其数据和SDK集成前验证的算法验证,也能保证研发场景测试的需求。

2.4.集多功能于一体

远程控制测试任务

自动化测试系统可实现测试任务的远程控制,慧测仪、多模态组件以及被测设备之间的无线通讯也为远程控制提供便利。

测试报告管理

对于各类已经完成测试的报告汇总,可以实现分类管理并形成纵向版本迭代的数据追溯。

设备管理

可实现对多模态组件的增加、删除、编辑、查询。

产品管理

可实现对被测设备的增加、删除、编辑、查询。

评级管理

可实现对各类测试结果评判登记标准的自定义,主要功能也是增加、删除、编辑、查询。

3.应用场景

3.1.智能家居场景

智能家居环境中各个智能设备分布在不同的空间,并且由主控语音设备对所有智能家居产品进行语音交互控制,慧测仪及其多模态传感器在其无线通讯的条件下,可对全屋智能家居场景下的语音交互能力测试实现自动化。

其他智能设备包括不限于智能移动终端、智能穿戴设备、智能家居机器人等设备在家居环境的使用占比较大,对于这类设备在用户真实使用环境中的测试也在Mario的应用场景范围内。

图2家居环境

3.2.智能机车场景

车联网的人机交互进程不断加快,车机的特殊环境对于实验室测试数据与真实环境的误差较大,慧测仪及其多模态组件可以在车辆行驶的真实环境中对各语音设备包括车机和移动终端语音交互能力的测试,避免实验室模拟环境的误差。

图3车机环境

智能分析之深度学习和整体解决方案

智能分析之深度学习 深度学习对于智能分析来说就相当于人类的学习一样,人类不学习就是一张白纸,什么都不会,从我们的咿呀学说和学走路开始,到上学年龄的老师教学,再到进入社会的自我学习,无论何时何地,碰到新的事物就需要学习,智能分析既然是模拟人类,那深度学习就跟人类学习新事物一个原理,碰到一个新的事物,它无法辩认这是什么东西,最多只能判断它是否运动,运动速度是多少,是哪种颜色,是什么形状,但具体是什么物体它并不知道,那要辨认出具体物体,就需要做事前的深度学习 深度学习是学习物体的多个特征,不同的物体记忆不同的特征,比如认识不同的人、做人脸识别、人脸与身份证的对比等,一般都是通过识别人的五官特征,两个眼角,鼻子与两个嘴角五

个点位的位置、距离等信息,通常叫做人脸识别的五点识别,因为这些信息是不会随着年龄的增长而改变比例的,识别这些信息之后保存到数据库或文件中,一般是保存在XML文件中,当然有些情况还会记载物体的大小、颜色、形状等等多个参数,根据实际情况学习不同的特征值,这是学习的过程。 学习完之后就可以进行分析对比了,首先是找出视频中出现变化的对象,这个变化的对象有些是通过移动的对象来判断,有些是通过对比两帧数据来对比,反正是找出变化的对象即可,对象找出来之后先做初步的判断是否是我们需要检测的对象,如果是的话再提取物体的特征值,来对比保存的物体的各个特征

值,是否与保存的对象有相符的,再根据平台设置的相似度来确认是否是同一个人或对象。 在实际使用的过程中,算法首先是要进行一轮预处理阶段,即处理掉一些干扰因素,包括去除光亮条件和噪声、阈值、模糊等;对象的特征是一组描述符,为了使用这些描述符来训练模型或预测其中的一个模型,需要通过成千上万次图像预处理、提取特征来建立一个关于特征的大数据集合,并且通过选取的训练模型来提取特征。这就是为什么深度学习算法速度慢,当建模越多和视频中出现的对象越多,处理速度就会越慢,如果需要进一步排除误判,还需要对输出数据进行后期处理,比如合并多个分类,比如判断人脸后再判断身高,体形等,要判断这些因素,又要结合安装的摄像机的高度、角度等因素来设置人在视频中实际占的像素,在不同位置占的像素等,越想得到精准的结果,要处理的数据量就越大,对环境的要求就会越高,当平台处理的条

车载导航人机语音交互系统的实现.

车载导航人机语音交互系统的实现 引言语音作为自然的人机接口,可以使车载导航系统实现更安全、更人性化的操作。通过国内外车载导航系统的功能对比可知,支持语音交互是车载导航系统的一个发展趋势。另外,市场信息服务公司J.DPowerandAssociates的调研数据也表明,56%的消费者更倾向于选择声控的导航系统。因此,开发车载语音导航系统是很有意义的。目前,国内已经具备开发车载语音导航系统的技术基础,特别是文语转换TTS技术和基于中小词汇量的语音命令识别技术 引言 语音作为自然的人机接口,可以使车载导航系统实现更安全、更人性化的操作。通过国内外车载导航系统的功能对比可知,支持语音交互是车载导航系统的一个发展趋势。另外,市场信息服务公司J.D Power and Associates的调研数据也表明,56%的消费者更倾向于选择声控的导航系统。因此,开发车载语音导航系统是很有意义的。目前,国内已经具备开发车载语音导航系统的技术基础,特别是文语转换TTS技术和基于中小词汇量的语音命令识别技术已经达到比较实用的程度。本文在课题组的车载导航系统和国内两款语音引擎的基础上,开发了一套支持语音交互的车载导航系统。 车载语音导航系统结构 车载语音导航系统从功能上分为车载导航和导航语音交互两方面。其中车载导航功能包括GPS卫星导航定位、电子地图浏览查询、智能的路径规划、车辆地理位置和速度等导航信息的实时显示;导航语音交互功能分为语音操作和语音提示两部分。在系统的设计中,根据人机交互的需求,设计语音导航系统的硬件框架如图1所示。 语音导航系统和用户之间的人机交互接口由触摸屏、按钮、话筒、显示屏和扩音器等五个交互设备组成。该硬件框架可实现常规的手动交互方式,也可以实现语音交互方式。整个系统划分为三个子系统:导航子系统、语音识别子系统和语音合成子系统,各子系统间通过接口进行通信,协调完成语音导航任务。 车载导航人机语音交互系统对话模式设计 导航系统的状态转换网络 整个导航系统是一个复杂的人机交互系统,为便于语音交互对话模式的设计,首先对系统作状态划分,然后从人机交互的角度描述整个系统的状态转换网络。将系统划分为地图浏览、功能选择等六个功能状态和一个退出状态。图2描述了这些状态之间的状态转换网络。

视频智能分析解决方案

目录 第1章概述 (1) 1.1 项目背景 (1) 1.2 项目概况 (3) 1.3 需求分析 (4) 第2章智能视频分析预警解决方案 (5) 2.1 贴纸条检测 (5) 2.2 安装读卡器检测 (5) 2.3 人员滞留检测 (6) 2.4 人员靠近检测 (7) 2.5 越界监控 (8) 2.6 前端设备 (9)

第1章概述 1.1项目背景 视频监控系统是银行金融业安全防范网络监控系统一个重要分支,是技防的重要组成部分,是伴随着多媒体技术、编解码技术、网络技术等IT技术发展而成熟起来的。作为银行金融机构重要的安防手段,经历了从模拟到数字,从网点单独部署到联网监控,并朝着智能化、多元化综合应用的方向发展。 早期的金融视频监控系统以本地监控为主、远程管理为辅的方式,以各网点为单位组建一个区域自治的安防体系,分别配有数字监控、门禁控制、报警联动、对讲系统等设备。随着银行金融企业规模急剧扩大和金融服务水平的不断提升,银行金融机构网点分散、风险等级和管理难度加大、内部隐患加剧等诸多问题不断暴露出来,并已成为制约银行金融服务业快速发展的瓶颈。 伴随着多媒体技术、编解码技术、网络技术等IT技术的高速发展,在安防系统数字化、网络化、智能化发展的大趋势下,银行金融行业对于安全防范系统的智能化、网络化和集成化管理的需求越来越旺盛,呼声也越来越高涨,联网监控系统的重要性也日益受到银行金融行业的重视,其本身也得到了极大的发展。全国性银行和各地商业银行根据中国人民银行总行和公安部的行业标准要求,已分别建成了视频监控系统、入侵报警联网系统(与110报警联网)、金库出入管理系统、门禁控制系统、对讲系统等安全防范系统,并逐步完成了大量的营业网点、自助银行、ATM机和金库联网等分散场所的远程联网建设工作。 自助行的安全防范一直是银行安防的重点,随着智能监控技术的不断提高,银行迫切在自助行应用智能监控也在情理之中。 目前本平台可以结合海康智能ATM监控技术(前端智能或后端智能),可以很好的进行ATM正面异常人脸检测、ATM贴条检测、ATM安装读卡器检测、自助厅人员徘徊、人员聚集检测,当发现异常情况可立即产生报警信号,

智能语音平台建设技术建议方案书

智能语音平台技术建议书 2014 年 2 月 XXXXXX公司

目录 1.序言3 2.系统设计依据3 3.系统建设目标和业务分析4 4.系统建设思路5 5.系统规划6 .系统设计原则6 .系统体系架构7 .网络结构示意图9 .系统硬件选型9 .目前国内主流硬件市场占有率分析(大概)11 .基本业务流程12 系统呼入过程12 系统呼出过程13 6.呼叫中心解决方案14 .系统组网方案建议14采用数字排队机(集中式)14 .总体逻辑结构图16 .软件体系架构16媒体传输平面17 呼叫控制平面18 服务平面21 BS 业务系统平面36 管理功能平面49 7.平台报表53 .呼入报表53 .呼出报表53 .座席情况报表53 .服务质量报表53 8.跟第三方接口54 9.系统安全性54 .系统运行安全性54 .系统管理安全性54 .抗干扰性55

.数据存储安全性55 10.系统优势与部署方案55 .系统功能优势55 .系统部署基本条件56 11.项目实施方案57 .项目实施分析57 .项目实施方法57 .项目的组织与分工57 .分工与责任58 项目协调组58 承建方项目经理58 建设方项目经理58 技术主管59 业务需求组59 系统支持组59 用户管理开发组59 接口开发组59 业务模块开发组59 12.系统扩展性59 .软件扩展性59平台性能及扩展性60 二次开发工具60 .硬件扩展性61接入设备61 13.配置计算依据61 .系统规模计算依据61 .数据库/文件服务器存储空间计算依据62 14.平台技术指标63

1.序言 进入新经济时代,企业的竞争对手越来越强大,竞争的程度越来越惨烈。现 代企业的竞争优势已不仅仅是商品的本身,而更表现在对客户的全面争夺!只有 客户--持久的、忠诚的客户,才是决定企业命运的关键所在。随着行业的竞争 越来越激烈,企业的危机意识不断地加强,纷纷推出新的策略来吸引用户,满足用户。在经历‘产品战’,‘价格战’,‘概念战’后对用户的售前服务和售后服务 成了生产商和经销商新的竞争点。如何给用户提供及时,周到全面和有企业个性 化的服务及其服务信息。中原地产电话营销系统(以下简称营销系统)工程建设 的企业呼叫中心刚好弥补了以前企业跟用户缺少及时沟通的渠道。 本公司非常珍惜这次能为贵公司的营销系统提出方案建议的机会,凭借着多 年来对CTI 领域的集成经验和电信、企业业务系统的建设经验,本公司一定能为贵公司贡献自己的一份力量。 本技术方案主要是针对中原地产的电话营销系统的建设提出的建议,方案首 先提出营销系统建设目标。然后从本公司的营销系统产品的设计定位、系统架构、 系统构成等方面详细阐述本公司的呼叫中心的特性,并详细描述营销系统与其它 呼叫系统互联的方案。接着是把营销系统具备的业务功能和系统功能描述清楚。2.系统设计依据 系统符合以下技术规范的要求: 《话费查询系统技术规范》 《市内电话业务规程》 《长途电话业务规程》、 《全国电话号码查询业务网总技术要求(试行)》(原电信总局) 《全国电话号码查询业务网技术体制》(原电信总局) 《话费查询、用户投诉和业务受理的特服系统建设方案》(原电信总局) 《电信服务热线业务技术规范(讨论稿)》(原电信总局)

人工智能语音识别发展报告

人工智能语音识别发展报告Report of Artificial I ntelligence Development

目录 1.语音识别 (3) 1.1.语音识别概念 (3) 1.2.语音识别发展历史 (4) 1.3.人才概况 (6) 1.4.论文解读 (8) 1.5.语音识别进展 (173)

语音识别 1.语音识别 1.1.语音识别概念 语音识别是让机器识别和理解说话人语音信号内容的新兴学科,目的是将语 音信号转变为文本字符或者命令的智能技术,利用计算机理解讲话人的语义内容, 使其听懂人类的语音,从而判断说话人的意图,是一种非常自然和有效的人机交流方式。它是一门综合学科,与很多学科紧密相连,比如语言学、信号处理、计算机科学、心理和生理学等[8]。 语音识别首先要对采集的语音信号进行预处理,然后利用相关的语音信号处 理方法计算语音的声学参数,提取相应的特征参数,最后根据提取的特征参数进行 语音识别。总体上,语音识别包含两个阶段:第一个阶段是学习和训练,即提取语音 库中语音样本的特征参数作为训练数据,合理设置模型参数的初始值,对模型各个参 数进行重估,使识别系统具有最佳的识别效果;第二个阶段就是识别,将待识别语音信 号的特征根据一定的准则与训练好的模板库进行比较,最后通过一定的识别算法得出识 别结果。显然识别结果的好坏与模板库是否准确、模型参数的好坏以及特征参数的选择 都有直接的关系。 实际上,语音识别也是一种模式识别,其基本结构如下图所示。和一般模式 识别过程相同,语音识别包括如图所示3 个基本部分。实际上,由于语音信息的复 杂性以及语音内容的丰富性,语音识别系统要比模式识别系统复杂的多。 图 6-1 语音识别系统框架 其中,预处理主要是对输入语音信号进行预加重和分段加窗等处理,并滤除其 中的不重要信息及背景噪声等,然后进行端点检测,以确定有效的语音段。特征参数 提取是将反映信号特征的关键信息提取出来,以此降低维数减小计算量,

监狱智能视频分析项目解决方案

监狱智能视频分析解决方案 一、方案背景 监狱是关押和改造犯罪人员的重要场所,因此安全是首先要保障的因素。安全保障既要保障社会的安全,也要保障狱警人员和在押人员的安全。特别是在“构建和谐社会”的大环境下,构建好监狱的安全防体系就显得格外重要。在公安、司法部门,在监狱管理工作上,“向科技要警力”已经成为一种趋势。 在监狱、看守所这种特殊的场所,保安系统处于一个最为重要的位置,而视频监控则是其中最为重要的环节。国监狱现多采用模拟闭路电视监控系统,或普通数字监控系统。视频监控系统能够使得安保人员实时了解到监狱各个重点区域的人员活动情况及其他事件,并且能够将这些视频信息进行长时间的录像存储保存,方便日后查询。但是普通的视频监控系统也存在不尽如人意的地方,其最大弊端是完全依赖于人工监控。由于视频太多而监控人员有限,且长时间盯着监视画面容易疲劳而导致疏忽,监控人员根本无力监看成百上千路摄像头的视频信息。据有关数据分析,20分钟后监控人员可能错过最多高达95%的画面。试想一下,人的监控力度是有限的,而突发事件的发生是不可预见的,仅靠人为7*24小时的监控难以保证事件是否存在疏漏。通常监狱的视频监控系统能录制并保存数月的监控资料,但一旦事件发生时,没有智能分析的监控系统却无法做出即时判断,只能成为一个事后取证的工具。 本方案的提出旨在利用先进的智能视频分析系统,利用科技手段使得监狱的视频监控系统智能化,充分发挥监狱视频监控系统在整个安防体系的作用,从而为监狱这个高度戒备的场所提供充分可靠的保障。使传统的监控系统从被动变为主动,防患于未然。智能化主要体现在: 1)对事件的发生提前做出预警,最大限制地防止突发事件的发生,例如重点场所的遗留物检测、可疑人员人脸识别、游荡检测等; 2)即时警报,对发生的突发事件第一事件发出报警,从而有利于安保人员做出快速反应,例如奔跑检测、人员跌倒检测、重点区域入侵检测等; 本方案致力于从整体提升监狱的安防系统级别,所采用的视频分析系统基于澳大利亚iOmniScient Hi-iQ 公司的IQ-Infinity产品,iOmniScient公司具有多项业界领先的国际专利技术,iOmniScient以拥有业口碑和功能广泛独特的智能视频分析系统受到尊敬。IQ系列智能视频分析产品,曾在各的主流安防展上多次获最佳产品奖项。目前IQ系列产品用户超过30,000个。 二、方案特征 2.1 智能视频分析系统概述 视频监控系统的发展经历了第一代的全模拟系统,第二代的部分数字化的系统,第三代的完全数字化的系统(网络摄像机和视频服务器)三个阶段的发展演变,现在整个行业正在酝酿视频监控新的革命——智能视频监控。

监狱智能视频分析解决方案

监狱智能视频分析 解决方案

监狱智能视频分析解决方案 一、方案背景 监狱是关押和改造犯罪人员的重要场所,因此安全是首先要保障的因素。安全保障既要保障社会的安全,也要保障狱警人员和在押人员的安全。特别是在“构建和谐社会”的大环境下,构建好监狱的安全防范体系就显得格外重要。在公安、司法部门,在监狱管理工作上,“向科技要警力”已经成为一种趋势。 在监狱、看守所这种特殊的场所,保安系统处于一个最为重要的位置,而视频监控则是其中最为重要的环节。国内监狱现多采用模拟闭路电视监控系统,或普通数字监控系统。视频监控系统能够使得安保人员实时了解到监狱内各个重点区域的人员活动情况及其它事件,而且能够将这些视频信息进行长时间的录像存储保存,方便日后查询。可是普通的视频监控系统也存在不尽如人意的地方,其最大弊端是完全依赖于人工监控。由于视频太多而监控人员有限,且长时间盯着监视画面容易疲劳而导致疏忽,监控人员根本无力监看成百上千路摄像头的视频信息。据有关数据分析,20分钟后监控人员可能错过最多高达95%的画面。试想一下,人的监控力度是有限的,而突发事件的发生是不可预见的,仅靠人为7*24小时的监控难以保证事件是否存在疏漏。一般监狱的视频监控系统能录制并保存数月的监控资料,但一旦事件发生时,没有智能分析的监控系统却无法做出即时判断,只能成为一个事后取证的工具。 本方案的提出旨在利用先进的智能视频分析系统,利用科技手段使得监狱的视频监控系统智能化,充分发挥监狱视频监控系统在整个安防体系的作

用,从而为监狱这个高度戒备的场所提供充分可靠的保障。使传统的监控系统从被动变为主动,防患于未然。智能化主要体现在: 1)对事件的发生提前做出预警,最大限制地防止突发事件的发生,例如重点场所的遗留物检测、可疑人员人脸识别、游荡检测等; 2)即时警报,对发生的突发事件第一事件发出报警,从而有利于安保人员做出快速反应,例如奔跑检测、人员跌倒检测、重点区域入侵检测等; 本方案致力于从整体提升监狱的安防系统级别,所采用的视频分析系统基于澳大利亚 iOmniScient Hi-iQ公司的IQ-Infinity产品,iOmniScient公司具有多项业界领先的国际专利技术,iOmniScient以拥有业内口碑和功能广泛独特的智能视频分析系统受到尊敬。IQ系列智能视频分析产品,曾在各大洲的主流安防展上多次获最佳产品奖项。当前IQ系列产品用户超过30,000个。 二、方案特征 2.1 智能视频分析系统概述 视频监控系统的发展经历了第一代的全模拟系统,第二代的部分数字化的系统,第三代的完全数字化的系统(网络摄像机和视频服务器)三个阶段的发展演变,现在整个行业正在酝酿视频监控新的革命——智能视频监控。 智能视频监控是以数字化、网络化视频监控为基础,但又有别于一般的网络化视频监控,它是一种更高端的视频监控应用。智能视频监控系统能够自动识别不同的物体,发现监控画面中的异常情况,并能够以最快和最佳的方式发出警报和提供有用信息,从而能够更加有效的协助安全人员处理危机,并最大限度的降低误报和漏报现象。

智能视频分析系统解决方案

智能视频分析系统解决方案 1.1 系统概述 智能视频(Intelligent Video)技术源自计算机视觉(Computer Vision)与人工智能(Artificial Intelligent)的研究,其发展目标是在图像与事件描述之间建立一种映射关系,使计算机从纷繁的视频图像中分辩、识别出关键目标物体。这一研究应用于安防视频监控系统,将能借助计算机强大的数据处理能力过滤掉图像中无用的或干扰信息,自动分析、抽取视频源中的关键有用信息,从而使传统监控系统中的摄像机成为人的眼睛,使“智能视频分析”计算机成为人的大脑,并具有更为“聪明”的学习思考方式。这一根本性的改变,可极大地发挥与拓展视频监控系统的作用与能力,使监控系统具有更高的智能化,大幅度节省资源与人员配置,同时必将全面提升安全防范工作的效率。因此,智能视频监控不仅仅是一种图像数字化监控分析技术,而是代表着一种更为高端的数字视频网络监控应用。 智能视频分析包含视频诊断、视频分析和视频增强等,它们各自又包含了大量的功能算法,比如清晰度检测、视频干扰检测、亮度色度检测、PTZ(云台)控制功能检测,以及视频丢失、镜头遮挡、镜头喷涂、非正常抖动等检测都属于视频诊断内容,而视频分析算法则包含区域入侵、绊线检测、遗留遗失检测、方向检测、人群计数、徘徊检测、流量统计、区域稠密度统计、人脸识别、车牌识别、烟火烟雾检测、自动 PTZ 跟踪等功能,视频图像增强则包括稳像、去雾、去噪、全景拼接等算法。由此组合衍生出的算法种类又有很多,应用方式也千变万化,所以智能视频分析的应用范围很广。 在以往的视频监控系统中,操作人员盯着屏幕电视墙超过 10 分钟后将漏掉90%的视频信息,而使视频监控工作失去意义。随着社会发展,视频监控被越来越广泛地应用到各行各业中,摄像机数量越来越庞大,这给传统的视频监控带来严峻的挑战。针对行业发展推出智能视频分析系统,主要解决以下问题:一个是将安防操作人员从繁杂而枯燥的“盯屏幕”任务解脱出来,由机器来完成分析识别工作;另外一个是为在海量的视频数据中快速搜索到想要找的的图象。 1.2 系统组成 智能视频分析系统以数字化、网络化视频监控为基础,用户可以设置某些特定的规则,系统识别不同的物体,同时识别目标行为是否符合这些规则,一旦发现监控画面中的异常情况,系统能够以最快和最佳的方式发出警报并提供有用信息,从而能够更加有效的协助安全人员处理危机,最大限度的降低误报和漏报现象。智能视频分析是在传统的监控系统中,加入智能视频技术,在整个系统中,系统分布图如下:

城际通智能语音导航系统

城际通智能语音导航系统GreeN版操作说明 北京城际高科信息技术有限公司

重要声明: 1.感谢您购买北京城际高科信息技术有限公司(下简称北京城际高科)出品的城际通系列导航产品,请在使用该产品之前认真阅读本说明书,当您开始使用城际通系列产品时,北京城际高科视为您已经认真阅读了本说明书。2.请在购买产品时认真完整地填写“城际通用户权益保障卡”并由经销商加盖其公章,以便我们为您提供更好的服务,您在维修时需要携带并出示此卡。 3.城际通系列导航产品提供的地图及地图上的各类信息为示意表示,仅供使用者参考,不作为任何行政划界和量算的依据。 4.请在使用城际通系列导航产品及服务时严格遵守国家相关的法律法规,请用户注意当地实际交通标志;城际通系列导航产品及服务所提供的信息、路径规划及导航结果仅供使用者参考,有可能与实际情况有所偏差,不具备任何法律效力,也不代表是北京城际高科推荐,对因此直接或间接造成使用者或第三方损失的,北京城际高科将不承担责任。 5.日常使用产品过程中或接受服务之前,请务必将您的重要信息及时进行备份,以免在使用或接受服务过程中意外丢失,北京城际高科不负责赔偿用户在产品使用或接受服务过程中任何因数据丢失而导致的损失。 6.本说明书解释权归北京城际高科所有。

关于知识产权: 请严格遵守知识产权保护的相关法律法规。 城际通?是北京城际高科信息技术有限公司的注册商标。 城际通产品的电子地图版权、软件版权均为北京城际高科信息技术有限公司所有。 本说明书软件由电子工业出版社出版发行。 本说明书版权为北京城际高科信息技术有限公司所有,未经本公司书面许可,不得以任何形式复制本说明书的全部或部分。

未来 智能语音行业变现分析

2018-2022年我国智能语音行业变现分析 移动端实现精准营销 移动端,直接收费尚早,精准营销为先。 在手机移动端,语音识别作为交互技术,在翻译、搜索、地图等APP应用中使用已经非常广泛。通过嵌入这些APP中,提升用户体验和用户粘性。但由于体验欠佳,用户尚未形成以语音输入作为第一交互方式的习惯,目前语音技术厂商大都是向移动应用开发者免费开放API(应用程序接口)。 移动应用的用户每次语音输入的信息都会经过云端语音识别引擎的处理分析,通过此种方式语音识别公司收集到海量用户使用数据,在用户画像、精准广告投放方面具有非常明显的商业价值。巨头有更加丰富的变现手段,比专业的语音技术公司变现容易得多。例如阿里可以更精准地推送电商广告,百度可以更精准地给出搜索结果,腾讯可以更精准地推送游戏广告。而语音技术公司,例如Nuance、之类,要想变现

先要看合作的移动应用开发商自身经营的情况,还要面对包括互联网巨头在内的竞争对手也免费开放语音识别API的竞争。随着用户养成语音交互的习惯,对于一些需要重度语音交互的应用,语音技术厂商才可能直接收取服务费或者利润分成。一般认为语音技术厂商基于用户数据,为应用开发伙伴提供更好的精准营销方案是目前最适合的变现模式。 企业端发挥先发优势 企业端,语音技术公司先发优势明显。 目前语音技术企业的主要盈利模式将语音识别嵌入到企业、政府的工作交流中,提供系统的软件解决方案。Nuance收入的47%来自医疗行业,它提供了一整套基于语音技术的病例、档案、诊断沟通的解决方案。17%的收入来自银行、电信、物流等行业,例如提供客户服务、语音身份认证、数据处理等服务。科大讯飞一半以上的收入来自于教育、电信、政府的语音技术解决方案。 行业解决方案有很强的马太效应,需要对行业有深刻理解和大量的数据积累。的医疗应用、科大讯飞教育相关应用都有一定的垄断趋势。 硬件厂商的变现入口 智能硬件,众多场景的入口,变现的金矿。 汽车、电视、智能音箱(家庭的雏形〕、服务机器人等产品潜在用户数巨大,交互内容相对开放,交互过程中会产生大量高价值的用户数据,是互联网巨头和语音技术公司未来争夺的重要阵地。由于应用场景相对复杂,智能硬件配套集成的语音识别技术难度远高于手机移动端,语音技术公司不仅可以直接向硬件厂商收取一次性的语音功能模块费用,还可以收取升级服务费。

RichData医疗行业大数据智能分析解决方案

RichData医疗行业大数据智能分析解决方案 方案概述 在过去的30年间,我国的医疗行业经历了医改、新医改,医疗信息化也经历了从数字化、四梁八柱、35212等不同的发展阶段,信息技术的发展使数字化医疗日趋成熟。云计算、大数据等新兴技术的推动又给医疗信息化及新医改带来了新的契机。 如何把医疗大数据转换为经济价值,“关键是怎么能够提取出与诊疗有关的数据。”医疗行业的大数据集量大且繁杂,其中蕴含的信息价值也多样且丰富,如果能够对其进行有效的存储、处理、查询和分析,那么就可对于小到辅助某个临床医生做出更为科学和准确的诊断和用药决策,或帮助某个医院根据患者潜在需求开发全新个性化服务及自动服务,大到帮助相关研究机构突破医疗方法和药物革新,或支持地区甚至全国医疗行业主管部门优化医疗资源及服务配置,提供前所未有的强力支持。 医疗行业大数据量主要来自于制药行业科研数据,活动( 报销) 和成本数据,临床数据,病人行为和情绪数据。 医疗行业大数据应用场景非常多,下面仅以临床操作和研发为例,展示医疗行业大数据应用场景。

方案架构 医疗行业大数据总体系统框架分为五层, 分别是数据层,存储层,计算层,模型层, 应用层。模型层是整个大数据的核心部分,为上层应用提供数据支撑。 针对医疗行业大数据分析的特点, 引入大数据平台架构,实现对海量的制药行业科研数据,活动( 报销) 和成本数据,临床数据,病人行为和情绪数据的存储和管理,保证了医疗系统数据的准确性和高效性。 方案优势 彩讯医疗大数据解决方案在数据分析、数据管理、数据处理、数据可视化等重要技术上具有优势:

1.数据分析技术:包括数据挖掘、机器学习等人工智能技术,主要应用在 医疗分析和研究分析两大方面,如病理分析,病毒分析,人体健康度分析, 个性化差异分析等。为实现可信赖的医疗、个体化的医疗、转化医学研究、 病人参与的医疗,彩讯医疗大数据解决方案内置自主开发的函数模型库,除 包含常用的统计分析算法外,还内置了多种常用数据挖掘算法及分析模型。 插件式的函数模型库,可动态增加新算法模型。同时,还提供行业分析模型 及类似BI的分析和展示工具。 2.数据管理技术:包括关系型和非关系型数据管理技术、数据融合和集成 技术、数据抽取技术、数据清洗和过滤技术。医疗数据本身非常的分散,准 确性、及时性均有所欠缺,也对大数据管理技术提出了更高的要求。彩讯医 疗大数据解决方案内置ETL服务子系统与ETL配置工具,支持从文件, DB、数据流中导入数据。灵活的进行数据转换配置和任务配置。 3.数据处理技术:包括分布式计算技术、内存计算技术、流处理技术。现 行医疗行业医学信息不对称,个体化差异大,医疗疾病种类繁多,复合疾病 常见、关系复杂,这要求通过新型数据处理技术来更有效的利用软硬件资 源,在降低IT 投入、维护成本和物理能耗的同时,为医疗大数据的发展提 供更为稳定、强大的数据处理能力。彩讯医疗大数据解决方案包含Rich Hadoop分布式计算框架和Rich Streaming流计算框架,同时集成了hive、 hbase等成熟组件。 4.数据展现技术:包括可视化技术、历史流展示技术、空间信息流展示技 术等。主要应用与患者分类查询展现,复合疾病分析展现,基因组学数据展 现等方面。医疗数据种类繁杂,统计指标复杂,要求实时信比较高,因此需 要大力发展数据展现技术,提高医疗数据的直观性和可视性,从而提升医疗 质量降低医疗成本。彩讯医疗大数据解决方案自助分析工具包含报表工具和 分析工具。自定义报表工具,实现了基于XML 的定义文件来可编程性地生 成报表的能力。围绕着报表引擎,开发用户图形界面,用户可以使用向 导,无需编程,通过工具配置一步接一步完成创建一个报表。数据展示格 式灵活,能更大程度上满足用户的数据需求。多维分析工具,提供丰富的图 形化展现界面和接口。用java语言开发支持MDX(多维表达式)的查询 语言、分析型XML 和olap4j 的接口技术规范。实现了从SQL 和其它数 据源读取数据,在内存缓冲区中生成集合数据。 方案价值

自学习的人工智能助室内精确导航

自学习的人工智能助室内精确导航 ?在现代化的机场候机楼、医院大楼、办公楼、运动场、大学校园和零售商店中,方便易用的室内导航应用程序的市场日益扩大。根据MarketWatch (道琼斯旗下的新闻网站)的一份报告,预计到2022年,这一需求可望以30% 的速度增长。而智能手机中磁力计、加速度计和陀螺仪等先进传感器的出现将加速这一需求。为了满足这一需求,IBM 爱尔兰研究院建立了一个可用于生产环境的室内定位系统,它比现有的应用于不同智能手机上的商业解决方案精确度更高。这一自学习、自适应平台通过部署最少量的低功耗蓝牙(BLE,Bluetooth low energy)信标来推断用户的行程,进行学习,并最终为特定室内区域的每个智能手机型号建立定制的磁力地图(magnetic map)。新系统提供了强大的定位精度,而且与用于记录特征指纹1和定位的手机型号无关。在研究团队最近发布的论文中,通过实验证明这一工具与基于磁场定位的商业解决方案相比,精度显着提高。 ? ?图1:系统架构最新的室内定位系统利用了现代室内环境中经常出现的信号,如WiFi 和低功耗蓝牙信标。因为使用GPS 信号的外部定位方法不够精确,无法有效地进行室内导航。室内定位系统应该能够探测用户在建筑物内的位置,并指示用户如何在建筑物内导航。这些系统用于各种各样的场景当中。它们的设计和实现能够满足特定的用户需求。例如,在2017年,IBM 东京研究院为视障人士打造了一套实验性的高精度室内外语音导航系统。磁场法是一种低成本的方法,正越来越受欢迎,因为它不需要专门的传感器安装或维护,而是通过智能手机中已有的传感器来实现。然而,不同型号智能

人工智能语音篇文案

语音转写页面:(隶属于语音识别) 主标题:语音转写。 副标题:可将长段音频文件转为文字 按钮1:立即使用 按钮2: 查看文档 应用场景的文案: 1.会议和访谈记录: 将会议和访谈的音频转化为文字存稿,让后期的信息检索和整理更加方便快捷。 2.电话销售和客服: 将坐席通话转化成文字,帮助电话质量检查和信息同步,同时为数据挖掘提供原料基础。 3.视频字幕: 将视频中的音频文件进行语言转写,轻松生成与视频相对应的字幕文件。 参数说明的文案: 1.支持语种:中文普通话,英文,中英混合。 2.文件识别的大小限制为32MB。 3.支持语音的格式:采样率为16K,采样位数为16bit,单声道的wav语音。 支持平台的文案: 按钮1:REST API(短语音) 按钮2:REST API(长语音) 长语音转写页面:(隶属于语音识别) 主标题:长语音转写。 副标题:可将长段音频文件转化为文字。 按钮1:立即使用 按钮2:产看文档 应用场景的文案: 1.会议和访谈记录: 将会议和访谈的音频转化为文字存稿,让后期的信息检索和整理更加方便快捷。 2.电话销售和客服: 将坐席通话转化成文字,帮助电话质量检查和信息同步,同时为数据挖掘提供原料基础。 3.视频字幕: 将视频中的音频文件进行语言转写,轻松生成与视频相对应的字幕文件。 参数说明的文案: 1.支持语种:中文普通话,英文,中英混合。 2.文件识别的大小限制为32MB。 3.支持语音的格式:采样率为16K,采样位数为16bit,单声道的wav语音。 支持平台的文案: 按钮1:REST API(短语音) 按钮2:REST API(长语音) 普通语音合成页面(隶属于语音合成) 主标题:普通语音合成, 副标题:同花顺语音合成依托人工智能技术,为开发者 提供全面优质的文字转语音服务。支持中英双语及多种音色,合成语音自然流畅乎真人发声。可为智能助手、智能机器人、文学阅读等领域提供语音合成解决方案,让您的应用开口说话。 按钮1:免费试用 按钮2 :技术文档 功能体验的文案: 文本框:欢迎使用同花顺AI开放平台。 技术提供方按钮1:同花顺AI Lab 按钮2:同花顺优图 声音类型选择框:中英男声选择框:中文女声选择框:英文女生 语速放一个音量调节旋转按钮 按钮:播放 产品优势的文案 1.实时合成:支持普通话,英文,中英混杂的实时录入实时合成,随写随听。

智能语音小车软件毕业设计

本科毕业设计论文题目基于单片机的智能语音小车软件设计 专业名称 学生姓名 指导教师 毕业时间

毕业 任务书 一、题目: 《基于单片机的智能语音小车软件设计》 二、内容与重点: 1、目的与意义: 随着科技的发展,使计算机渗透进城市的血液,成为人类社会生活中密不可分的一部分。越来越多种类的计算机投入社会生产,如果在人们的社会生活中所接触到的计算机均使用不同的、自身特有的人机接口,就要求计算机使用者掌握多种计算机操作语言,这无疑成为人们使用计算机的一大障碍。因此人与计算机的沟通成为了摆在人类面前崭新的课题。通过语音识别,让小车能听懂人类语言,更好的实现人们的要求,彻底摆脱复杂的计算机语言和繁琐的输入方式是今后发展的一大方向。 2、设计任务: 通过毕业设计,使学生对所学电子工艺、传感器知识、电机控制技术、模电、数电、等电子基础课程的基本知识加深理解,在所学基础上,学习更高级单片机的基本指令及基本结构,并将其与实际工程应用紧密结合起来,培养创新意识,增强分析问题解决问题能力,为尽快进入社会角色,熟悉相关开发工作流程、项目小组组成、分工、合作方式方法等。增强团队合作意识,提高基本工作技能,为即将踏入社会奠定理论和实践基础。 要求:认真复习有关基础理论和技术知识,查阅参考资料,参照智能小车设计思想,设计一个可以按照预定语音控制命令动作的智能小车,运用所学单片机知识独立设计电路、自行焊接、调试,直至预期结果方可。要求实现:小车和在语音信号控制下自动实现启动、停止、左转、右转等功能。 (1)设计思路:在所学单片机知识的基础上,按照设计指标要求完成各功能模块方案论证、原理图设计、器件选型、印刷电路板制作、元器件焊装、软件编程设计 论文

人工智能语音解决方案

随着“一带一路“政策的开放,外交、贸易、旅游往来越来越频繁,国内B 端C端出海业务越来越多,AI智能语音翻译领域市场前景广阔。此次高交会的众多创新产品中,深圳贸人科技旗下多款AI智能语音翻译机,“科技感”十足。 Wooask AI 智能语音翻译机是第三届民企盛典指定翻译机品牌,外型时尚,机身小巧,方便携带,操作简单。功能震撼,拥有43种语言实时双向翻译,可连接蓝牙、WiFi/4G网络使用;系统搭载NMT神经网络,反应迅速,精准度更是高达97%。完美解决了出国旅游、商务洽谈等线下沟通难题。 在国家倡导的“一带一路”政策下,贸人科技线上线下一起发力,为语言畅通、贸易流通贡献自己的一份力量! 外贸神器,名至实归 打通线上沟通障碍,为“一带一路”积极赋能,它获得了联合国前秘书潘基文的认可! 我们不仅拥有像高交会、美国CES等国内外“展会约商”,还有“深圳”“曼谷”“纽约”等国内外“城市约商”。

兼具随身翻译、个人信息及朋友圈自动翻译、远程对话翻译、群聊翻译等功能,平台里有海量全球的客户…让您不懂外语也能做外贸,轻松无语言障碍找到并约见全球客户。 深圳市贸人科技有限公司作为面向全球的智能语音翻译解决方案提供商,自公司成立以来,一直专注于语音翻译引擎的研发和整合,基于翻译引擎及语音交互技术,研发了全球无语言障碍商务社交平台及翻译机等智能硬件产品。 目前公司形成了3大产品系列:Wooask APP平台、翻译机系列产品、软件定制开发,能为客户提供硬件方案(蓝牙、WIFI、WIFI+4G)、软件定制、云服务、产品集成等全方位的以语音翻译为核心的人工智能产品整体解决方案。 相信在贸人科技的努力下,在Wooask app 平台和Wooask AI智能语音翻译机助力下,全球语言畅通,贸易流通不久将实现!人工智能语音解决方案

车载导航人机语音交互系统的实现

引言 语音作为自然的人机接口,可以使车载导 航系统实现更安全、更人性化的操作。通过国 内外车载导航系统的功能对比可知,支持语音 交互是车载导航系统的一个发展趋势。另外, 市场信息服务公司J.D Power and Associates的 调研数据也表明,56%的消费者更倾向于选择 声控的导航系统。因此,开发车载语音导航系 统是很有意义的。目前,国内已经具备开发车 载语音导航系统的技术基础,特别是文语转换 TTS技术和基于中小词汇量的语音命令识别技 术已经达到比较实用的程度。本文在课题组的 车载导航系统和国内两款语音引擎的基础上,开发了一套支持语音交互的车载导航系统。车载语音导航系统 结构 车载语音导航系统 从功能上分为车载导航 和导航语音交互两方面。 其中车载导航功能包括 GPS卫星导航定位、电 子地图浏览查询、智能的路径规划、车辆地理位置和速度等导航信息的实时显示;导航语音交互功能分为语音操作和语音提示两部分。在系统的设计中,根据人机交互的需求,设计语音导航系统的硬件框架如图1所示。语音导航系统和用户之间的人机交互接口由触摸屏、按钮、话筒、显示屏和扩音器等五个交互设备组成。该硬件框架可实现常规的手 动交互方式,也可以实现语音交互方式。整个 系统划分为三个子系统:导航子系统、语音识别子系统和语音合成子系统,各子系统间通过接口进行通信,协调完成语音导航任务。车载导航人机语音交互系统对话模式设计导航系统的状态转换网络整个导航系统是一个复杂的人机交互系 车载导航人机语音交互系统的实现 Design and Implementation of Human-machine Speech Interaction in Vehicle Navigation 清华大学汽车安全与节能国家重点实验室 刘旺 杨殿阁 连小珉 摘要:支持语音交互是车载导航系统的一个发展趋势。本文讨论了 车载导航系统人机语音交互的实现方法,包括对话模式、关 键词识别、语音控制命令、名称识别、语音合成。试验结果 证明,系统能满足车载导航人机语音交互的要求。 关键词:车载语音导航;人机语音交互;语音识别;语音合成 图1 语音导航系统的 硬件框架图2 导航系统的状态转换网络

智能语音系统及其语音处理方法与设计方案

本技术实施例提出一种智能语音系统,包括蓝牙终端和智能设备;所述蓝牙终端包括麦克风阵列、语音预处理装置、第一传输装置和回放装置;所述智能设备包括第二传输装置和智能处理器;所述第一传输装置包括第一BLE通信装置和第一A2DP通信装置,所述第二传输装置包括第二BLE通信装置和第二A2DP通信装置;所述语音预处理装置和所述麦克风阵列相连,用于对所述麦克风阵列获取的第一音频信号进行预处理后通过所述第一BLE通信装置发送给所述第二BLE通信装置;所述回放装置与所述第一A2DP通信装置相连,用于通过所述第一A2DP通信装置接收所述第二A2DP通信装置发送的第二音频信号。可实现无延迟语音采集。 技术要求 1.一种智能语音系统,其特征在于,包括蓝牙终端和智能设备;所述蓝牙终端包括麦克风阵列、语音预处理装置、第一传输装置和回放装置;所述智能设备包括第二传输装置和 智能处理器;所述第一传输装置包括第一BLE通信装置和第一A2DP通信装置,所述第二传输装置包括第二BLE通信装置和第二A2DP通信装置;所述语音预处理装置和所述麦克风阵列相连,用于对所述麦克风阵列获取的第一音频信号进行预处理后通过所述第一BLE 通信装置发送给所述第二BLE通信装置;所述回放装置与所述第一A2DP通信装置相连,用于通过所述第一A2DP通信装置接收所述第二A2DP通信装置发送的第二音频信号。

2.根据权利要求1所述的智能语音系统,其特征在于,当所述第一A2DP通信装置与所述第二A2DP通信装置进行第二音频信号传输的同时,所述第一BLE通信装置与所述第二BLE 通信装置进行第一音频信号传输。 3.根据权利要求2所述的智能语音系统,其特征在于,所述智能语音系统进一步包括语音云服务器,所述语音云服务器与所述智能设备进行远程通信并获取智能设备发送的所述第一音频信号,用于对所述第一音频信号进行处理。 4.根据权利要求3所述的智能语音系统,所述语音云服务器和所述智能设备之间通过无线网络进行数据传输。 5.根据权利要求1所述的智能语音系统,其特征在于,所述麦克风阵列为模拟麦克风阵列或数字麦克风阵列,所述麦克风阵列包括1~8个麦克风。 6.根据权利要求1所述的智能语音系统,其特征在于,所述智能设备为智能手机、平板电脑、智能电视或智能机顶盒。 7.根据权利要求1~6任一所述的智能语音系统,其特征在于,所述语音预处理装置进一步包括: 唤醒装置,与所述麦克风阵列连接,用于唤醒所述语音预处理装置和第一传输装置; 降噪装置,连接在所述麦克风阵列和所述第一传输装置之间,用于对采集到的所述音频信号进行降噪处理; 波束形成装置,与所述麦克风阵列连接,用于加强特定方向的语音采集; 回声消除装置,连接在所述降噪装置和所述第一传输装置之间,用于对采集到的所述音频信号进行回声消除处理。 8.根据权利要求1~6任一所述的智能语音系统,其特征在于,所述智能设备进一步包括: 唤醒装置,用于唤醒所述语音预处理装置和第一传输装置; 降噪装置,用于对采集到的所述音频信号进行降噪处理;

智能语音自动化测试解决方案-Mario-06

易诚高科-智能语音自动化测试解决方案 ——提高智能语音产品质量,降低人为误差、提升测试管理水平 随着社会信息化的加快,智能产品的语音测试与问题定位需求剧增。为了提升测试效率,降低测试人员人为操作误差,最佳测试方式就是采用自动化测试。但由于智能产品的产品形态、语音反应、智能化操作等方面形式不尽相同,在自动化测试的前提下,问题的定位和状态断言的准确性就成为了一个新的挑战。 作为AIoT场景仿真服务商,易诚高科专注于为AIoT行业提供基于场景仿真的产品研发、测试、验收以及预认证等软硬结合的全栈式解决方案。在拥有1200+Lab仿真场景、2000+室外场景、1000万行业场景数据基础上,易诚高科充分理解智能语音产品自动化测试痛点和需求。依托人工智能和数字孪生技术,从应用、架构和用户体验三个维度出发,易诚高科推出了智能语音产品自动化测试解决方案及智能语音慧测仪Mario,帮助企业提高智能语音产品质量,降低人为误差、提升测试管理水平。 1.解决方案-慧测仪Mario的功能 整体架构由下而上依次分为多模态组件及算法、主控设备的各项管理模块、测试任务创建及管理、数据汇总及报告管理。产品在基础数据分析和整理的基础上,适用于各种智能语音产品的真实用户场景,将自动化、自由化与真实用户场景整合为一个统一的整体, 实现测试效率提升、测试数据准确、测试场景真实的三维综合效果。

图1Mario功能界面 如上图Mario的主要功能包含新增测试任务、测试报告记录、设备管理、产品管理、评级管理以及系统管理。其中 ●新增任务模块 分为自定义任务和场景任务两类,其中自定义任务分为唤醒任务、误唤醒任务、识别任务和链路任务,链路任务又分为语音交互和触控交互;场景任务分为场景任务管理和场景任务测试。每类新增任务的数据参数依据各自测试任务需求调整。 ●测试报告记录模块 记录报告模块是对所有测试结束的任务报告进行处理的管理模块,在该模块中,测试报告可实现详情查看、报告导出、按照之前报告的参数配置重复测试、删除等系列操作。 ●设备管理模块 设备管理模块是测试用多模态组件的管理模块,包含信息包含对多模态组件名称的自定义、电量展示、MAC地址信息、在线状态、设备类型、所关联的被测产品以及所属的测试空间信息,功能主要对多模态组件的增、删、查。 ●产品管理模块 产品管理为对被测试产品的管理,相关信息包含被测产品的品牌名称、功能分类、设备类型、产品名称及型号,以及对被测产品的增、删、改、查。

相关主题