DUI系统是什么

基于语音的人机交互,一直都是带着神秘的面纱,给广大需要使用这个能力的设备、应用的开发者带来不少的困惑,为了让大家能比较容易为设备进行语音赋能,思必驰基于自己近十多年的深度研发,基于全链路语音技术推出DUI平台,DUI语音系统,旨在为大家降低进入门槛,为您的设备、应用赋能语音交互能力,给您服务用户带来全新的体验。

那什么是DUI平台呢,DUI即(Dialog User Interface)是为设备赋能语音交互场景开发配置平台,通过这个定制系统您可以完成给您的硬件、设备、手机APP等产品增加语音交互场景!!

在这个过程中为开发者提供高可用定制的人机对话技术服务,为智能终端开发者提供核心交互能力,协助传统设备实现智能升级。

通过DUI开放平台的能力,为您的赋能后,您的用户就能:

  1. 用语音控制设备来播放音乐、查询天气及最新新闻,获取最新的交通情况以及通用知识询问;
  2. 用语音来设置闹钟、提醒;
  3. 用语音来获取服务,如叫车、订外卖等。

 

DUI 致力于构建以场景服务为基础,针对智能家居、车载、机 器人、微信、客服、APP 等泛物联网领域,以用户为中心的自由人机交互系统,支持自由调用图文、列表、音乐、内嵌网页等多种控件,提供从唤醒、语音识别、 语义理解到对话管理、内容输出、TTS 播报的全链路技术的超高度定制;基于“云+端”的整体实现方案和完整的开发者服务,以对话(Dialog)为核心,从语音语言技术到对话管理、技能服务、交互界面均可以定制,VUI(Voice User Interface)——语音用户界面和GUI——图形用户界面(Graphical User Interface)的相辅相成,完成“语音+触控”的完美结合。 

众所周知,整个语音交互过程涉及从声音采集、前端信号处理、语音唤醒、语音识别、语义理解、智能对话、资源调用、回复内容生成、动作执行、合成音播报的主要环节,DUI系统支持整个全链路的语音技术使用,也支持其中某个或某几个环节,如语音唤醒、语音识别的单独使用或一两个联合使用。

 

看到这里,现在应该知道什么是DUI了吧,为了让您更能顺利的完成使用DUI系统为您的设备完成赋能语音交互能力,接下来看看我们在看看基于DUI系统怎么实现这个赋能语音能的过程呢。

在展开说明前需要先了解以下方面的关系:

1、云端和设备端的关系

(1)如果您开发的是涉及设备的则需要分别完成“云端配置”和客户端的“SDK集成”,分别在两端完成开发后,然后集成后即可使用,就像手机APP的开发过程中一样,分别在服务端和客户端的完成开发,然后联调发布一样,最终一起生效;

(2)部分云端的配置需要依赖客户端来执行,如针对设备录音监听、音量的控制、控制类的快捷唤醒词,则需要在云端完成配置,然后通过SDK集成在客户端上生效;

(3)如果不涉及客户端部分,主要是部分语音技术,则可以通过Sever方式完成对接。

2、鉴授权的关系

(1)通过DUI使用思必驰的语音能力时需要通过鉴授权,因为在开发环节每天会有免费的用量,在大规模商用时则需要提前购买用量,以便能有效的服务好您的用户;

(2)基于接入的方式的不同,DUI支持多种鉴授权方式 。

3、产品和技能的关系

(1)人机交互是一个复杂的对话流程,为了让整个定制过程更简单高效,在DUI平台上分别通过产品和技能来实现;

(2)“技能”是指在特定领域内的用户特定需求通过语音对话的方式来满足的过程,用户仅通过语音就可以完成,是模拟用户实际生活中的对话场景,用户与技能交互时,就像与人交互一样自然,可以理解为一个APP上的功能,如果地图APP,具有导航功能一样,通过语音对话即可完成一个或者多个特定功能,如:导航技能,可以通过编写语义对话完成地址查询与设置、路线规划、周边搜索、导航等功能。

(3)“产品”可以理解为一个场景,或者叫BOT,在一个“产品”中,我们可以通过给这个产品配置多个技能,使得这个“产品”能力丰富,同时在产品中还能配置语音识别模型、前端信号处理、语音唤醒词(主唤醒词、快捷唤醒词)、语音唤醒高级阈值训练、合成音配置、智能家居使用开关、有屏设备的UI样式、退出对话的说法及对应的播报、错误时的重试次数、错误(识别为空、语义理解为空、超出重试次数退出)的播报。

4、版本与生效的关系

(1)在控制台开发配置的内容可以理解为云端配置,云端配置需要创建版本,按照版本来生效;

(2)每个版本生效涉及训练的过程,只有通过训练才能让产品配置的识别引擎、选择的技能等部分进行融合生效;

(3)产品的版本资源生效后,需要基于集成SDK的客户端来完成更新,更新后才能完整生效。

通过上述的了解,那接下来则可以开始您的硬件赋能之旅,马上开始你的定制吧!