产品创建常见问题

产品创建

Q1. DUI的产品接入有什么需要提前准备的吗?

A:在使用DUI的产品接入功能前,您需要做如下两部分准备:

1.  线下的准备工作:您可以花几分钟阅读使用DUI系统平台进行开发人工智能产品前需要准备什么?,了解语音设备生产的流程和环节;

2. 控制台操作准备:在控制台进行产品接入前,您可以按照如下步骤来完成控制台操作准备,如下图:


其中,各步骤说明和操作链接如下表:

步骤
说明
1 注册账号 您需要注册可在控制台上使用的思必驰账号,如果有,可以跳过这一步,或者您可以使用第三方账号登录(我可以用第三方账号登录吗);
2 实名认证

您的账号需要进行实名认证,才能体验DUI提供的完整的功能,如发布产品等。(了解 为什么要实名认证?)

3 创建项目组

如果您是团队开发者,您还需要创建项目组或者加入项目组

如果您是个人开发者,您可以跳过此步骤。

4 准备创建产品

在创建产品前,您可以先了解:

  1. 如何选择产品类型
  2. 在控制台开发产品的流程
  3. 如何开发产品的语音交互系统

在接入时,如有任何问题,您可以通过提交工单的方式联系我们。

Q2. 为什么要在控制台创建产品,直接用SDK集成不可以吗?

A:如果您要为您的设备或应用开发语音交互系统,则需要分别完成“云端配置”和客户端的“SDK集成”,分别在两端完成开发后,再进行系统性的集成后即可使用,就像手机APP的开发过程中需要分别在服务端和客户端的完成开发,然后联调发布一样,最终一起生效;

云端的配置需要在控制台上完,并且需要依赖客户端来执行:如针对设备录音监听、音量的控制、控制类的快捷唤醒词等,需要先在云端完成配置,然后通过SDK集成在客户端上生效;

除此以外,您在控制台上创建和设备/应用对应的产品,还有如下用途:

1)在DUI控制台上创建产品可以获取SDK集成时所需的资源和字段值,具体如下

  - productId,产品ID,创建产品后生成;

  - aliasKey,产品已发布版本所在的分支,

  - AuthType,控制台配置的授权方式;

  - apiKey,授权凭证,在控制台上申请;

  -  productKey,用于设备注册请求签名,产品创建后生成;

  - productSecret,用于设备注册请求签名,产品创建后生成;

 2)在控制台发布产品后,可下载产品资源文件,即可选内置资源包,开发者预置具备完整功能的资源包,从而避免终端用户在第一次使用时需要花时间和流量去下载全量升级包的尴尬场面;

3)在DUI控制台上可以对开发的内容进行系统性的管理:对创建的语音交互产品进行版本管理、分支管理、开发进度管理、开发进度追踪等;

4)对授权的设备进行记录和管理;

5)同时,DUI系统还支持多人系统共同开发一个产品,并且实时记录操作数据的变动,便于您掌握开发进度和定位开发中出现的问题。

Q3. 什么是全链路技术

A:了解什么是全链路技术,首先就要了解语音交互过程。

完整的语音交互过程由声音采集、前端信号处理、语音唤醒、语音识别、语义理解、智能对话、资源调用、回复内容生成、动作执行、合成音播报等重要环节构成,如下图:

image2019-3-19_9-31-7.png

而DUI提供的全链路语音技术,包含完整语音交互过程中需要的全部语音技术,以场景服务为基础,针对智能家居、车载、机 器人、微信、客服、APP 等泛物联网领域,支持自由调用图文、列表、音乐、内嵌网页等多种控件。

在DUI控制台上接入全链路语音技术服务,从语音语言技术到对话管理、技能服务、交互界面均可以定制,应用完备的语音交互技术为您的设备或应用生产语音交互系统。

Q4. 什么是单项技术,有哪些可以接入?

A:单项技术是指在语音交互过程中,只提供一种语音能力的语音技术,如:语音识别,只提供将传入的声音信息转化为文字信息的服务。

思必驰DUI开放平台目前开放的单项技术有:
1)语音识别(Automatic Speech Recognition,ASR),将采集到的语音转化成文字,赋予设备或应用“听懂”用户说话的能力。
2)语音合成(Text to Speech,TTS),将文字信息转化为声音信息,赋予设备或应用“说话”的能力。
3)语音唤醒 (VoiceWake up),通过不间断侦测语音,检测到出现设置的唤醒词的语音时,可执行相关事件。

DUI开放的单项技术支持的操作系统和运行环境如下表:

 

 

Q5. 我在控制台创建产品时怎么选择产品类型?

A:在控制台创建产品时,您可以选择创建全链路产品或者单项技术产品

DUI的全链路产品使用了全链路语音技术,从而将整个语音交互全过程链接起来。全链路技术主要指打包为一体的语音交互链条上所需的语音技术,包含信号采集、前端信号处理、语音唤醒、语音识别、语义理解、对话管理、资源调用、自然语言生成和合成音等在内。

DUI的单项技术产品可根据需要接入识别、唤醒、合成三种语音技术中的一种或几种。单项技术是指在语音交互过程中,只提供一种语音能力的语音技术,如:语音识别只提供语音转文本的能力,而语音合成只提供将文字信息转化为声音信息的能力。

如果您的产品需要使用语音交互过程中涉及的所有语音技术,则可以在控制台接入全链路产品;

如果您的产品只需要接入合成、识别、唤醒 等单项语音技术,则可以在控制台接入单项技术产品。

您在控制台开发产品版本时,可以根据产品语音功能需求和应用场景选择使用全链路技术还是单项技术:

  1. 选择全链路技术后,直接选择操作系统,目前支持Android,iOS,嵌入式,和server;

  2. 如果选择单项技术,则还需要选择单项技术的类型:识别/合成/唤醒,支持多选;之后在选择操作系统,目前支持Android,ios,嵌入式,和server。

Q6. 没有我想要的行业模板怎么办?

A:在DUI开放平台,行业模板是指立足于具体的行业或场景,针对目标用户的需求,定制了技能、合成音、唤醒词、退出提示、识别引擎等多个配置的通用解决方案 ;如 DUI kids,就是一款针对儿童场景定制的软硬一体解决方案,使用了环麦硬件模组,接入全链路语音技术,提供优质儿童内容资源(预置儿歌、故事、国学、诗词、成语、翻译、音乐等精品技能),覆盖益智教育、有声娱乐、陪伴闲聊等多个儿童场景,故事机、儿童平板、陪伴机器人等用于儿童方面的语音产品就可以使用这款通用解决方案。

在控制台使用行业模板还有如下作用:

  1. 如果您创建的是全链路语音产品,且您希望能够快速完成控制台开发部分,您在产品时可以选择以行业模板方式创建,即按照行业模板内容生成产品的语音交互系统的数据。
  2. 行业模板预置的技能由DUI系统进行维护和更新,保持技能的内容丰富度和竞争力,您无需花费时间对该部分技能进行额外的维护;
  3. 更新行业模板后,使用该行业模板的产品会同步收到更新,您可以根据需要进行选择,快速完成产品版本迭代。

如果在控制台没有找到适合的行业模板,您可以通过如下方式获取符合要求:

  1. 提交工单
  2. 商务合作 

 

Q7. 目前哪些功能支持离线?

A:语音系统交互过程包含:声音信号采集,信号处理,唤醒,识别,语义解析,对话管理、资源调用、生成回复,动作执行、语音合成等几个环节,所有环节都能在离线环境下进行。

比如:

在资源调用环节,可以使用web API,也可以使用本地的API ;

在识别和合成环节,可以接入本地语音识别技术和本地合成音;

需要注意的是:

 

使用DUI提供的语音技术服务需要先进行授权,而不同授权方式,对网络的要求不一样,您需要根据设备使用场景、产线情况以及网络情况,来选择您所需的授权方式。(了解授权方式的区别

 

目录

Q1.DUI的产品接入有什么需要提前准备的吗?

Q2. 为什么要在控制台创建产品,直接用SDK集成不可以吗?

Q3. 什么是全链路技术

Q4. 什么是单项技术,有哪些可以接入?

Q5. 我在控制台创建产品时怎么选择产品类型?

Q6. 没有我想要的行业模板怎么办?

Q7. 目前哪些功能支持离线?