[发明专利]语音指令检测模型构建方法、检测方法及系统、人机交互方法及设备有效

专利信息
申请号: 201610615977.3 申请日: 2016-07-29
公开(公告)号: CN107665704B 公开(公告)日: 2020-09-11
发明(设计)人: 吴奎;陈凌辉;黄鑫;陈志刚;王智国;胡郁;刘庆峰 申请(专利权)人: 科大讯飞股份有限公司
主分类号: G10L15/06 分类号: G10L15/06;G10L25/48;G06F3/16;G06F40/30
代理公司: 北京维澳专利代理有限公司 11252 代理人: 赵景平;宋少华
地址: 230088 安徽省*** 国省代码: 安徽;34
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 语音 指令 检测 模型 构建 方法 系统 人机交互 设备
【说明书】:

发明公开了一种语音指令检测模型构建方法,该方法包括:确定语音指令检测模型的拓扑结构;收集大量人机交互的语音数据及其对应的识别文本;对所述识别文本中用户提问或回答语句文本进行分词,并以单轮回答或提问为单位,获取分词词串;对所述分词词串中的每个词,依据对话历史信息,依次对各词进行语音指令结束点赋值,并标注业务类别、以及信息槽或状态槽;利用所述识别文本及其赋值信息和标注信息,训练得到语音指令检测模型的参数。本发明还公开了一种语音指令检测方法及系统、以及一种人机交互方法及设备。本发明可以提高语音指令点检测的准确性,进而提高人机交互过程中机器响应的成功率及响应速度。

技术领域

本发明涉及语音信号处理、人机交互领域,具体涉及一种语音指令检测模型构建方法、一种语音指令检测方法及系统、以及一种人机交互方法及设备。

背景技术

随着人工智能技术的进步,人机语音交互也取得了长足的发展,各种语音助手APP和人机交互机器人大肆兴起。这些语音助手和机器人与用户进行交互的流程通常如下:

(1)通过语音或者设定操作进行唤醒;

(2)通过语音数据的停顿时长判断用户是否说完;

(3)检测到用户说完后,将识别结果传入语义理解引擎,进行语义理解;

(4)根据语义理解结果,系统做出响应。

现有交互系统中,仅通过语音数据的停顿时长检测语音指令的结束点,确定交互指令是否完整,为此需要设定停顿时长阈值,判断应用是否说完,即根据语音数据的停顿时长是否大于阈值来确定语音指令结束点的位置,得到相应语音指令后,进行语音识别及自然语言理解,给出相应反馈。这种设定硬性阈值的方式会导致由于语音指令内部的长停顿导致语音指令被截断的情况,严重影响语音识别及语义理解;此外,当语音数据中存在噪声等干扰因素时,很难准确检测到语音数据的停顿位置,造成语音指令结束点检测产生较大延迟,严重影响用户体验。

发明内容

针对上述现有技术通过语音数据的停顿时长进行语音指令结束点检测存在的问题,本发明一方面提供一种语音指令检测模型构建方法、以及一种基于语音指令检测模型的语音指令检测方法及系统,以避免由于语音指令内部的长停顿导致语音指令被截断的问题,并防止噪声等干扰因素对语音指令结束点检测的影响。

本发明另一方面提供一种人机交互方法及设备,以提高人机交互过程中机器响应的成功率及响应速度。

为此,本发明实施例提供如下技术方案:

一种语音指令检测模型构建方法,包括:

确定语音指令检测模型的拓扑结构;

收集大量人机交互的文本数据作为训练数据;

对所述训练数据中用户提问或回答语句文本进行分词,并以单轮回答或提问为单位,获取分词词串;

对所述分词词串中的每个词,依据对话历史信息,依次对各词进行语音指令结束点赋值,并标注业务类别、以及信息槽或状态槽,所述信息槽表示业务当前所包含的信息单元,所述状态槽表示业务当前的状态信息;

利用所述训练数据及其赋值信息和标注信息,训练得到语音指令检测模型的参数。

优选地,所述语音指令检测模型的拓扑结构采用RNN模型,包括输入层、中间隐层和输出层;

所述输入层的输入包括:当前词的词向量wn(t)、截止到上一个词的隐层向量h(t-1)、对话历史信息,其中,所述对话历史信息包括:截止到上一个词的业务分类信息c(t-1)、以及信息槽填充情况s(t-1)或状态槽填充情况st(t-1);所述输出层的输出包括:检测结果p(t),所述检测结果p(t)具体为当前词为语音指令结束点的概率得分、或者为表征当前词是否为语音指令结束点的数值。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201610615977.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top