[发明专利]一种AI智能式的语音交互方法在审
| 申请号: | 201810185769.3 | 申请日: | 2018-03-07 |
| 公开(公告)号: | CN108492824A | 公开(公告)日: | 2018-09-04 |
| 发明(设计)人: | 王亚光 | 申请(专利权)人: | 珠海市中粤通信技术有限公司 |
| 主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/26;G10L15/06;G10L17/22 |
| 代理公司: | 北京华仲龙腾专利代理事务所(普通合伙) 11548 | 代理人: | 李静 |
| 地址: | 519000 广东省珠海*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 语音数据 语音识别结果 人机交互 交互结果 输出结果 语义理解 语音交互 智能式 接收语音数据 人机交互系统 有效地减少 结果生成 语义层面 语音识别 噪声语音 有效地 响应 构建 文本 | ||
1.一种AI智能式的语音交互方法,其特征在于,该方法包括如下步骤:
S1、接收语音数据;对所述语音数据进行语音识别,得到语音识别结果;
S2、根据预先构建的基于语义层面的判断模型对所述语音识别结果进行判断,得到模型输出结果;
S3、根据所述模型输出结果确定所述语音数据是否为人机交互语音数据;如果是,则对所述语音识别结果进行语义理解,根据语义理解结果生成交互结果,所述交互结果包括响应文本。
2.根据权利要求 1 所述的一种AI智能式的语音交互方法,其特征在于,在步骤S1中的语音识别的数据识别方法是:在识别过程中预先隔离噪音以及杂音。
3.根据权利要求 2所述的一种AI智能式的语音交互方法,其特征在于,所述方法还包括:按以下方式构建判断模型:确定判断模型拓扑结构;收集大量人机交互语音数据及其对应的语音识别文本;对所述语音识别文本中用户提问或回答语句文本进行分词,并以单轮回答或提问为单位,获取分词词串;提取所述分词词串中各词的语义特征,并标注判断结果;基于所述人机交互语音数据及其标注信息和分词词串中各词的语义特征,训练得到判断模型。
4.根据权利要求 3所述的一种AI智能式的语音交互方法,其特征在于,所述模型拓扑结构采用RNN模型,包括输入层、中间隐层和输出层;所述输入层的输入包括:语音识别文本包含每个词的语义特征;所述输出层的输出包括:判断结果。
5.根据权利要求 4所述的一种AI智能式的语音交互方法,其特征在于,所述输入层的输入还包括:语音识别文本的对话历史状态特征,所述对话历史状态特征包括:上一轮交互的响应文本信息,及上一轮交互语音识别文本对信息槽的填充情况。
6.根据权利要求5所述的一种AI智能式的语音交互方法,其特征在于,在对所述语音数据进行语音识别之前,对所述语音数据进行提示语检测;如果检测到提示语,则执行对所述语音数据进行语音识别的步骤;如果未检测到提示语,则判断接收的语音数据与上次用户交互的时间间隔是否超过预设时间;如果否,则执行对所述语音数据进行语音识别的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于珠海市中粤通信技术有限公司,未经珠海市中粤通信技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810185769.3/1.html,转载请声明来源钻瓜专利网。





