[发明专利]一种AI智能式的语音交互方法在审

申请号：	201810185769.3	申请日：	2018-03-07
公开（公告）号：	CN108492824A	公开（公告）日：	2018-09-04
发明（设计）人：	王亚光	申请（专利权）人：	珠海市中粤通信技术有限公司
主分类号：	G10L15/22	分类号：	G10L15/22;G10L15/26;G10L15/06;G10L17/22
代理公司：	北京华仲龙腾专利代理事务所(普通合伙) 11548	代理人：	李静
地址：	519000 广东省珠海***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语音数据语音识别结果人机交互交互结果输出结果语义理解语音交互智能式接收语音数据人机交互系统有效地减少结果生成语义层面语音识别噪声语音有效地响应构建文本
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种AI智能式的语音交互方法，其特征在于，该方法包括如下步骤：

S1、接收语音数据；对所述语音数据进行语音识别，得到语音识别结果；

S2、根据预先构建的基于语义层面的判断模型对所述语音识别结果进行判断，得到模型输出结果；

S3、根据所述模型输出结果确定所述语音数据是否为人机交互语音数据；如果是，则对所述语音识别结果进行语义理解，根据语义理解结果生成交互结果，所述交互结果包括响应文本。

2.根据权利要求 1 所述的一种AI智能式的语音交互方法，其特征在于，在步骤S1中的语音识别的数据识别方法是：在识别过程中预先隔离噪音以及杂音。

3.根据权利要求 2所述的一种AI智能式的语音交互方法，其特征在于，所述方法还包括：按以下方式构建判断模型：确定判断模型拓扑结构；收集大量人机交互语音数据及其对应的语音识别文本；对所述语音识别文本中用户提问或回答语句文本进行分词，并以单轮回答或提问为单位，获取分词词串；提取所述分词词串中各词的语义特征，并标注判断结果；基于所述人机交互语音数据及其标注信息和分词词串中各词的语义特征，训练得到判断模型。

4.根据权利要求 3所述的一种AI智能式的语音交互方法，其特征在于，所述模型拓扑结构采用RNN模型，包括输入层、中间隐层和输出层；所述输入层的输入包括：语音识别文本包含每个词的语义特征；所述输出层的输出包括：判断结果。

5.根据权利要求 4所述的一种AI智能式的语音交互方法，其特征在于，所述输入层的输入还包括：语音识别文本的对话历史状态特征，所述对话历史状态特征包括：上一轮交互的响应文本信息，及上一轮交互语音识别文本对信息槽的填充情况。

6.根据权利要求5所述的一种AI智能式的语音交互方法，其特征在于，在对所述语音数据进行语音识别之前，对所述语音数据进行提示语检测；如果检测到提示语，则执行对所述语音数据进行语音识别的步骤；如果未检测到提示语，则判断接收的语音数据与上次用户交互的时间间隔是否超过预设时间；如果否，则执行对所述语音数据进行语音识别的步骤。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于珠海市中粤通信技术有限公司，未经珠海市中粤通信技术有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201810185769.3/1.html，转载请声明来源钻瓜专利网。

上一篇：一种语音点歌交互系统及语音点歌交互方法
下一篇：一种语音识别的启动方法、头戴式设备及语音识别系统

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L15-00 语音识别
G10L15-02 .语音识别的特征提取；识别单位的选择
G10L15-04 .分段或字极限检测
G10L15-06 .创建基准模板；训练语音识别系统，例如对说话者声音特征的适应
G10L15-08 .语音分类或检索
G10L15-20 .专门适用于不利环境

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种AI智能式的语音交互方法在审

专利文献下载