[发明专利]语音交互设备唤醒词生成方法及装置有效
申请号: | 201810550875.7 | 申请日: | 2018-05-31 |
公开(公告)号: | CN108766420B | 公开(公告)日: | 2021-04-02 |
发明(设计)人: | 刘馨靖 | 申请(专利权)人: | 中国联合网络通信集团有限公司 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/30 |
代理公司: | 北京天昊联合知识产权代理有限公司 11112 | 代理人: | 彭瑞欣;汪源 |
地址: | 100033 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 交互 设备 唤醒 生成 方法 装置 | ||
1.一种语音交互设备唤醒词生成方法,其特征在于,包括如下步骤:
服务器端预先存储至少一个语音交互数据集合,以及每个所述语音交互数据集合对应的唤醒词;
所述服务器端将各个所述语音交互数据集合作为输入,将其各自对应的唤醒词作为输出,采用深度学习算法进行训练,以得到唤醒词模型;
所述服务器端接收用户端发送的预设时间段内用户的语音交互数据;
所述服务器端将其从所述用户端接收的所述语音交互数据输入至所述唤醒词模型以得到对应的唤醒词,并向所述用户端发送所述唤醒词,以使所述用户端向所述用户推送所述唤醒词;
在所述服务器端预先存储至少一个语音交互数据集合,以及每个所述语音交互数据集合对应的唤醒词的步骤之后还包括如下步骤:
所述服务器端对每个所述语音交互数据集合进行预处理,以去掉每个所述语音交互数据集合中的无意义词汇,并对每个所述语音交互数据集合中的各条语音交互数据进行分词处理;
则所述服务器端将各个所述语音交互数据集合作为输入的步骤相应为:
所述服务器端将预处理后的各个所述语音交互数据集合作为输入;
所述服务器端接收所述用户端发送的预设时间段内用户的语音交互数据的步骤还包括:
所述服务器端接收所述用户端发送的用户端标识;
则所述服务器端向所述用户端发送所述唤醒词的步骤相应为:
所述服务器端根据所述用户端标识向与之对应的所述用户端发送所述唤醒词。
2.根据权利要求1所述的生成方法,其特征在于,
所述服务器端将预处理后的各个所述语音交互数据集合作为输入,将其各自对应的唤醒词作为输出,采用深度学习算法进行训练,以得到唤醒词模型的步骤具体包括:
所述服务器端根据预处理后的各个所述语音交互数据集合及其各自对应的唤醒词,分别构建语音交互数据词典和唤醒词词典;
所述服务器端根据所述语音交互数据词典,将预处理后的各个所述语音交互数据集合中每条语音交互数据转换为一个向量,从而将每个所述语音交互数据集合转换为一个向量集合,以及根据所述唤醒词词典,将每个所述语音交互数据集合对应的所述唤醒词转换为一个唤醒词向量;
所述服务器端将每个所述向量集合作为一次输入,将其对应的唤醒词向量作为输出,采用神经网络算法对所有所述向量集合进行迭代训练,从而得到所述唤醒词模型。
3.根据权利要求1或2所述的生成方法,其特征在于,
在所述服务器端接收用户端发送的预设时间段内用户的语音交互数据的步骤之后还包括如下步骤:
所述服务器端对其从所述用户端接收的所述语音交互数据进行预处理,以去掉所述语音交互数据中的无意义词汇并进行分词处理;
则所述服务器端将其从所述用户端接收的所述语音交互数据输入至所述唤醒词模型以得到对应的唤醒词的步骤相应为:
所述服务器端将其从所述用户端接收并经过预处理的所述语音交互数据输入至所述唤醒词模型以得到对应的唤醒词。
4.根据权利要求1或2所述的生成方法,其特征在于,
在所述服务器端向所述用户端发送所述唤醒词的步骤之后还包括如下步骤:
所述服务器端通过所述用户端接收所述用户发送的唤醒词反馈信息,所述唤醒词反馈信息包括唤醒词确认信息和唤醒词修正信息;
所述服务器端在接收到所述唤醒词确认信息时,保持所述唤醒词不变;
所述服务器端在接收到所述唤醒词修正信息时,继续通过所述用户端接收所述用户发送的新唤醒词,并将其对应的原唤醒词替换为所述新唤醒词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国联合网络通信集团有限公司,未经中国联合网络通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810550875.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于深度学习的非常态语音区别方法
- 下一篇:语音交互的方法及装置