[发明专利]语音交互设备唤醒词生成方法及装置有效
| 申请号: | 201810550875.7 | 申请日: | 2018-05-31 |
| 公开(公告)号: | CN108766420B | 公开(公告)日: | 2021-04-02 |
| 发明(设计)人: | 刘馨靖 | 申请(专利权)人: | 中国联合网络通信集团有限公司 |
| 主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/30 |
| 代理公司: | 北京天昊联合知识产权代理有限公司 11112 | 代理人: | 彭瑞欣;汪源 |
| 地址: | 100033 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 语音 交互 设备 唤醒 生成 方法 装置 | ||
本公开提供一种语音交互设备唤醒词生成方法,其包括如下步骤:服务器端预先存储至少一个语音交互数据集合,以及每个语音交互数据集合对应的唤醒词,将各个语音交互数据集合作为输入,将其各自对应的唤醒词作为输出,采用深度学习算法进行训练,以得到唤醒词模型;接收用户端发送的预设时间段内用户的语音交互数据并输入至唤醒词模型以得到对应的唤醒词,然后向用户端发送所述唤醒词,以使用户端向用户推送所述唤醒词。相应地,提供一种语音交互设备唤醒词生成装置。本公开能为不同用户提供差异化的语音唤醒服务,极大地提升了用户体验,还能加快语音交互技术的发展。
技术领域
本公开涉及语音识别技术领域,具体涉及一种语音交互设备唤醒词生成方法,以及一种语音交互设备唤醒词生成装置。
背景技术
语音识别技术,也被称为自动语音识别(Automatic Speech Recognition,ASR),其目标是将人类发出的语音中的词汇内容转换为计算机可读的输入信息,例如按键、二进制编码或者字符序列。随着语音识别技术的快速发展,语音交互设备已大规模投入商用。语音交互逐渐成为了新一代广泛应用的交互模式。
目前,语音交互设备的交互模式通常为通过唤醒词来开启与用户之间的交流。
然而,发明人发现,现有的语音交互技术方案通常为通过固定的唤醒词来开启语音交互服务。个别的也有通过识别交互设备场景从而生成固定唤醒词的方案。但由于用户间存在很大的差异性,人与人的需求不同,所需交互的内容也不尽相同,固定的唤醒词往往导致用户的体验不佳。
因此,如何生成符合用户习惯的唤醒词成为本领域亟待解决的技术问题,并对提高用户体验,加快语音交互的发展起着关键性作用。
发明内容
为了至少部分解决现有技术中存在的技术问题而完成了本公开。
解决本公开技术问题所采用的技术方案是:
根据本公开的一个方面,提供了一种语音交互设备唤醒词生成方法,其包括如下步骤:
服务器端预先存储至少一个语音交互数据集合,以及每个所述语音交互数据集合对应的唤醒词;
所述服务器端将各个所述语音交互数据集合作为输入,将其各自对应的唤醒词作为输出,采用深度学习算法进行训练,以得到唤醒词模型;
所述服务器端接收用户端发送的预设时间段内用户的语音交互数据;
所述服务器端将其从所述用户端接收的所述语音交互数据输入至所述唤醒词模型以得到对应的唤醒词,并向所述用户端发送所述唤醒词,以使所述用户端向所述用户推送所述唤醒词。
可选地,在所述服务器端预先存储至少一个语音交互数据集合,以及每个所述语音交互数据集合对应的唤醒词的步骤之后还包括如下步骤:
所述服务器端对每个所述语音交互数据集合进行预处理,以去掉每个所述语音交互数据集合中的无意义词汇,并对每个所述语音交互数据集合中的各条语音交互数据进行分词处理;
则所述服务器端将各个所述语音交互数据集合作为输入的步骤相应为:
所述服务器端将预处理后的各个所述语音交互数据集合作为输入。
可选地,所述服务器端将预处理后的各个所述语音交互数据集合作为输入,将其各自对应的唤醒词作为输出,采用深度学习算法进行训练,以得到唤醒词模型的步骤具体包括:
所述服务器端根据预处理后的各个所述语音交互数据集合及其各自对应的唤醒词,分别构建语音交互数据词典和唤醒词词典;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国联合网络通信集团有限公司,未经中国联合网络通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810550875.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于深度学习的非常态语音区别方法
- 下一篇:语音交互的方法及装置





