[发明专利]语音交互方法和装置有效
| 申请号: | 201711138106.8 | 申请日: | 2017-11-16 |
| 公开(公告)号: | CN107909995B | 公开(公告)日: | 2021-08-17 |
| 发明(设计)人: | 韩晋;王晗;高雪 | 申请(专利权)人: | 北京小米移动软件有限公司 |
| 主分类号: | G10L15/00 | 分类号: | G10L15/00;G10L17/00;G06F16/332 |
| 代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 杨贝贝;刘芳 |
| 地址: | 100085 北京市海淀区清河*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 语音 交互 方法 装置 | ||
本公开是关于一种语音交互方法和装置,该方法包括:获取用户的语音信息中的第一模糊发音;根据预设模糊发音与预设标准发音之间的对应关系,将所述第一模糊发音转换为对应的标准发音;控制语音交互终端根据转换后的标准发音与所述用户进行语音交互。本公开能够识别用户的模糊发音并进行智能补偿,获取标准发音,从而保证语音交互终端能够为用户提供更加准确的信息,提高人机语音交互的体验。
技术领域
本公开涉及通信领域,尤其涉及语音交互方法和装置。
背景技术
随着智能终端的发展,具有语音交互功能的儿童故事机在低龄儿童消费者中受到普遍欢迎。儿童故事机不仅可以播放歌曲、故事等,还可以通过语音智能识别功能识别语言,并与儿童进行交流。例如,小朋友对故事机说:“讲故事”,故事机问小朋友:“小朋友,你想听什么故事?”小朋友说:“白雪公主”,则故事机开始播放白雪公主的故事。
发明内容
为克服相关技术中存在的问题,本公开提供一种语音交互方法和装置。
根据本公开实施例的第一方面,提供一种语音交互方法,包括:
获取用户的语音信息中的第一模糊发音;
根据预设模糊发音与预设标准发音之间的对应关系,将所述第一模糊发音转换为对应的标准发音;
控制语音交互终端根据转换后的标准发音与所述用户进行语音交互。
一个实施例中,所述获取用户的语音信息中的第一模糊发音,包括:
获取所述语音信息中携带的用户声纹,并根据所述用户声纹确定所述用户的身份;
若所述用户的身份为目标身份,则获取所述用户的语音信息中的第一模糊发音。
一个实施例中,所述根据所述用户声纹确定所述用户的身份,包括:
获取所述用户声纹与预存声纹之间的相似度;
若所述相似度大于预设阈值,则确定所述用户的身份为所述预存声纹所对应的预存身份。
一个实施例中,在所述目标身份为儿童身份的情况下,在获取所述用户声纹与预存声纹之间的相似度之前,所述方法还包括:
输出第一提示信息,所述第一提示信息用于提示家长引导儿童发出目标语音;
在儿童发出所述目标语音的情况下,采集所述目标语音中携带的儿童声纹,记录所述儿童声纹与儿童身份之间的对应关系,其中,所述预存声纹包括所述儿童声纹,所述预存身份包括所述儿童身份。
一个实施例中,所述方法还包括:
输出第二提示信息,所述第二提示信息用于提示所述用户复述所述语音交互终端播放的预设标准发音;
在所述用户复述所述语音交互终端播放的预设标准发音时,采集并识别所述预设模糊发音;
建立所述预设模糊发音与所述预设标准发音之间的对应关系。
一个实施例中,所述方法还包括:
在所述用户与语音交互终端交流时,获取所述用户的第二模糊发音和所述第二模糊发音对应的矫正发音;
根据所述第二模糊发音和所述第二模糊发音对应的矫正发音校验所述对应关系的准确度。
一个实施例中,所述方法还包括:
在所述语音交互终端待机时,在预设的关键词范围内识别所述用户的第三模糊发音和所述第三模糊发音对应的矫正发音;
根据所述第三模糊发音和所述第三模糊发音对应的矫正发音更新所述对应关系。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京小米移动软件有限公司,未经北京小米移动软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711138106.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:润滑油基础油的制造方法
- 下一篇:用于处理合成气的方法和系统





