[发明专利]语音交互方法和装置有效

申请号：	201711138106.8	申请日：	2017-11-16
公开（公告）号：	CN107909995B	公开（公告）日：	2021-08-17
发明（设计）人：	韩晋;王晗;高雪	申请（专利权）人：	北京小米移动软件有限公司
主分类号：	G10L15/00	分类号：	G10L15/00;G10L17/00;G06F16/332
代理公司：	北京同立钧成知识产权代理有限公司 11205	代理人：	杨贝贝;刘芳
地址：	100085 北京市海淀区清河***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语音交互方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本公开是关于一种语音交互方法和装置，该方法包括：获取用户的语音信息中的第一模糊发音；根据预设模糊发音与预设标准发音之间的对应关系，将所述第一模糊发音转换为对应的标准发音；控制语音交互终端根据转换后的标准发音与所述用户进行语音交互。本公开能够识别用户的模糊发音并进行智能补偿，获取标准发音，从而保证语音交互终端能够为用户提供更加准确的信息，提高人机语音交互的体验。

技术领域

本公开涉及通信领域，尤其涉及语音交互方法和装置。

背景技术

随着智能终端的发展，具有语音交互功能的儿童故事机在低龄儿童消费者中受到普遍欢迎。儿童故事机不仅可以播放歌曲、故事等，还可以通过语音智能识别功能识别语言，并与儿童进行交流。例如，小朋友对故事机说：“讲故事”，故事机问小朋友：“小朋友，你想听什么故事？”小朋友说：“白雪公主”，则故事机开始播放白雪公主的故事。

发明内容

为克服相关技术中存在的问题，本公开提供一种语音交互方法和装置。

根据本公开实施例的第一方面，提供一种语音交互方法，包括：

获取用户的语音信息中的第一模糊发音；

根据预设模糊发音与预设标准发音之间的对应关系，将所述第一模糊发音转换为对应的标准发音；

控制语音交互终端根据转换后的标准发音与所述用户进行语音交互。

一个实施例中，所述获取用户的语音信息中的第一模糊发音，包括：

获取所述语音信息中携带的用户声纹，并根据所述用户声纹确定所述用户的身份；

若所述用户的身份为目标身份，则获取所述用户的语音信息中的第一模糊发音。

一个实施例中，所述根据所述用户声纹确定所述用户的身份，包括：

获取所述用户声纹与预存声纹之间的相似度；

若所述相似度大于预设阈值，则确定所述用户的身份为所述预存声纹所对应的预存身份。