[发明专利]一种基于深度学习的智能电话语音系统在审
申请号: | 202110221318.2 | 申请日: | 2021-02-27 |
公开(公告)号: | CN112927698A | 公开(公告)日: | 2021-06-08 |
发明(设计)人: | 白峻峰;高爽;高鹏飞;刘子曜;张文战 | 申请(专利权)人: | 北京基智科技有限公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L21/0208;G10L25/54;H04M1/72403;H04W52/02 |
代理公司: | 上海霖睿专利代理事务所(普通合伙) 31391 | 代理人: | 陈得宗;黄燕石 |
地址: | 100085 北京市朝*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 智能 电话 语音 系统 | ||
1.一种基于深度学习的智能电话语音系统,适用于智能终端,其特征在于,包括:
语音获取模块,用于获取语音信息;
语音预处理模块,所述语音预处理模块与所述语音获取模块连接,用于按照第一预设规则对所述语音信息进行处理,得到目标语音;
语音识别模块,用于对所述目标语音进行识别分析,获得目标内容;
检索模块,所述检索模块与所述语音识别模块连接,用于根据所述目标内容按照第二预设规则获取对应的目标应答内容;
输出模块,所述输出模块与所述检索模块连接,用于按照第三预设规则将所述目标应答内容进行输出。
2.根据权利要求1所述的系统,其特征在于,所述第一预设规则对所述语音信息进行处理包括以下至少一种:
对获取的所述语音信息进行噪声滤除;
从所述语音信息中识别目标用户的语音信息;
从所述语音信息中识别目标声源的语音信息。
3.根据权利要求2所述的系统,其特征在于,从所述语音信息中识别目标用户的语音信息,包括:
当所述语音信息中存在多个目标用户的语音信息时;
按照目标用户的优先级,获取对应的语音信息作为目标语音。
4.根据权利要求2所述的系统,其特征在于,从所述语音信息中识别目标声源的语音信息,包括:
当所述语音信息中存在多个目标声源时;
按照目标声源的优先级,获取对应的语音信息作为目标语音。
5.根据权利要求1所述的系统,其特征在于,所述第二预设规则包括以下至少一种:
从所述智能终端中存储的应答内容中获取对应的目标应答内容;
从将所述目标内容发送至服务器,从所述服务器中获取对应的目标应答内容;
从互联网获取对应的目标应答内容。
6.根据权利要求5所述的系统,其特征在于,所述从互联网获取对应的目标应答内容,包括:
从互联网查找与所述目标内容的相似度达到预设阈值的网络热词;
查找及获取所述网络热词对应的应答内容作为目标应答内容;
若所述网络热词对应的应答内容存在至少两个以上,则获取热度最高的应答内容作为目标内容。
7.根据权利要求1所述的系统,其特征在于,所述按照第三预设规则将目标应答内容进行输出,包括以下至少一种:
将目标应答内容以语音的形式进行输出;
将目标应答内容以文字的形式进行输出;
执行目标应答内容,对执行结果进行输出。
8.根据权利要求1至7中任一项所述的系统,其特征在于,还包括:
控制模块,用于根据目标应答内容对所述智能终端的终端模式进行控制;
其中,所述终端模式,包括唤醒模式、非唤醒模式中的至少一种。
9.根据权利要求8所述的系统,其特征在于,所述用于根据目标应答内容对所述智能终端的终端模式进行控制,包括:
当所述目标应答内容需要输出文字和/或运行效果时,若所述智能终端处于非唤醒模式,则对所述智能终端进行唤醒,并输出所述目标应答内容;
当所述目标应答内容需要输出语音时,若所述智能终端处于非唤醒模式,则直接输出语音,和/或对所述智能终端进行唤醒并输出目标应答内容。
10.根据权利要求1至7中任一项所述的系统,其特征在于,所述语音识别模块基于深度神经网络对语音进行识别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京基智科技有限公司,未经北京基智科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110221318.2/1.html,转载请声明来源钻瓜专利网。