[发明专利]语音交互设备、方法、装置、电子设备和存储介质在审
| 申请号: | 202010832988.3 | 申请日: | 2020-08-18 |
| 公开(公告)号: | CN112185366A | 公开(公告)日: | 2021-01-05 |
| 发明(设计)人: | 耿雷 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
| 主分类号: | G10L15/20 | 分类号: | G10L15/20;G10L15/22;G10L21/0208;G10L21/0216 |
| 代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 戎郑华 |
| 地址: | 100085 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 语音 交互 设备 方法 装置 电子设备 存储 介质 | ||
本申请公开了一种语音交互设备、方法、装置、电子设备和存储介质,涉及语音技术、人工交互、回声消除技术领域。具体实现方案为:通过D类(数字)音频功率放大器将待播放的第一语音信号经过脉冲密度调制器调制,以生成第一脉冲密度调制信号;通过处理器根据获取的第一脉冲密度调制信号及数字麦克风阵列采集的音频信号,确定音频信号中包含的语音指令,以对音频信号进行回声消除,并生成第二待播放的语音信号。由此,通过采集脉冲密度调制信号对音频信号进行调制,并采集调制后的脉冲密度调制信号作为回声参考信号,对数字麦克风采集的音频信号进行回声消除,无需模数转换,从而避免了模数转换带来的干扰噪声,改善了回声消除的效果。
技术领域
本申请涉及信号处理技术领域,具体涉及语音技术、人工交互、回声消除技术领域,尤其涉及一种语音交互设备、方法、装置、电子设备和存储介质。
背景技术
在语音交互尤其是远场语音交互中,关键词唤醒以及语音打断功能是实现语音交互的关键,而实现这些功能的前提就是回声消除技术。如何更好的提高回声消除的性能,以便更好的提升语音交互的体验,是当前语音交互相关技术的关键。
发明内容
本申请提供一种用于改善回声消除效果的语音交互设备、方法、装置、电子设备和存储介质。
根据本申请的第一方面,提供了一种语音交互设备,包括:D类(数字)音频功率放大器;数字麦克风阵列;及分别与所述D类音频功率放大器及所述数字麦克风阵列连接的处理器;其中,所述D类音频功率放大器,用于将待播放的第一语音信号经过脉冲密度调制器调制,以生成第一脉冲密度调制信号;所述处理器,用于根据获取的所述第一脉冲密度调制信号及所述数字麦克风阵列采集的音频信号,确定所述音频信号中包含的语音指令,并生成第二待播放的语音信号。
本申请实施例的语音交互设备,通过D类音频放大器将待播放的第一语音信号经过脉冲密度调制器调制,以生成第一脉冲密度调制信号;通过数字麦克风阵列采集音频信号;处理器获取第一脉冲密度调制信号及数字麦克风阵列采集的音频信号,以根据第一脉冲密度调制信号及音频信号确定音频信号中包含的语音指令,并生成第二待播放的语音信号。由此,通过采集脉冲密度调制信号对音频信号进行调制,并采集调制后的脉冲密度调制信号作为回声参考信号,对数字麦克风采集的音频信号进行回声消除,由于调制后的脉冲密度信号为脉宽固定的数字信号,可以无需模数转换,从而避免了模数转换带来的干扰噪声,改善了回声消除的效果。
根据本申请的第二方面,提供了语音交互方法,包括:获取第一脉冲密度调制信号及数字麦克风阵列采集的音频信号,其中,所述第一脉冲密度调制信号为待播放的第一语音信号经过脉冲密度调制器调制后生成的;基于所述第一脉冲密度调制信号,对所述音频信号进行回声消除,以获取所述音频信号中包含的语音指令;响应于所述语音指令,生成第二待播放的语音信号。
本申请实施例的语音交互方法,首先,将待播放的第一语音信号经过脉冲密度调制器调制后生成第一脉冲密度调制信号,并获取第一脉冲密度调制信号及数字麦克风阵列采集的音频信号,然后,基于第一脉冲密度调制信号,对音频信号进行回声消除,以获取音频信号中包含的语音指令,最后,响应于语音指令生成第二待播放的语音信号。由此,通过采集脉冲密度调制信号对音频信号进行调制,并采集调制后的脉冲密度调制信号作为回声参考信号,对数字麦克风采集的音频信号进行回声消除,由于调制后的脉冲密度信号为脉宽固定的数字信号,可以无需模数转换,从而避免了模数转换带来的干扰噪声,改善了回声消除的效果。
根据本申请的第三方面,提供了一种语音交互装置,包括:获取模块,用于获取第一脉冲密度调制信号及数字麦克风阵列采集的音频信号,其中,所述第一脉冲密度调制信号为待播放的第一语音信号经过脉冲密度调制器调制后生成的;处理模块,用于基于所述第一脉冲密度调制信号,对所述音频信号进行回声消除,以获取所述音频信号中包含的语音指令;生成模块,用于响应于所述语音指令,生成第二待播放的语音信号。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010832988.3/2.html,转载请声明来源钻瓜专利网。





