[发明专利]音频信号处理设备、音频信号处理方法和存储介质在审
| 申请号: | 201980100637.9 | 申请日: | 2019-09-27 |
| 公开(公告)号: | CN114424283A | 公开(公告)日: | 2022-04-29 |
| 发明(设计)人: | 荒川隆行 | 申请(专利权)人: | 日本电气株式会社 |
| 主分类号: | G10L21/0272 | 分类号: | G10L21/0272 |
| 代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 孙志湧;李兰 |
| 地址: | 日本*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 音频 信号 处理 设备 方法 存储 介质 | ||
本发明实现了即使当多个说话者同时说话时也能够提取每一说话者的语音的音频信号处理。音频信号处理设备(400)设置有:确定单元(401),其基于外部获取的第一音频信号来确定链接到主机设备的对象说话者的第一语音段;共享单元(402),其向链接到非对象说话者的另一设备发送第一音频信号和第一语音段,并从另一设备接收与非对象说话者相关联的第二音频信号和第二语音段;估计单元(403),其基于所接收的第二音频信号和第二语音段以及获取的与对象说话者相关联的估计参数来估计混合在第一音频信号中的非对象说话者的语音;以及移除单元(404),其从第一音频信号中移除非对象说话者的语音,因此创建移除了非对象说话者的语音的第一语音。
技术领域
本公开涉及用于强调多个说话者当中的特定说话者的语音的音频信号处理设备等。
背景技术
语音是人类的自然通信手段,并且不仅在同一地点的人类之间的通信,而且在不同地点的人类之间的通信都是使用语音作为使用电话、网络会议系统等的介质来实现的。此外,系统使用语音辨识技术理解人的语音变得可能,并且语音通信不仅已经在人与人之间实现,而且已经在人与系统之间实现。
在此类使用语音的通信中,已经开发了一种技术,该技术强调多个说话者的混合中的特定说话者的语音,并且有助于收听语音。该技术可以用于多种场景中。例如,在网络会议系统中,强调正在主要发言的说话者的声音,以减少周围噪声的影响,从而可以容易地听到说话者的话音。此外,在语音辨识系统中,通过输入为每一说话者分离的语音而不是输入混合语音,可以实现高度精确的语音辨识。用于强调特定说话者的语音的技术如下。
PTL 1公开了一种进行声源定位的技术,用于使用多个麦克风来估计说话者的方向,并强调来自通过声源定位估计的说话者方向的语音(波束形成处理)。
PTL 2公开了一种技术,其中对等式网络由包括麦克风的多个终端形成,记录在多个终端中的声音信号被相互发送和接收并共享,并且记录在相应终端中的语音的时移被校正和相加,以仅强调来自多个声音信号的特定说话者的语音。
此外,PTL 3公开了与上述技术相关的确定语音区间的技术。
[引文列表]
[专利文献]
[PTL 1]JP 2002-091469 A
[PTL 2]JP 2011-254464 A
[PTL 3]JP 5299436 B
发明内容
[技术问题]
由于语音随着距离的增加而衰减,所以期望发出语音的说话者的嘴与接收语音的麦克风之间的距离尽可能近。特别地,已知频率越高,衰减越快,并且不仅语音由于距离的增加而变得更容易受到周围噪声的影响,而且语音的频率特性也发生变化。
在PTL 1中,使用位置固定的多个麦克风(例如,麦克风阵列设备)来强调语音。但是,麦克风不能靠近每一说话者,并且会受到周围噪声的影响。
在PTL 2中,由于包括麦克风在内的独立终端形成对等式网络,麦克风可以靠近每一说话者。然而,在PTL 2中公开的技术中,在多个说话者同时说话或者在对话之间的时间间隔不足而说话的情况下,另一说话者的语音被混合到要强调的说话者的语音中,使得每一说话者的语音分离变得困难。
鉴于上述问题进行了本公开,并且本公开的目的是提供一种即使在多个说话者同时发声的状况下也能够提取对象说话者的语音的音频信号处理设备等。
[问题的解决方案]
鉴于上述问题,作为本公开的第一方面的音频信号处理设备包括:
确定装置,其被配置成根据外部获取的第一声音信号来确定与本地设备相关联的对象说话者的第一语音区间;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于日本电气株式会社,未经日本电气株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980100637.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:确定用于UL信号的默认空间关系
- 下一篇:铰链机构及具有铰链机构的可折叠设备





