[发明专利]一种目标声源的提取方法及装置有效

申请号：	201911219825.1	申请日：	2019-12-03
公开（公告）号：	CN110992977B	公开（公告）日：	2021-06-22
发明（设计）人：	陈孝良;钱思冲;冯大航;常乐	申请（专利权）人：	北京声智科技有限公司
主分类号：	G10L21/0272	分类号：	G10L21/0272
代理公司：	北京集佳知识产权代理有限公司 11227	代理人：	潘颖
地址：	100080 北京市***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种目标声源提取方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种目标声源的提取方法，包括：获取第一数量的声音采集设备采集的音频数据；确定所述音频数据中声源的第二数量；将所述第一数量与所述第二数量进行对比，依据对比结果选取对应的目标盲源分离方法对所述音频数据进行盲源分离，得到各个声源；选取所述各个声源中存在预设激活词的声源作为目标声源。上述的提取方法中，在接收到音频数据时，首先确定音频数据的声源的第二数量，实现了声源的准确定位，之后才进行目标声源的提取，避免了现有技术中，在噪声和混响场景下或者间隔短的不同声源，定位结果有较大误差，无法做到准确定位的问题。

技术领域

本发明涉及语音提取技术领域，尤其涉及一种目标声源的提取方法及装置。

背景技术

嘈杂环境中提取感兴趣的目标声源被称为“鸡尾酒会问题”，在实际环境中，声音的传播经过反射、多径传播、叠加，到达传声器的时候与源声源有很大差异了，想从传声器提取感兴趣声音变得格外困难。

现有技术中利用声音采集设备采集声源数据，然后使用SRP和粒子滤波对声源数据进行定位和跟踪，盲语音分离根据声源方位信息对麦克风信号进行分离并进行后置滤波，得到独立声源。上述的方法中，在噪声和混响场景下或者间隔短的不同声源，定位结果有较大误差，无法做到准确定位。

发明内容

有鉴于此，本发明提供了一种目标声源的提取方法及装置，用以解决在噪声和混响场景下或者间隔短的不同声源，定位结果有较大误差，无法做到准确定位的问题。具体方案如下：

一种目标声源的提取方法，包括：

获取第一数量的声音采集设备采集的音频数据；

确定所述音频数据中声源的第二数量；

将所述第一数量与所述第二数量进行对比，依据对比结果选取对应的目标盲源分离方法对所述音频数据进行盲源分离，得到各个声源；

选取所述各个声源中存在预设激活词的声源作为目标声源。