[发明专利]追溯性声音识别系统在审
| 申请号: | 201910598089.9 | 申请日: | 2019-07-04 |
| 公开(公告)号: | CN110689896A | 公开(公告)日: | 2020-01-14 |
| 发明(设计)人: | A.布朗热;J.弗比克;S.马蒂;D.迪森索;S.克拉茨 | 申请(专利权)人: | 哈曼国际工业有限公司 |
| 主分类号: | G10L17/22 | 分类号: | G10L17/22;G10L25/30;H04L29/06 |
| 代理公司: | 11105 北京市柳沈律师事务所 | 代理人: | 高巍 |
| 地址: | 美国康*** | 国省代码: | 美国;US |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 发声 听觉环境 用户请求 声音识别系统 音频数据存储 存储器 接收指示 输出装置 音频数据 追溯性 处理器 麦克 输出 | ||
1.一种用于识别发声对象的至少一个特性的方法,所述方法包括:
将经由至少一个麦克风从听觉环境获取的音频数据存储在存储器中;
接收指示识别所述听觉环境中所包括的发声对象的特性的用户请求的输入;
经由处理器并基于在所述用户请求之前从所述听觉环境获取的所述音频数据的一部分,确定所述发声对象的特性;以及
促使对应于所述发声对象的所述特性的信息经由至少一个输出装置输出。
2.如权利要求1所述的方法,其还包括:从所述存储器中丢弃从所述听觉环境获取的早于阈值持续时间的音频数据。
3.如权利要求2所述的方法,其中所述存储器包括循环缓冲区。
4.如权利要求3所述的方法,其中将从所述听觉环境获取的音频数据存储在所述存储器中包括:将所述音频数据的第一部分存储在所述循环缓冲区的第一部分中,以及将所述音频数据的第二部分存储在所述循环缓冲区的第二部分中。
5.如权利要求4所述的方法,其中确定所述发声对象的所述特性包括基于所述音频数据的所述第一部分确定所述发声对象的第一身份。
6.如权利要求5所述的方法,其中确定所述发声对象的所述特性还包括:
确定所述发声对象的所述第一身份具有与其相关联的小于阈值置信度值的置信度度量;以及
基于所述音频数据的所述第一部分和所述音频数据的所述第二部分确定所述发声对象的第二身份。
7.如权利要求6所述的方法,其中所述音频数据的所述第一部分对应于第一时间间隔,所述第一时间间隔比对应于所述音频数据的所述第二部分的第二时间间隔更接近于接收指示所述用户请求的所述输入而发生。
8.如权利要求1所述的方法,其中指示所述用户请求的所述输入包括对基于触摸的机构的物理输入、口头输入、用户姿势和来自附加传感器的附加信息中的一个。
9.如权利要求8所述的方法,其中所述口头输入包括关键词或关键短语。
10.如权利要求1所述的方法,其还包括:从与接收所述输入的计算装置分开的计算装置中检索所述音频数据。
11.如权利要求1所述的方法,其还包括:从包括在接收所述输入的计算装置中的存储器中检索所述音频数据。
12.一种非暂时性计算机可读存储介质,其包括指令,所述指令在由至少一个处理器执行时,配置所述至少一个处理器以通过执行以下步骤来检索信息:
将经由至少一个麦克风从听觉环境获取的音频数据存储在循环缓冲区中;
接收指示识别所述听觉环境中所包括的发声对象的特性的用户请求的输入;
经由处理器并基于在所述用户请求之前从所述听觉环境获取的所述音频数据的一部分,确定所述发声对象的所述特性;以及
促使对应于所述发声对象的所述特性的信息经由至少一个输出装置输出。
13.如权利要求12所述的非暂时性计算机可读存储介质,其中指示所述用户请求的所述输入包括对基于触摸的机构的物理输入、口头输入、用户姿势和来自附加传感器的附加信息中的一个。
14.如权利要求13所述的非暂时性计算机可读存储介质,其中所述口头输入包括关键词或关键短语。
15.如权利要求12所述的非暂时性计算机可读存储介质,其还包括指令,所述指令在由至少一个处理器执行时,配置所述至少一个处理器以执行以下步骤:从与接收所述输入的计算装置分开的计算装置中检索所述音频数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈曼国际工业有限公司,未经哈曼国际工业有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910598089.9/1.html,转载请声明来源钻瓜专利网。





