[发明专利]基于用户参与度的音频选择在审
申请号: | 201980039274.2 | 申请日: | 2019-04-04 |
公开(公告)号: | CN112262367A | 公开(公告)日: | 2021-01-22 |
发明(设计)人: | 詹森·弗朗西斯·哈里森;沙希德·拉扎克;埃里克·W·黄 | 申请(专利权)人: | 脸谱公司 |
主分类号: | G06F3/16 | 分类号: | G06F3/16 |
代理公司: | 北京安信方达知识产权代理有限公司 11262 | 代理人: | 李琰;杨明钊 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 用户 参与 音频 选择 | ||
1.一种方法,包括:
在音频-视频通信会话期间,从包括至少两个麦克风的麦克风阵列接收音频输入数据,其中,所述音频输入数据由环境内第一位置处的第一声源和所述环境内第二位置处的第二声源生成;
计算所述第一声源的第一参与度度量和所述第二声源的第二参与度度量,其中:
所述第一参与度度量近似于接收用户对所述第一声源的兴趣水平;和
所述第二参与度度量近似于所述接收用户对所述第二声源的兴趣水平;
确定所述第一参与度度量大于所述第二参与度度量;
处理所述音频输入数据以生成音频输出信号,其中,所述音频输出信号放大由所述第一声源产生的声音并衰减由所述第二声源产生的声音;
将所述音频输出信号发送到与所述接收用户相关联的计算设备。
2.根据权利要求1所述的方法,还包括确定所述第一声源的第一分类和所述第二声源的第二分类,其中,所述第一参与度度量基于所述第一分类,并且所述第二参与度度量基于所述第二分类。
3.根据权利要求2所述的方法,其中,所述第一声源的第一分类是人类声音,并且其中,所述第二声源的第二分类是非人类声音。
4.根据权利要求2所述的方法,其中,确定所述第一分类和所述第二分类是基于从所述音频-视频通信会话的描述性模型接收的信息,所述描述性模型包括关于以下项的一个或更多个描述性特征:(1)与当前音频-视频通信会话相关联的环境;(2)所述环境中的一个或更多个人,或者(3)与当前音频-视频通信会话相关联的一个或更多个上下文元素。
5.根据权利要求1所述的方法,其中,处理所述音频输入数据包括对由所述第一源生成的第一音频输入信号和由所述第二源生成的第二音频输入信号进行声学波束成形,其中,所述声学波束成形包括对所述第二音频输入信号进行时间延迟,使得所述第一声源被放大并且所述第二声源被衰减。
6.根据权利要求1所述的方法,其中,所述第一参与度度量和所述第二参与度度量是基于所述音频-视频通信会话的描述性模型来计算的,所述描述性模型包括关于以下项的一个或更多个描述性特征:(1)与当前音频-视频通信会话相关联的环境;(2)所述环境中的一个或更多个人,或者(3)与当前音频-视频通信会话相关联的一个或更多个上下文元素。
7.根据权利要求1所述的方法,还包括:
访问包括多个节点和连接所述节点的多条边的社交图,其中:
第一节点对应于所述接收用户;
第二节点对应于与所述第一声源相关联的实体;和
所述第一节点和所述第二节点之间的边表示所述接收用户和所述实体之间的关系;和
基于所述第一节点和所述第二节点之间的边增加所述第一参与度度量。
8.根据权利要求1所述的方法,其中,至少部分地基于以下项来计算所述第一参与度:所述第一声源说出的单词的计数、所述第一声源和所述麦克风阵列之间的距离、或者所述第一声源在当前音频-视频通信会话期间已经存在于所述环境中的时间量;和
至少部分地基于以下项来计算所述第二参与度:所述第二声源说出的单词的计数、所述第二声源和所述麦克风阵列之间的距离、或者所述第二声源在当前音频-视频通信会话期间已经存在于所述环境中的时间量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于脸谱公司,未经脸谱公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980039274.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:硬性内窥镜的罩和内窥镜单元
- 下一篇:化合物、有机电致发光器件及显示装置