[发明专利]社会网络中的数字媒体语音标签有效
申请号: | 201180012464.9 | 申请日: | 2011-02-03 |
公开(公告)号: | CN102782751A | 公开(公告)日: | 2012-11-14 |
发明(设计)人: | M·拜利;J·E·克里斯滕森;C·M·丹尼斯;J·B·埃利斯;T·D·埃里克森;R·G·法雷尔;W·A·凯罗格 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G10L17/00 | 分类号: | G10L17/00 |
代理公司: | 中国国际贸易促进委员会专利商标事务所 11038 | 代理人: | 高青 |
地址: | 美国*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 社会 网络 中的 数字 媒体 语音 标签 | ||
1.一种系统,包括:
客户端计算装置,所述客户端计算装置包括媒体对象捕获装置和语音捕获装置,并运行将媒体对象与语音样本相关联的客户端应用;
通信网络,其耦接至所述客户端计算装置;
语音加标签系统,其耦接至所述通信网络并接收第一媒体对象和第一语音样本之间的至少一个关联;以及
数据库,其耦接至所述语音加标签系统,所述数据库包括一个或多个语音标签,每个语音标签耦接至一个或多个语音样本。
2.如权利要求1所述的系统,其中,存储在所述数据库中的至少一个语音样本具有音素表示。
3.如权利要求2所述的系统,其中,所述至少一个语音样本被链接至讲话者标识符。
4.如权利要求1所述的系统,其中,所述客户端计算装置是蜂窝电话。
5.如权利要求1所述的系统,其中,具有类似音素表示的多个语音样本被链接至一个语音标签。
6.如权利要求1所述的系统,其中,所述第一媒体对象是图像。
7.一种对媒体对象加标签的方法,所述方法包括:
在服务器处接收第一语音样本和第一媒体对象之间的关联;
比较所述第一语音样本与一个或多个其它语音样本;
将所述第一语音样本链接至第一语音标签;
将所述第一语音标签链接至所述第一媒体对象;以及
将所述第一语音样本、所述第一语音标签、所述第一媒体对象以及它们之间的任何链接存储在耦接至所述服务器的数据库中。
8.如权利要求7所述的方法,其中,从蜂窝电话接收所述关联。
9.如权利要求8所述的方法,其中,在所述蜂窝电话处创建所述第一媒体对象。
10.如权利要求8所述的方法,其中,从所述数据库中检索所述第一媒体对象并呈现在所述蜂窝电话上。
11.如权利要求7所述的方法,其中比较包括:
形成用于所述第一语音样本的第一音素表示;以及
比较所述第一音素表示与链接至所述一个或多个其它语音样本的其它音素表示。
12.如权利要求11所述的方法,其中,在所述第一音素表示匹配所述一个或多个其它语音样本中的一个的情况下,将所述第一语音样本链接至所述第一语音标签,所述第一语音标签先前被链接至所述一个或多个其它语音样本中的所述一个。
13.如权利要求11所述的方法,其中,在所述第一音素表示不匹配所述一个或多个其它语音样本中的一个的情况下,将所述第一语音样本链接至所述第一语音标签进一步包括:
在确定所述第一音素表示不匹配所述一个或多个其它语音样本中的一个之后,创建所述第一标签。
14.如权利要求8所述的方法,进一步包括:
将所述第一媒体对象存储在所述数据库中。
15.如权利要求8所述的方法,进一步包括:
将所述第一语音标签链接至第二媒体对象。
16.一种搜索含有已加语音标签的媒体对象的数字数据库的方法,所述方法包括:
在服务器处接收第一音频搜索;
比较所述第一音频搜索与存储在所述数字数据库中的语音标签的数字表示;以及
返回链接至匹配所述第一音频搜索的语音标签的一个或多个媒体对象。
17.如权利要求16所述的方法,其中,从蜂窝电话接收所述第一音频搜索。
18.如权利要求16所述的方法,其中,比较包括:
将所述第一音频搜索转换为第一音素表示;以及
计算所述第一音素表示和链接至所述语音标签的其它音素表示之间的相似性计分。
19.如权利要求18所述的方法,其中,所述相似性计分基于所述第一音素表示的开头部分。
20.如权利要求16所述的方法,其中,返回包括:
重放所述第一音频搜索的至少一部分。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201180012464.9/1.html,转载请声明来源钻瓜专利网。