[发明专利]社会网络中的数字媒体语音标签有效
申请号: | 201180012464.9 | 申请日: | 2011-02-03 |
公开(公告)号: | CN102782751A | 公开(公告)日: | 2012-11-14 |
发明(设计)人: | M·拜利;J·E·克里斯滕森;C·M·丹尼斯;J·B·埃利斯;T·D·埃里克森;R·G·法雷尔;W·A·凯罗格 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G10L17/00 | 分类号: | G10L17/00 |
代理公司: | 中国国际贸易促进委员会专利商标事务所 11038 | 代理人: | 高青 |
地址: | 美国*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 社会 网络 中的 数字 媒体 语音 标签 | ||
技术领域
本发明涉及表征媒体,且更具体而言,利用语音标签表征数字媒体。
背景技术
数字图书馆、照片共享站点、图像搜索引擎、在线百科全书及其它计算机系统皆在文件系统或数据库中拥有大量图像。访问这些站点的用户可能在查找想要的图像方面有困难,因为与文档不同,图像(及其它数字媒体)不包括可索引的字或短语。
对查找想要的图像的问题的一种解决方案是图像识别,但此方法对于用户生成的内容花费极高,且并不高度准确。另一已知方法是按指定种类(诸如,文件夹)对图像分组以促进存取。然而,这需要人工努力,且必须提前知晓图像。
存在组织这些图像的许多方式,包括收集、集合及分层结构。组织收集的一种常用方法为加标签。当用户看到图像时,用户可键入字或短语以对该图像“加标签”(描述该图像)。多个用户可将一个或多个标签添加至同一图像。当另一用户访问该站点时,用户可接着导航至由特定标签标记的图像。
存在可使用标签实现图像导航的各种方式。举例而言,用户可键入作为用于一个或多个图像的集合的现有标签的字或短语。或者,用户可看到按各种方式(按字母顺序、按流行度等)排列的标签,且接着选择描述(这些)图像的标签。用于社会导航的文本加标签的功效被广泛使用且良好地理解。
也存在呈现数字媒体以使得用户能够扫描且识别项目的多个方式(拼贴、网格、可视化)。这些方法的主要缺点为其不可缩放:显示变得杂乱,且屏幕可能用完像素,尤其是在小屏幕上,诸如,在移动装置上。
也存在“自动”处理数字媒体以得出可接着用于搜索的元数据的多个方式。元数据(位置、时间)可在图像获取时捕获,且随后用以导航至视觉数字媒体。
然而,存在不可能或不方便创建或使用文本标签的许多情形。实例包括当用户:正使用移动电话(花费长时间或将注意力自视觉任务转至键入字或短语)时;身体残疾(不能键入字或短语)时;由于受教育有限而文盲或半文盲(仅具有有限的阅读或书写能力)时;或具有视力问题(不能看到字或短语)或这些情形的组合时。
发明内容
根据本发明的一个实施例,提供一种系统,其包括客户端计算装置,该客户端计算装置包括媒体对象捕获装置和语音捕获装置并运行将媒体对象与语音样本相关联的客户端应用。此实施例的系统还包括:通信网络,其耦接至该客户端计算装置;语音加标签系统,其耦接至该通信网络并接收第一媒体对象和第一语音样本之间的至少一个关联;以及数据库,其耦接至该语音加标签系统,该数据库包括一个或多个语音标签,每个语音标签耦接至一个或多个语音样本。
根据本发明的另一实施例,公开一种对媒体对象加标签的方法。此实施例的方法包括:在服务器处接收第一语音样本和第一媒体对象之间的关联;比较该第一语音样本与一个或多个其它语音样本;将该第一语音样本链接至第一语音标签;将该第一语音标签链接至该第一媒体对象;以及将该第一语音样本、该第一语音标签、该第一媒体对象以及它们之间的任何链接存储在耦接至该服务器的数据库中。
根据本发明的另一实施例,公开一种搜索含有已加语音标签的媒体对象的数字数据库的方法。该方法包括:在服务器处接收第一音频搜索;比较该第一音频搜索与存储在该数字数据库中的语音标签的数字表示;以及返回链接至匹配该第一音频搜索的语音标签的一个或多个媒体对象。
经由本发明的技术认识到额外特征及优点。本发明的其它实施例及方面在本文中得以详细描述且被认为是所主张的本发明的一部分。为了更好地理解具有这些优点及特征的本发明,参考描述及附图。
附图说明
本认为是本发明的主题被特别地指出并清楚地在说明书结尾处的权利要求书中被请求。本发明的上述和其它特征和优点从结合附图的下述详细描述中将是明显的,在图中:
图1示出本发明的实施例可实施于其上的计算系统的实例;
图2示出根据本发明的一个实施例的系统的实例;
图3示出可在图2中示出的系统中利用的数据库的一个实施例的方块图;
图4为图3中示出的数据库的更详细描绘;
图5为示出根据本发明的可对媒体对象加标签的方法的流程图;
图6为示出根据本发明的一个实施例的形成数据库的方法的流程图;以及
图7为示出根据本发明的一个实施例的搜索且检索已加语音标签的媒体对象的方法的流程图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201180012464.9/2.html,转载请声明来源钻瓜专利网。