[发明专利]信息处理有效
| 申请号: | 200780045316.0 | 申请日: | 2007-11-29 |
| 公开(公告)号: | CN101589387A | 公开(公告)日: | 2009-11-25 |
| 发明(设计)人: | J·R·索普;A·P·伯特尔斯 | 申请(专利权)人: | 索尼英国有限公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 中国专利代理(香港)有限公司 | 代理人: | 王 岳;王忠忠 |
| 地址: | 英国威*** | 国省代码: | 英国;GB |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 信息处理 | ||
1.一种关于信息项总集中的当前信息项来生成文字元数据的信息处理设备,所述设备包括:
可操作用于检测所述当前信息项的一个或多个预定属性的属性检测器;
可操作用于从所述信息项总集中检测信息项子集的子集检测器,所述子集是具有与所述当前信息项的属性最相似的一个或多个预定属性的那些子集;
可操作用于向用户显示在与所述信息项子集有关的文字元数据内的单词和/或短语的可选列表的显示装置,所述显示是按利用一因子进行加权的单词和/或短语的出现频率的次序进行的,该因子与对应于每个单词和/或短语的信息项与当前信息项的相似度有关;以及
可操作用于选择一个或多个所显示的最频繁出现的单词和/或短语以用在与所述当前信息项有关的文字元数据中的选择器。
2.根据权利要求1所述的设备,其中所述信息项包括音频和/或视频数据,并且所述属性检测器可操作用于检测所述音频和/或视频数据的一个或多个属性。
3.根据权利要求2所述的设备,其中所述一个或多个预定属性包括从包括以下各项的列表中选择的一个或多个属性:
色调统计分布;
亮度统计分布;
颜色分量统计分布;
图像形状;
表面检测统计;
音频功率;
音频子频带功率;
音频明度;
音频带宽;
音频音调;以及
音频mel频率属性。
4.根据权利要求2或3所述的设备,
包括可操作用于生成特征向量的特征向量发生器,所述特征向量 包括指示一个或多个预定属性的特征数据值;
以及其中所述子集检测器可操作用于检测具有特征向量的那些信息项,所述特征向量具有距当前信息项的特征向量最短的欧几里德距离。
5.根据权利要求4所述的设备,包括可操作用于丢弃与信息项的不重要的属性有关的特征数据的数据丢弃器。
6.根据权利要求4所述的设备,包括可操作用于关于所述信息项总集中的至少一些信息项来存储特征向量的特征向量存储器。
7.根据权利要求1所述的设备,包括:
可操作用于从所选择的一个或多个最频繁出现的单词和/或短语中排除经常出现的单词的预定列表的无用单词检测器。
8.根据权利要求1所述的设备,其中所述一个或多个最频繁出现的单词和/或短语是关于各个词干的出现频率和/或相应的信息项属性与当前信息项属性的相似度而选择的。
9.根据权利要求1所述的设备,包括可操作用于向用户显示一个或多个最频繁出现的单词和/或短语的可选列表的显示装置,其中所述列表按各个词干的出现频率和/或相应信息项属性与当前信息项属性的相似度来进行排序。
10.根据权利要求9所述的设备,
包括用于供用户输入一个或多个字母的用户输入设备;
以及其中所述列表包括以所述用户输入的若干字母而开头的单词和/或短语。
11.一种关于信息项总集中的当前信息项来生成文字元数据的信息处理方法,所述方法包括下述步骤:
检测所述当前信息项的一个或多个预定属性;
从所述信息项总集中检测信息项子集,所述子集是具有与所述当前信息项的属性最相似的一个或多个预定属性的那些子集;
显示在与所述信息项子集有关的文字元数据内的单词和/或短语,所述显示是按利用一因子进行加权的单词和/或短语的出现频率的次序进行的,该因子与对应于每个单词和/或短语的信息项与当前信息项的相似度有关;以及
选择一个或多个最频繁出现的单词和/或短语,以用在与所述当前信息项有关的文字元数据中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于索尼英国有限公司,未经索尼英国有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200780045316.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:非易失性存储器的最高多级状态的较快编程
- 下一篇:字预测





