[发明专利]一种数据库构建方法、多媒体文件的检索方法及装置在审
| 申请号: | 202111113229.2 | 申请日: | 2021-09-23 |
| 公开(公告)号: | CN113934869A | 公开(公告)日: | 2022-01-14 |
| 发明(设计)人: | 周祥;倪德迈;叶正盛 | 申请(专利权)人: | 阿里云计算有限公司;阿里巴巴(中国)有限公司 |
| 主分类号: | G06F16/432 | 分类号: | G06F16/432;G06F16/14 |
| 代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 周嗣勇 |
| 地址: | 310024 浙江省*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 数据库 构建 方法 多媒体 文件 检索 装置 | ||
1.一种数据库的构建方法,所述数据库用于多媒体文件的检索;针对不同类型的多媒体文件,分别配置对应的语义信息识别模型;所述方法包括:
针对任一目标多媒体文件,根据所述目标多媒体的文件类型,确定与该类型对应的语义信息识别模型;
根据所确定的语义信息识别模型的输入需求,调用相应的特征向量提取算法,得到所述目标多媒体文件特征向量;
将所提取到的特征向量输入至所确定的语义信息识别模型,得到该特征向量对应的语义信息;
将所得到的语义信息确定为所述目标多媒体文件的特征关键词,并与所述目标多媒体文件进行关联存储。
2.如权利要求1所述的方法,所述将所得到的特征关键词与所述目标多媒体文件进行关联存储,包括:
以所述目标多媒体文件的标识为唯一标识,记录所述目标多媒体文件的存储位置信息、所述目标多媒体文件的文件类型、所述所得到的特征关键词。
3.如权利要求1所述的方法,在所述目标多媒体文件为具有时间播放属性的多媒体文件的情况下,所述将所得到的特征向量输入至所确定的语义信息识别模型,得到该特征向量对应的语义信息,包括:
将所得到的特征向量输入至所确定的语义信息识别模型,得到该特征向量对应的语义信息,以及该语义信息在所述目标多媒体文件中的起始时间戳;
所述将所得到的语义信息确定为所述目标多媒体文件的特征关键词,并与所述目标多媒体文件进行关联存储,包括:
将所得到的语义信息确定为所述目标多媒体文件的特征关键词,并与所述目标多媒体文件进行关联存储;其中,保存所得到的特征关键词时,同时保存所得到的特征关键词对应的起始时间戳。
4.如权利要求3所述的方法,所述将所得到的特征关键词与所述目标多媒体文件进行关联存储,包括:
以所述目标多媒体文件的标识为唯一标识,记录所述目标多媒体文件的存储位置信息、所述目标多媒体文件的文件类型、所述所得到的特征关键词;
所述保存所得到的特征关键词时,同时保存所得到的特征关键词对应的起始时间戳,包括:
以所述目标多媒体文件的标识以及所得到的特征关键词为唯一标识,记录所述所得到的特征关键词对应的起始时间戳。
5.如权利要求1所述的方法,还包括:
针对任一多媒体文件的任一经语义信息识别模型得到的特征关键字词,对该特征关键词进行语义信息扩展得到扩展关键词,将所述扩展关键词作为该多媒体文件的特征关键词,与该多媒体文件进行关联存储;
所述语义信息扩展包括:确定特征关键词的同义词和/或近义词。
6.一种多媒体文件的检索方法,所述方法包括:
获取检索关键词并将所述检索关键词转换为与检索数据库对应的查询语句;所述检索数据库基于如权利要求1-5任一所述的方法构建得到;
基于所述查询语句查询特征关键词包括所述检索关键词的多媒体文件;
将查询得到的多媒体文件确定为检索结果。
7.如权利要求6所述的方法,所述检索数据库基于如权利要求3或4所述的方法构建得到,所述基于所述查询语句查询特征关键词包括所述检索关键词的多媒体文件;将查询得到的多媒体文件确定为检索结果,包括:
基于查询语句查询特征关键词包括所述检索关键词的多媒体文件,以及所述检索关键词在所查询得到的多媒体文件中的时间戳;
将所查询的多媒体文件的播放时间定位至所述起始时间戳,并将定位完成的多媒体文件作为检索结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里云计算有限公司;阿里巴巴(中国)有限公司,未经阿里云计算有限公司;阿里巴巴(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111113229.2/1.html,转载请声明来源钻瓜专利网。





