[发明专利]一种多媒体文件检索方法在审
申请号: | 201811117840.0 | 申请日: | 2018-09-21 |
公开(公告)号: | CN109271533A | 公开(公告)日: | 2019-01-25 |
发明(设计)人: | 杨富东 | 申请(专利权)人: | 深圳市九洲电器有限公司 |
主分类号: | G06F16/43 | 分类号: | G06F16/43;G06F16/438;G06K9/00 |
代理公司: | 深圳市六加知识产权代理有限公司 44372 | 代理人: | 宋建平 |
地址: | 518057 广东省深圳市南*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 多媒体文件 目标图像 语音检索 检索 附属存储器 参考图像 视频片段 指令 存储多媒体文件 目标文件夹 预设时间段 智能安防 准确率 截取 预设 存储 网络 | ||
1.一种多媒体文件检索方法,应用于网络附属存储器设备,所述网络附属存储器设备用于存储多媒体文件,其特征在于,所述方法包括:
接收语音检索指令;
根据所述语音检索指令,确定参考图像;
根据所述参考图像,从所述多媒体文件中确定符合所述语音检索指令的目标图像;
截取包括所述目标图像在内的预设时间段的视频片段,存储于目标文件夹中,其中,当一个所述视频片段包括两个及以上的所述目标图像时,相邻两个所述目标图像的间隔时间小于预设时间阈值。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
接收检索范围指令;
根据所述检索范围指令,确定所述待检索的多媒体文件。
3.根据权利要求1所述的方法,其特征在于,所述接收语音检索指令包括:
通过语音采集设备进行语音信息采集;
识别所述语音信息是否为默认语言;
若是,则将所述语音信息转化为文字信息发送至所述网络附属存储器设备;
若否,则将所述语音信息转化为默认语言,并转化为文字信息发送至所述网络附属存储器设备。
4.根据权利要求1所述的方法,其特征在于,所述根据所述语音检索指令,确定参考图像,包括:
解析所述语音检索指令,确定所述语音检索指令的关键词;
根据所述关键词,从互联网或本地数据库中获取关联图像;
从所述关联图像中,确定参考图像。
5.根据权利要求4所述的方法,其特征在于,所述解析所述语音检索指令,确定所述语音检索指令的关键词,包括:
将所述语音信息转化为文字信息,对所述文字信息进行分类;
将分类处理后的文字信息进行统计分析后,确定所述语音检索指令的关键词。
6.根据权利要求4所述的方法,其特征在于,所述从所述关联图像中,确定参考图像,包括:
接收用户操作指令;
根据所述操作指令,确定所述参考图像;
或者,
将所述关联图像按引用频率、图像清晰度或更新时间进行优先级排序;
根据所述优先级,确定参考图像。
7.根据权利要求1所述的方法,其特征在于,所述根据所述参考图像,从所述多媒体文件中确定符合所述语音检索指令的目标图像,包括:
识别所述参考图像的参考图像特征点;
将所述多媒体文件拆分为图像帧;
判断所述参考图像特征点与每一个所述图像帧的图像特征点是否匹配;
根据所述判断结果,统计所述参考图像特征点与每一个所述图像帧的图像特征点的匹配数量;
根据所述匹配数量,确定图像的置信度;
根据所述置信度,确定符合所述语音检索指令的目标图像。
8.根据权利要求7所述的方法,其特征在于,所述根据所述判断结果,统计所述参考图像特征点与每一个所述图像帧的图像特征点的匹配数量,包括:
若所述参考图像特征点与每一个所述图像帧的图像特征点未匹配,继续判断下一个所述参考图像特征点与每一个所述图像帧的图像特征点是否匹配;
若所述参考图像特征点与每一个所述图像帧的图像特征点匹配,统计所述参考图像特征点与每一个所述图像帧的图像特征点的匹配数量。
9.根据权利要求7所述的方法,其特征在于,所述根据所述置信度,确定符合所述语音检索指令的目标图像,包括:
判断所述置信度是否高于预设置信阈值;
若是,则确定所述图像帧对应的图像为符合所述语音检索指令的目标图像。
10.根据权利要求1所述的方法,其特征在于,所述方法还包括:
对所述视频片段进行剪切或合并处理;
将处理后的所述视频片段生成相应的视频链接。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市九洲电器有限公司,未经深圳市九洲电器有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811117840.0/1.html,转载请声明来源钻瓜专利网。