[发明专利]一种在视频中查询对象的方法、装置和设备在审
申请号: | 201711340586.6 | 申请日: | 2017-12-14 |
公开(公告)号: | CN109963164A | 公开(公告)日: | 2019-07-02 |
发明(设计)人: | 陈小帅;张扬 | 申请(专利权)人: | 北京搜狗科技发展有限公司 |
主分类号: | H04N21/232 | 分类号: | H04N21/232;H04N21/84;H04N21/845 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 刘佳;王宝筠 |
地址: | 100084 北京市海淀区中关*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 查询对象 目标描述信息 用户查询请求 查询结果 查询信息 目标对象 描述信息 目标视频 帧图像 匹配 查询 查找 携带 返回 观看 | ||
1.一种在视频中查询对象的方法,其特征在于,包括:
接收携带有查询信息的用户查询请求;
查找与所述查询信息匹配的目标描述信息,其中,所述目标描述信息是预先为目标视频中的目标对象设置的描述信息;
以所述目标对象形成查询结果,为所述用户查询请求返回所述查询结果;
其中,所述目标描述信息是在包括所述目标对象的视频数据输入到机器学习模型的情况下所述机器学习模型输出的信息,所述机器学习模型是已基于包括历史视频中的历史对象的视频数据与所述历史对象的已知描述信息之间的对应关系进行了训练。
2.根据权利要求1所述的方法,其特征在于,所述已知描述信息是基于所述历史对象在所述历史视频中对应的字幕和/或所述历史对象在所述历史视频中对应的片段主题而形成的。
3.根据权利要求1所述的方法,其特征在于,所述已知描述信息包括以下信息中的任意一项或多项:时间信息,地点信息,类型信息,人物信息;
所述时间信息表示所述历史对象所描述的时间;
所述地点信息表示所述历史对象所描述的地点;
所述类型信息表示所述历史对象所描述的事件类型;
所述人物信息表示所述历史对象所描述的人物。
4.根据权利要求1~3任意一项所述的方法,其特征在于,所述目标对象为所述目标视频中的视频帧图像,所述历史对象为所述历史视频中的视频帧图像;
或,
所述目标对象为所述目标视频中的视频片段,所述历史对象为所述历史视频中的视频片段。
5.根据权利要求4所述的方法,其特征在于,所述包括所述目标对象的视频数据具体为所述目标视频,所述包括历史视频中的历史对象的视频数据具体为所述历史视频;
所述机器学习模型具体是已基于所述历史视频与所述历史对象、所述已知描述信息之间的对应关系进行了训练;
在所述目标视频输入到所述机器学习模型的情况下,所述机器学习模型具体输出所述目标对象和所述目标描述信息。
6.根据权利要求1所述的方法,其特征在于,所述查询结果具体为所述目标对象本身。
7.根据权利要求1所述的方法,其特征在于,所述以所述目标对象形成查询结果,为所述用户查询请求返回所述查询结果,包括:
若所述目标对象包括多个视频帧图像,按照各个所述视频帧图像的目标描述信息与所述查询信息之间匹配的相似程度,对各个所述视频帧图像进行排序,得到各个所述视频帧图像的相似性排序;
按照所述相似性排序,以各个所述视频帧图像构建动图序列;
以所述动图序列作为所述查询结果,为所述用户查询请求返回所述查询结果。
8.根据权利要求1所述的方法,其特征在于,所述以所述目标对象形成查询结果,为所述用户查询请求返回所述查询结果,包括:
若所述目标对象为视频片段,以所述目标视频及所述视频片段的起始点标识形成所述查询结果;
为所述用户查询请求返回所述查询结果;
其中,所述起始点标识用于在所述目标视频中提示所述视频片段的起始点位置。
9.根据权利要求8所述的方法,其特征在于,所述查询结果具体是以所述目标视频、所述视频片段的起始点标识和所述视频片段的结束点标识形成的;
其中,所述结束点标识,用于在所述目标视频中提示所述视频片段的结束点位置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京搜狗科技发展有限公司,未经北京搜狗科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711340586.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:网络视频直播方法、装置及电子设备
- 下一篇:一种查询方法及装置