[发明专利]社交关系增强的复杂视频人物检索方法在审
申请号: | 202110677925.X | 申请日: | 2021-06-18 |
公开(公告)号: | CN113343029A | 公开(公告)日: | 2021-09-03 |
发明(设计)人: | 徐童;陈恩红;李丹;周培伦;何伟栋;郝艳宾 | 申请(专利权)人: | 中国科学技术大学 |
主分类号: | G06F16/75 | 分类号: | G06F16/75;G06F16/783;G06F16/33;G06K9/62;G06Q50/00 |
代理公司: | 北京凯特来知识产权代理有限公司 11260 | 代理人: | 郑立明;韩珂 |
地址: | 230026 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 社交 关系 增强 复杂 视频 人物 检索 方法 | ||
1.一种社交关系增强的复杂视频人物检索方法,其特征在于,包括:
对于待检索视频进行采样得到视频帧序列,并从待检索视频中提取出相应的文本信息;
对所述视频帧序列进行人物检测与场景分割,并结合待检索视频的时间戳,建立每一场景所包含的人物区域集合;对于每一人物区域集合构建相应的关系传播图,其中人物区域作为节点,称为候选节点,候选节点之间以完全图的方式连接,为每一候选节点初始化一个类别向量,以及将每一候选节点与给定的目标查询人物集合对应的关系图中所有查询节点连接;
对于每一关系传播图,结合相应的文本信息预测两个候选节点之间的关系与类别概率;利用候选节点与查询节点对应的视觉特征以及候选节点之间的关系与类别概率,计算候选节点之间、以及候选节点与查询节点之间的相似度,并结合邻居节点特征聚合的方式更新每个候选节点的类别向量,直至收敛;类别向量中每一维代表属于一个目标查询人物的概率,维度数为目标查询人物的数目,收敛后类别向量中概率最大值则表示候选节点为对应的目标查询人物,将候选节点对应的人物区域的图像以及候选节点迭代后的类别向量作为对应目标查询人物的检索结果。
2.根据权利要求1所述的一种社交关系增强的复杂视频人物检索方法,其特征在于,所述对于待检索视频进行采样得到视频帧序列,并从待检索视频中提取出相应的文本信息包括:
对于待检索视频,采用等间距采样的方式,得到视频帧序列;
从待检索视频中提取出相应的文本信息,并进行去噪和时间轴校正处理;其中,文本信息包括:弹幕文本信息与字幕文本信息。
3.根据权利要求1所述的一种社交关系增强的复杂视频人物检索方法,其特征在于,所述对所述视频帧序列进行人物检测与场景分割,并结合待检索视频的时间戳,建立每一场景所包含的人物区域集合的步骤包括:
对于视频帧序列中的每一帧,进行人物区域的检测,并提取每一人物区域的视觉特征以及记录每一人物区域对应待检索视频的时间戳;
基于视觉风格变换,将视频帧序列分割为若干视频帧片段,每一视频帧片段作为一个场景,记录每一场景对应待检索视频的起止时间戳;
基于每一场景对应待检索视频的起止时间戳以及每一人物区域对应待检索视频的时间戳,建立每一场景对应的人物区域集合。
4.根据权利要求1所述的一种社交关系增强的复杂视频人物检索方法,其特征在于,所述候选节点与查询节点对应的视觉特征包含两类特征:重识别特征与面部特征;
通过将候选节点对应的人物区域图像以及查询节点对应的目标查询人物图像,分别输入至基于多尺度卷积的行人重识别网络以及基于人脸识别的卷积网络,提取出以上两类特征。
5.根据权利要求1所述的一种社交关系增强的复杂视频人物检索方法,其特征在于,所述利用相应的文本信息预测两个候选节点之间的关系与类别概率的公式为:
其中,rkj与pkj各自表示两个候选节点gk与gj之间的关系预测结果与类别概率;SVM表示校准支持向量机;et表示候选节点所处场景内文本信息的文本表征向量;为两个候选节点gk与gj的性别表征,为两个候选节点gk与gj的年龄表征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学技术大学,未经中国科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110677925.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:氮气加压式液体加料装置及方法
- 下一篇:一种多模态机械臂的异步滑模控制方法