[发明专利]一种基于语义最大间隔聚类的多视角行为识别方法有效
申请号: | 201310584918.0 | 申请日: | 2013-11-20 |
公开(公告)号: | CN103605989B | 公开(公告)日: | 2017-02-01 |
发明(设计)人: | 不公告发明人 | 申请(专利权)人: | 康江科技(北京)有限责任公司 |
主分类号: | G06K9/64 | 分类号: | G06K9/64 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100190 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明的各实施方式提供了一种基于语义最大间隔聚类的多视角行为识别方法,包括首先提取每个动作视频样本中的每帧的全局外形流特征,利用词包模型得到相应动作视频样本帧的特征表示向量;利用多次随机映射,对上述特征表示向量进行降维;对于每次随机映射所降维得到的特征向量,利用语义最大间隔聚类的方法进行聚类;利用训练出的模型对所有样本中的源目标样本进行判断,然后直接将源目标样本的分离特征作为目标域的分离特征;以及将该目标域的分离特征作为输入,利用支持向量机训练分类模型;利用该支持向量机的分类模型得到目标域的测试样本的分离特征,并利用最近邻分类器对其分类。 | ||
搜索关键词: | 一种 基于 语义 最大 间隔 视角 行为 识别 方法 | ||
【主权项】:
一种基于语义最大间隔聚类的多视角行为识别方法,其特征在于,所述方法包括以下步骤:步骤1,首先提取每个动作视频样本中的每帧的全局外形流特征,然后基于该全局外形流特征,利用词包模型对每个动作视频样本的每帧产生多维的全局外形流特征的特征向量,并将该特征向量作为相应动作视频样本帧的特征表示向量;步骤2,利用多次随机映射,对上述特征表示向量进行降维;步骤3,对于每次随机映射所降维得到的特征向量,利用语义最大间隔聚类的方法进行聚类,该聚类的模型训练公式如下:;(wTΦ(xi)+b)‑yi≤ξi,‑l≤eTy≤l,其中,γ>0是正则参数控制连续帧之间的约束,xi是降维后的第i帧特征向量,yi是xi的类别标签,y是yi的向量,w和b是分类器参数,ξi和是松弛变量,Φ是映射函数,l是类平衡常数,e是元素均为1的向量,C是平衡间隔和松弛变量惩罚的参数,T表示转置;其中,其中,N表示所有帧的数量,f=Φ·w=[f(x1),f(x2),…,f(xN)]为所有帧的置信度向量,L=D‑S是拉普拉斯矩阵,其中,S=[Sij],D是对角矩阵且其元素此外,S矩阵的元素Sij描述的帧与帧之间的关系,如果i和j是相邻帧,则Sij=1,否则为0;步骤4,利用步骤3中所训练出的模型对所有样本中的源目标样本进行判断,由此每个源目标样本 能够得到多个0、1编码的特征,记为分离特征,然后直接将源目标样本的分离特征作为目标域的分离特征;步骤5,将该目标域的分离特征作为输入,利用支持向量机训练分类模型;以及步骤6,利用该支持向量机的分类模型得到目标域的测试样本的分离特征,并利用最近邻分类器对其分类。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于康江科技(北京)有限责任公司,未经康江科技(北京)有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310584918.0/,转载请声明来源钻瓜专利网。
- 上一篇:一种水冷式服务器装置
- 下一篇:一种质心不确定移动机器人的建模方法