[发明专利]一种将短文本分类应用于视频中的状态判断方法在审
| 申请号: | 201810988788.X | 申请日: | 2018-08-28 |
| 公开(公告)号: | CN109299322A | 公开(公告)日: | 2019-02-01 |
| 发明(设计)人: | 刘志伟;方小雷 | 申请(专利权)人: | 南京葡萄诚信息科技有限公司 |
| 主分类号: | G06F16/73 | 分类号: | G06F16/73;G06F16/35;G06F17/27 |
| 代理公司: | 深圳市添源知识产权代理事务所(普通合伙) 44451 | 代理人: | 罗志伟 |
| 地址: | 210000 江苏省南京市建*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 视频 短文本分类 语义单元 预处理 映射矩阵 原始文本 状态判断 应用 文本 卷积神经网络 人工智能 欧式距离 拓展应用 一维卷积 短文本 多尺度 核矩阵 和向量 潜在的 向量化 最近邻 分词 停用 向量 去除 运算 转化 | ||
1.一种将短文本分类应用于视频中的状态判断方法,其特征在于,包括以下步骤:
S1、对视频过程中的原始文本进行包括分词、去除停用在内的预处理;
S2、对预处理后的文本进行向量化,将原始文本中的短文本转化形成一个映射矩阵;对映射矩阵与权值为1的核矩阵进行一维卷积运算,得到文本中潜在的多尺度的候选语义单元;
S3、找出每个候选语义单元最近邻词表示,计算候选语义单元和向量空间中所有词表示向量的欧式距离,确定满足欧式距离预设阈值条件的最近邻词表示,基于最近邻词表示构建语义拓展矩阵;
S4、用多个不同宽度、包含不同权值的核矩阵分别对短文本的映射矩阵和语义扩展矩阵进行二维卷积运算,提取局部卷积特征,并生成多层局部卷积特征矩阵;
S5、对多层局部卷积特征矩阵进行下采样,得到短文本的全局特征矩阵;将全局特征矩阵进行非线性正切变换,并转换为语义特征向量;
S6、将短文本的语义特征向量赋予分类器,对短文本的类别进行预测。
2.根据权利要求1所述的将短文本分类应用于视频中的状态判断方法,其特征在于,步骤S2包括以下内容:
词向量训练:将分好词的语料文本word2vec来训练,在训练过程中生成一组向量,将每个词映射到一个n维词向量;
文本预处理:利用训练好的词向量模型将待训练样本转化为以词向量为元素的序列表示,构建映射矩阵PM,用于后续神经网络的训练;
利用短文本对应的映射矩阵PM,对所述短文本中的候选语义单元进行检测;候选语义单元Si的一维卷积运算的具体计算公式为:
其中,Ewin是采用的核矩阵,所有核矩阵Ewin中的所有权值为1,Si是短文本中存在的第i个候选的语义单元,1≤i≤l-m+1,l-m+1为候选语义单元的数量,l是短文本的长度,m是所述核矩阵的宽度;
候选语义单元Si的计算公式为:
其中,PMwin,i是核矩阵Ewin在短文本的映射矩阵PM上第i次滑动时所覆盖的子矩阵,是所述子矩阵PMwin,i的第j列,j=1,2...,|PMwin,i|;由于卷积核矩阵Ewin的尺度可以调整,因此随着m值的变化,可以检测到多尺度的候选语义单元。
3.根据权利要求2所述的将短文本分类应用于视频中的状态判断方法,其特征在于:在步骤S2中,组成映射矩阵采用的是word2vec中的skip-gram模型,将状态判断模块数据集表示为50维的词向量形式;转化为词向量形式后将每一句话转化为一个矩阵的形式。
4.根据权利要求2所述的将短文本分类应用于视频中的状态判断方法,其特征在于,步骤S3包括:利用所述候选语义单元Si和词表LT,为所述短文本构建语义扩展矩阵EM,作为对所述短文本的信息补充。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京葡萄诚信息科技有限公司,未经南京葡萄诚信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810988788.X/1.html,转载请声明来源钻瓜专利网。





