[发明专利]一种将短文本分类应用于视频中的状态判断方法在审
| 申请号: | 201810988788.X | 申请日: | 2018-08-28 |
| 公开(公告)号: | CN109299322A | 公开(公告)日: | 2019-02-01 |
| 发明(设计)人: | 刘志伟;方小雷 | 申请(专利权)人: | 南京葡萄诚信息科技有限公司 |
| 主分类号: | G06F16/73 | 分类号: | G06F16/73;G06F16/35;G06F17/27 |
| 代理公司: | 深圳市添源知识产权代理事务所(普通合伙) 44451 | 代理人: | 罗志伟 |
| 地址: | 210000 江苏省南京市建*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明提供了一种将短文本分类应用于视频中的状态判断方法,包括以下步骤:S1、对视频过程中的原始文本进行包括分词、去除停用在内的预处理;S2、对预处理后的文本进行向量化,将原始文本中的短文本转化形成一个映射矩阵;对映射矩阵和权值为1的核矩阵进行一维卷积运算,得到文本中潜在的多尺度的候选语义单元;S3、找出每个候选语义单元最近邻词表示,计算候选语义单元和向量空间中所有词表示向量的欧式距离。本发明的有益效果是:将基于卷积神经网络的短文本分类应用于视频面试中状态的判断,可应用于视频面试中,理解候选人意图,实现人工智能面试,也可以拓展应用于其他领域的视频中状态的判断。 | ||
| 搜索关键词: | 视频 短文本分类 语义单元 预处理 映射矩阵 原始文本 状态判断 应用 文本 卷积神经网络 人工智能 欧式距离 拓展应用 一维卷积 短文本 多尺度 核矩阵 和向量 潜在的 向量化 最近邻 分词 停用 向量 去除 运算 转化 | ||
【主权项】:
1.一种将短文本分类应用于视频中的状态判断方法,其特征在于,包括以下步骤:S1、对视频过程中的原始文本进行包括分词、去除停用在内的预处理;S2、对预处理后的文本进行向量化,将原始文本中的短文本转化形成一个映射矩阵;对映射矩阵与权值为1的核矩阵进行一维卷积运算,得到文本中潜在的多尺度的候选语义单元;S3、找出每个候选语义单元最近邻词表示,计算候选语义单元和向量空间中所有词表示向量的欧式距离,确定满足欧式距离预设阈值条件的最近邻词表示,基于最近邻词表示构建语义拓展矩阵;S4、用多个不同宽度、包含不同权值的核矩阵分别对短文本的映射矩阵和语义扩展矩阵进行二维卷积运算,提取局部卷积特征,并生成多层局部卷积特征矩阵;S5、对多层局部卷积特征矩阵进行下采样,得到短文本的全局特征矩阵;将全局特征矩阵进行非线性正切变换,并转换为语义特征向量;S6、将短文本的语义特征向量赋予分类器,对短文本的类别进行预测。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京葡萄诚信息科技有限公司,未经南京葡萄诚信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810988788.X/,转载请声明来源钻瓜专利网。





