[发明专利]模型训练方法、视频处理方法、装置、介质和计算设备在审
| 申请号: | 201910811249.3 | 申请日: | 2019-08-29 |
| 公开(公告)号: | CN110516749A | 公开(公告)日: | 2019-11-29 |
| 发明(设计)人: | 孙丽坤;许盛辉;刘彦东 | 申请(专利权)人: | 网易传媒科技(北京)有限公司 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/00 |
| 代理公司: | 11021 中科专利商标代理有限责任公司 | 代理人: | 葛琪妮<国际申请>=<国际公布>=<进入 |
| 地址: | 100084 北京市海淀区西北*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 视频片段 神经网络模型 优化模型 标签 模型训练装置 视频处理装置 有效信息量 计算设备 模型训练 目标视频 时间维度 视频处理 视频文件 最大有效 信息量 | ||
本发明的实施方式提供了一种模型训练方法,包括:获取多个视频片段;分别为所述多个视频片段添加标签,其中,所述标签用于表征所述视频片段所包含的有效信息量;建立包含时间维度的神经网络模型;以及,利用带有标签的所述多个视频片段对所述神经网络模型进行训练,得到优化模型,所述优化模型用于从视频文件中提取包含最大有效信息量的目标视频片段。本发明的实施方式还提供了一种视频处理方法、模型训练装置、视频处理装置、介质和计算设备。
技术领域
本发明的实施方式涉及计算机技术领域,更具体地,本发明的实施方式涉及模型训练方法、视频处理方法、装置、介质和计算设备。
背景技术
本部分旨在为权利要求书中陈述的本发明的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
现有技术中,通常将对于视频文件中精彩片段和非精彩片段的分辨当做一个二分类问题进行分析解决,通过交叉熵损失来进行二分类模型训练,并且在进行模型训练过程往往会忽略视频片段中的时序特征,导致训练得到的模型对不同精彩程度的视频片段的分辨能力有限。
发明内容
在本上下文中,本发明的实施方式期望提供一种模型训练方法、视频处理方法、装置、介质和计算设备。
在本发明实施方式的第一方面中,提供了一种模型训练方法,包括:获取多个视频片段,然后分别为该多个视频片段添加标签。其中,标签用于表征视频片段所包含的有效信息量。接着,建立包含时间维度的神经网络模型,并利用带有标签的上述多个视频片段对该神经网络模型进行训练,得到优化模型。该优化模型用于从视频文件中提取包含最大有效信息量的目标视频片段。
在本发明的一个实施例中,上述标签包括:第一标签、第二标签和第三标签。其中,第一标签表征的有效信息量大于第二标签表征的有效信息量,第二标签表征的有效信息量大于第三标签表征的有效信息量。
在本发明的另一实施例中,上述利用带有标签的多个视频片段对神经网络模型进行训练包括:基于带有标签的多个视频片段构建多个样本对。其中每个样本对包括带有不同标签的两个视频片段。然后利用多个样本对对神经网络模型进行训练,得到优化模型。
在本发明的又一实施例中,上述利用多个样本对对神经网络模型进行训练,得到优化模型包括:对于任一样本对,该任一样本对包括第一视频片段和第二视频片段,其中第一视频片段的标签表征的有效信息量大于第二视频片段的标签表征的有效信息量。然后将该任一样本对输入至神经网络模型,分别得到第一视频片段的第一得分和第二视频片段的第二得分。将第一得分减去第二得分后得到第一数值,利用损失函数基于该第一数值确定损失值,其中损失函数为单调减函数。当该损失值小于等于预定阈值时,确定当前训练得到的神经网络模型为优化模型。当该损失值大于预定阈值时,对当前训练得到的神经网络模型的参数继续进行优化,重复上述操作直至得到优化模型。
在本发明的再一实施例中,上述将一个样本对中的两个视频片段分别输入至神经网络模型包括:对于每个视频片段,从该视频片段中提取包含预定数量图像的图像序列,然后将该图像序列输入至神经网络模型。
在本发明的再一实施例中,上述建立包含时间维度的神经网络模型包括:建立卷积神经网络模型,并为该卷积神经网络模型设置包含时间维度的一个或多个卷积核。
在本发明的再一实施例中,上述获取多个视频片段包括:获取多个视频样本以及与该多个视频样本相关的图像交换格式文件。然后对于该多个视频样本中的任一视频样本,确定与该任一视频样本相关的图像交换格式文件在该任一样本视频中的开始位置和结束位置,从该任一视频样本中提取从上述开始位置至上述结束位置的视频片段。
在本发明的再一实施例中,上述分别为多个视频片段添加标签包括:对于从任一视频样本中提取的从上述开始位置至上述结束位置的视频片段,添加第一标签。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于网易传媒科技(北京)有限公司,未经网易传媒科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910811249.3/2.html,转载请声明来源钻瓜专利网。





