[发明专利]一种弹幕识别模型建立方法、装置、服务器及介质有效
申请号: | 201811052795.5 | 申请日: | 2018-09-10 |
公开(公告)号: | CN109189889B | 公开(公告)日: | 2021-03-12 |
发明(设计)人: | 王非池 | 申请(专利权)人: | 武汉斗鱼网络科技有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06N3/04;H04N21/431;H04N21/4788;H04N21/488 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 430070 湖北省武汉市武汉东湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 弹幕 识别 模型 建立 方法 装置 服务器 介质 | ||
1.一种弹幕识别模型建立方法,其特征在于,包括:
使用弹幕训练样本对对预先构建的卷积神经网络进行训练;
其中,所述弹幕训练样本对包括:弹幕样本词向量以及与弹幕样本词向量对应的弹幕类型值;所述弹幕类型值包括正常弹幕输出值和异常弹幕输出值;
将训练完成的卷积神经网络作为所述弹幕识别模型。
2.根据权利要求1所述的方法,其特征在于,所述卷积神经网络,包括:输入层、隐藏层、全连接层和输出层首尾相连;
所述隐藏层包括至少两个计算网络分支;
所述计算网络分支包括卷积层、与所述卷积层连接的激活层、与所述激活层连接的池化层和与所述池化层连接的折叠层。
3.根据权利要求1所述的方法,其特征在于,在所述使用弹幕训练样本对预先构建的卷积神经网络进行训练之前,还包括:
获取原始弹幕样本;
根据预设标准词表,对各所述原始弹幕样本进行独热编码,生成初始弹幕样本词向量;
对所述初始弹幕样本词向量进行降维处理,生成所述弹幕样本词向量。
4.根据权利要求3所述的方法,其特征在于,在根据预设标准词表,对各所述原始弹幕样本进行独热编码,生成初始弹幕样本词向量之前,还包括:
去除各原始弹幕样本中的异常字符,并更新所述原始弹幕样本;和/或
去除各所述原始弹幕样本中内容相同的弹幕样本,并更新所述原始弹幕样本。
5.根据权利要求1所述的方法,其特征在于,使用弹幕训练样本对对预先构建的神经网络进行训练,包括:
选取设定数量的弹幕训练样本对;
依次获取一个弹幕训练样本对输入至预先构建的卷积神经网络中,得到所述卷积神经网络基于弹幕样本词向量的输出结果,并基于所述输出结果对预先构建的卷积神经网络中的加权参数进行调整;
返回执行获取一个弹幕样本词向量输入至所述卷积神经网络的操作,直至达到预先设定的训练结束条件。
6.根据权利要求5所述的方法,其特征在于,所述基于所述输出结果对预先构建的卷积神经网络中的加权参数进行调整,包括:
计算所述输出结果和弹幕类型值之间的交叉熵函数;
采用设定权重更新算法,沿着最小化交叉熵函数的方向,反向逐层更新预先构建的卷积神经网络中各层的加权参数。
7.根据权利要求1-6任一项所述的方法,其特征在于,在所述将训练完成的卷积神经网络作为所述弹幕识别模型之后,还包括:
获取弹幕预测样本作为输入样本输入所述弹幕识别模型中;
根据所述弹幕识别模型的预测结果,标记所述弹幕预测样本;
根据标记结果,对所述弹幕样本对应的原始弹幕进行显示。
8.一种弹幕识别模型建立装置,其特征在于,包括:
训练模块,用于使用弹幕训练样本对对预先构建的卷积神经网络进行训练;
其中,所述弹幕训练样本对包括:至少两个弹幕样本词向量以及与弹幕样本词向量对应的弹幕类型值;所述弹幕类型值包括正常弹幕输出值和异常弹幕输出值;
模型生成模块,用于将训练完成的卷积神经网络作为所述弹幕识别模型。
9.一种服务器,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一项所述的一种弹幕识别模型建立方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一项所述的一种弹幕识别模型建立方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉斗鱼网络科技有限公司,未经武汉斗鱼网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811052795.5/1.html,转载请声明来源钻瓜专利网。