[发明专利]一种弹幕识别模型建立方法、装置、服务器及介质有效
申请号: | 201811052795.5 | 申请日: | 2018-09-10 |
公开(公告)号: | CN109189889B | 公开(公告)日: | 2021-03-12 |
发明(设计)人: | 王非池 | 申请(专利权)人: | 武汉斗鱼网络科技有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06N3/04;H04N21/431;H04N21/4788;H04N21/488 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 430070 湖北省武汉市武汉东湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 弹幕 识别 模型 建立 方法 装置 服务器 介质 | ||
本发明公开了一种弹幕识别模型建立方法、装置、服务器及介质。该方法包括:使用弹幕训练样本对对预先构建的卷积神经网络进行训练;将训练完成的卷积神经网络作为弹幕识别模型;其中,弹幕训练样本对包括弹幕样本词向量以及与弹幕样本词向量对应的弹幕类型值,弹幕类型值包括正常弹幕输出值和异常弹幕输出值。采用上述技术方案训练获得的弹幕识别模型,可以有效过滤异常弹幕,提高异常弹幕的识别正确率和识别效率,同时能够实现弹幕识别模型的自主增量学习。
技术领域
本发明实施例涉及计算机技术领域,尤其涉及一种弹幕识别模型建立方法、装置、服务器及介质。
背景技术
弹幕是网络直播的重要组成部分,是直播间热度的客观反应。用户之间可以通过弹幕进行互动,主播也可以通过弹幕直接了解用户的想法,提升用户的观看体验。
随着直播平台的发展,超大型主播观看人数爆炸,这导致直播过程中短时间的弹幕量可能达到几千甚至几万量级。如果短时间在直播界面上显示如此海量的弹幕,一方面会由于弹幕过于密集遮挡主播的直播内容;另一方面会导致用户软件服务高负载,耗费大量流量和内存。
由于短时间内海量弹幕中包含大量的低质量弹幕,因此,可以通过对低质量弹幕识别的方式实现直播界面所显示的弹幕的数量的有效控制。现有技术中,通常采用人工筛查或关键词正则匹配等方式进行低质量弹幕(也即异常弹幕)的过滤。然而,上述方法对低质量弹幕的识别效果较差,识别效率也较低。同时,由于建立的弹幕识别模型在训练过程中无法进行训练样本的增量调整,因此也无法实现模型训练中的自主增量学习。
发明内容
本发明实施例提供了一种弹幕识别模型建立方法、装置、服务器及介质,以实现对低质量弹幕的过滤。
第一方面,本发明实施例提供了一种弹幕识别模型建立方法,包括:
使用弹幕训练样本对对预先构建的卷积神经网络进行训练;
其中,所述弹幕训练样本对包括:弹幕样本词向量以及与弹幕样本词向量对应的弹幕类型值;所述弹幕类型值包括正常弹幕输出值和异常弹幕输出值;
将训练完成的卷积神经网络作为所述弹幕识别模型。
第二方面,本发明实施例还提供了一种弹幕识别模型建立装置,包括:
训练模块,用于使用弹幕训练样本对对预先构建的卷积神经网络进行训练;
其中,所述弹幕训练样本对包括:至少两个弹幕样本词向量以及与弹幕样本词向量对应的弹幕类型值;所述弹幕类型值包括正常弹幕输出值和异常弹幕输出值;
模型生成模块,用于将训练完成的卷积神经网络作为所述弹幕识别模型。
第三方面,本发明实施例还提供了一种服务器,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如第一方面实施例所提供的一种弹幕识别模型建立方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面实施例所提供的一种弹幕识别模型建立方法。
本发明实施例通过使用弹幕训练样本对对预先构建的卷积神经网络进行训练;将训练完成的卷积神经网络作为弹幕识别模型;其中,弹幕训练样本对包括弹幕样本词向量以及与弹幕样本词向量对应的弹幕类型值,弹幕类型值包括正常弹幕输出值和异常弹幕输出值。采用上述技术方案训练获得的弹幕识别模型,可以有效过滤异常弹幕,提高异常弹幕的识别正确率和识别效率,同时能够实现弹幕识别模型的自主增量学习。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉斗鱼网络科技有限公司,未经武汉斗鱼网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811052795.5/2.html,转载请声明来源钻瓜专利网。