[发明专利]弹幕处理方法、装置及存储介质有效
申请号: | 201910372154.6 | 申请日: | 2019-05-06 |
公开(公告)号: | CN110166802B | 公开(公告)日: | 2022-11-01 |
发明(设计)人: | 余自强 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | H04N21/254 | 分类号: | H04N21/254;H04N21/475;H04N21/4782;H04N21/488 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 郭润湘;李娟 |
地址: | 518044 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 弹幕 处理 方法 装置 存储 介质 | ||
本发明涉及网络技术领域,公开了一种弹幕处理方法、装置及存储介质,所述方法包括:获取弹幕文本,并将弹幕文本转换为对应的词向量;将弹幕文本对应的词向量输入预先训练的剧透识别模型,得到弹幕文本对应的剧透概率值,剧透识别模型基于剧透弹幕样本训练得到,剧透概率值用于表示弹幕文本为剧透弹幕的概率;将剧透概率值大于设定阈值的弹幕文本确定为剧透弹幕,以使客户端在接收到剧透弹幕时根据设定的展示模式展示剧透弹幕。本发明实施例提供的技术方案,通过剧透识别模型,可自动、快速地对大量弹幕文本进行判断,识别出其中的剧透弹幕,解决了现有技术无法有效识别剧透弹幕的问题,且识别准确度较高。
技术领域
本发明涉及网络技术领域,尤其涉及一种弹幕处理方法、装置及存储介质。
背景技术
随着互联网技术的发展,人们日益喜欢在网络上看剧或看电影的时候打开弹幕,享受这种互动体验带来的乐趣。但是,弹幕的质量也越来越不受保障,除了出现一些低质量或具有攻击性言语的弹幕外,还常常出现透露剧情的弹幕,这很可能毁掉用户对整个视频的观影体验,尤其是在观看悬疑类影片时,剧透弹幕会大幅度地降低观影体验。虽然视频网站或视频播放器提供了关闭弹幕的功能,但是一些剧透弹幕在视频刚开始播放时就已经展示给用户,此时用户还没来得及开启关闭弹幕的功能,这导致很多用户在观看视频前就直接选择关闭弹幕,或者通过弹幕对剧透者进行言语攻击,使得整个弹幕环境变得更差,严重影响用户体验。此外,阅读小说、漫画、收听故事音频时也存在通过弹幕进行互动的需求,因此也同样存在剧透弹幕的问题。因此亟需一种能够有效识别剧透弹幕的方法。
发明内容
本发明实施例提供一种弹幕处理方法、装置、终端、服务器及存储介质,以解决现有技术中无法识别剧透弹幕的问题。
第一方面,本发明一实施例提供了一种弹幕处理方法,包括:
获取弹幕文本,并将所述弹幕文本转换为对应的词向量矩阵;
将所述弹幕文本对应的词向量矩阵输入预先训练的剧透识别模型,得到所述弹幕文本对应的剧透概率值,所述剧透识别模型基于剧透弹幕样本训练得到,所述剧透概率值用于表示所述弹幕文本为剧透弹幕的概率;
将剧透概率值大于设定阈值的弹幕文本确定为剧透弹幕,以使客户端在接收到所述剧透弹幕时根据设定的展示模式展示所述剧透弹幕。
可选地,还包括:
响应客户端的弹幕获取请求,将弹幕文件发送给所述客户端,所述弹幕文件包括:剧透弹幕和非剧透弹幕。
可选地,还包括:
响应客户端的弹幕获取请求,将弹幕文件发送给所述客户端,所述弹幕文件包括:剧透弹幕、非剧透弹幕和所述剧透弹幕对应的剧透概率值,以使所述客户端根据剧透弹幕对应的剧透概率值确定剧透弹幕的展示效果。
可选地,通过如下步骤训练所述剧透识别模型:
获取剧透弹幕样本集,每个剧透弹幕样本包括:标记有剧透标识的弹幕文本,所述剧透标识用于表征弹幕文本是否为剧透弹幕;
针对所述剧透弹幕样本集中的每个剧透弹幕样本,将所述剧透弹幕样本中属于预设类型的词汇更新为所述预设类型对应的替换标识;
针对所述剧透弹幕样本集中的每个剧透弹幕样本,将更新后的剧透弹幕样本转换为对应的词向量矩阵;
基于所述剧透弹幕样本集中的剧透弹幕样本对应的词向量矩阵和剧透标识,训练所述剧透识别模型。
可选地,所述将更新后的剧透弹幕样本转换为对应的词向量矩阵,具体包括:
将更新后的剧透弹幕样本包含的每个单词转换为对应的词向量,所述更新后的剧透弹幕样本中的一个替换标识对应一个单词,基于所述每个单词对应的词向量得到所述剧透弹幕样本对应的词向量矩阵;或者,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910372154.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:媒体文件的处理方法、装置及存储介质
- 下一篇:一种网络媒体的互动方法