[发明专利]弹幕处理方法、装置及存储介质有效
申请号: | 201910372154.6 | 申请日: | 2019-05-06 |
公开(公告)号: | CN110166802B | 公开(公告)日: | 2022-11-01 |
发明(设计)人: | 余自强 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | H04N21/254 | 分类号: | H04N21/254;H04N21/475;H04N21/4782;H04N21/488 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 郭润湘;李娟 |
地址: | 518044 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 弹幕 处理 方法 装置 存储 介质 | ||
1.一种弹幕处理方法,其特征在于,包括:
获取弹幕文本,将所述弹幕文本中属于预设类型的词汇更新为所述预设类型对应的替换标识,并将更新后的弹幕文本转换为对应的词向量矩阵;
将所述弹幕文本对应的词向量矩阵输入预先训练的剧透识别模型,得到所述弹幕文本对应的剧透概率值,所述剧透识别模型基于剧透弹幕样本训练得到,所述剧透概率值用于表示所述弹幕文本为剧透弹幕的概率;
将剧透概率值大于设定阈值的弹幕文本确定为剧透弹幕,以使客户端在接收到所述剧透弹幕时根据设定的展示模式展示所述剧透弹幕;所述展示模式包括字体、字号、弹幕滚动速度和弹幕留存时间;
所述将所述弹幕文本中属于预设类型的词汇更新为所述预设类型对应的替换标识,包括:
获取所述弹幕文本对应的相关信息,根据从所述相关信息中提取出的命名实体,结合预设的命名实体,对所述弹幕文本进行命名实体识别,识别出属于命名实体的词汇;所述相关信息至少包括所述弹幕文本对应的多媒体资源的剧情简介和人物介绍;
确定所述属于命名实体的词汇对应的预设类型,并将所述属于命名实体的词汇更新为所述预设类型对应的替换标识。
2.根据权利要求1所述的方法,其特征在于,还包括:
响应客户端的弹幕获取请求,将弹幕文件发送给所述客户端,所述弹幕文件包括:剧透弹幕和非剧透弹幕,或者,所述弹幕文件包括:剧透弹幕、非剧透弹幕和所述剧透弹幕对应的剧透概率值,以使所述客户端根据所述剧透弹幕对应的剧透概率值确定展示所述剧透弹幕时的弱化显示参数。
3.根据权利要求1或2所述的方法,其特征在于,通过如下步骤训练所述剧透识别模型:
获取剧透弹幕样本集,每个剧透弹幕样本包括:人工标记有剧透标识的弹幕文本或客户端上传的标记有剧透标识的弹幕文本,所述剧透标识用于表征弹幕文本是否为剧透弹幕;
针对所述剧透弹幕样本集中的每个剧透弹幕样本,将所述剧透弹幕样本中属于预设类型的词汇更新为所述预设类型对应的替换标识;
针对所述剧透弹幕样本集中的每个剧透弹幕样本,将更新后的剧透弹幕样本转换为对应的词向量矩阵;
基于所述剧透弹幕样本集中的剧透弹幕样本对应的词向量矩阵和剧透标识,训练所述剧透识别模型。
4.根据权利要求3所述的方法,其特征在于,所述将更新后的剧透弹幕样本转换为对应的词向量矩阵,具体包括:
将更新后的剧透弹幕样本包含的每个单词转换为对应的词向量,所述更新后的剧透弹幕样本中的一个替换标识对应一个单词,基于所述每个单词对应的词向量得到所述剧透弹幕样本对应的词向量矩阵;或者,
对更新后的剧透弹幕样本进行分词处理获得若干词汇,所述更新后的剧透弹幕中的一个替换标识对应一个词汇,将获得的若干词汇分别转换为对应的词向量,基于所述若干词汇对应的词向量得到所述剧透弹幕样本对应的词向量矩阵。
5.根据权利要求1所述的方法,其特征在于,所述将更新后的弹幕文本转换为对应的词向量矩阵,具体包括:
将更新后的弹幕文本包含的每个单词转换为对应的词向量,所述更新后的弹幕文本中的一个替换标识对应一个单词,基于所述每个单词对应的词向量得到所述弹幕文本对应的词向量矩阵;或者,
对更新后的弹幕文本进行分词处理获得若干词汇,所述更新后的弹幕文本中的一个替换标识对应一个词汇,将获得的若干词汇分别转换为对应的词向量,基于所述若干词汇对应的词向量得到所述弹幕文本对应的词向量矩阵。
6.根据权利要求3所述的方法,其特征在于,所述获取剧透弹幕样本集,具体包括:
获取任一剧情类型对应的剧透弹幕样本集,所述任一剧情类型对应的剧透弹幕样本集中的剧透弹幕样本为属于所述任一剧情类型的多媒体资源播放过程中产生的弹幕文本;
所述基于所述剧透弹幕样本集中的剧透弹幕样本对应的词向量矩阵和剧透标识,训练所述剧透识别模型,具体包括:
基于所述剧透弹幕样本集中的剧透弹幕样本对应的词向量矩阵和剧透标识,训练所述任一剧情类型对应的剧透识别模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910372154.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:媒体文件的处理方法、装置及存储介质
- 下一篇:一种网络媒体的互动方法