首页在售求购查询申请展会资讯专利榜企服商城升级VIP

立即登录免费注册

在售专利
求购专利
查询专利
新闻资讯
技术展会
招商加盟
专利榜

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

[发明专利]弹幕类别识别方法、装置、设备及存储介质在审

申请号：	201811310439.9	申请日：	2018-11-06
公开（公告）号：	CN109766435A	公开（公告）日：	2019-05-17
发明（设计）人：	王非池	申请（专利权）人：	武汉斗鱼网络科技有限公司
主分类号：	G06F16/35	分类号：	G06F16/35;G06F17/27;H04N21/488
代理公司：	北京品源专利代理有限公司 11332	代理人：	孟金喆
地址：	430070 湖北省武汉市武汉东湖***	国省代码：	湖北;42
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	文本特征逻辑回归模型存储介质类别识别行为特征用户行为特征大小关系情绪信息文本信息有效地统计子弹输出融合
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种弹幕类别识别方法，其特征在于，包括：

获取待处理弹幕的文本特征的特征值；

获取用户行为特征的统计值；

将所述文本特征的特征值和所述行为特征的统计值输入已训练的逻辑回归模型，并根据该已训练的逻辑回归模型的输出值与阈值的大小关系确定所述待处理弹幕的弹幕类别，其中，所述弹幕类别包括正常弹幕和喷子弹幕。

2.根据权利要求1所述的方法，其特征在于，所述待处理弹幕的文本特征的特征值，包括：

所述待处理弹幕的预设标点符号特征的特征值、预设表情特征的特征值和预设负面词语特征的特征值，以及所述待处理弹幕的有效分词的TF-IDF值。

3.根据权利要求2所述的方法，其特征在于，所述预设标点符号特征的特征值为：若待处理弹幕存在预设标点符号特征，则该预设标点符号特征的特征值为1，否则为0；

所述预设表情特征的特征值为：若待处理弹幕存在预设表情特征，则该预设表情特征的特征值为1，否则为0；

所述预设负面词语特征的特征值为：若待处理弹幕存在预设负面词语特征，则该预设词语特征的特征值为1，否则为0。

4.根据权利要求2所述的方法，其特征在于，求取所述待处理弹幕的有效分词的TF-IDF值，包括：

获取每个有效分词在所述待处理弹幕中的词频以作为TF值，具体为：其中n_i，j表示有效分词i在待处理弹幕j中出现的次数，∑_kn_k，j表示待处理弹幕j的有效分词数量；

获取每个有效分词的逆文本频率指数，即IDF值，具体为：其中，|D|表示样本集的弹幕总条数，|{j：t_i∈d_j}|表示样本集中包含有效分词i的弹幕条数；

求取所述TF值与所述IDF值的乘积以作为TF-IDF值，具体为：TF-IDF_i，j＝＝tf_i，j*idf_i。

5.根据权利要求2所述的方法，其特征在于，所述文本特征包括预设标点符号特征、预设表情特征和预设负面词语特征，相应的，提取待处理弹幕的文本特征，包括：

基于正则化匹配法提取所述待处理弹幕的预设标点符号特征、预设表情特征和预设负面词语特征。

6.根据权利要求1所述的方法，其特征在于，所述行为特征的统计值包括：

预设统计时间内，与当前弹幕相同的弹幕的出现次数、与当前弹幕具有相同负面词语的弹幕条数，以及与当前弹幕具有相同负面表情的弹幕条数。

7.根据权利要求6所述的方法，其特征在于，所述行为特征的统计值还包括：

预设统计时间内，发送当前弹幕的IP所发送的弹幕条数，以及发送当前弹幕的设备所发送的弹幕条数。

8.一种弹幕类别识别方法，其特征在于，包括：

特征值获取模块，用于获取待处理弹幕的文本特征的特征值；

统计值获取模块，用于获取用户行为特征的统计值；

识别模块，用于将所述文本特征的特征值和所述行为特征的统计值输入已训练的逻辑回归模型，并根据该已训练的逻辑回归模型的输出值与阈值的大小关系确定所述待处理弹幕的弹幕类别，其中，所述弹幕类别包括正常弹幕和喷子弹幕。

9.一种设备，其特征在于，所述设备包括：

一个或多个处理器；

存储装置，用于存储一个或多个程序；

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如权利要求1-7中任一所述的弹幕类别识别方法。

10.一种包含计算机可执行指令的存储介质，其特征在于，所述计算机可执行指令在由计算机处理器执行时用于执行如权利要求1-7中任一所述的弹幕类别识别方法。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于武汉斗鱼网络科技有限公司，未经武汉斗鱼网络科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201811310439.9/1.html，转载请声明来源钻瓜专利网。

上一篇：摘要生成方法及装置
下一篇：一种数据表的字段与知识库的数据元匹配的方法和装置

同类专利

专利分类

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

友情链接：交换友情链接需要网站权重大于4，网站收录10W以上，如符合条件，请联系QQ：。

关于我们寻求报道投稿须知广告合作版权声明网站地图友情链接企业标识联系我们

在线咨询

周一至周五 9:00-18:00

版权所有http://www.vipzhuanli.com/公布日期

咨询在线客服

咨询在线客服

tel code back_top