[发明专利]一种信息抽取的弹幕评论推荐方法有效
| 申请号: | 202010380057.4 | 申请日: | 2020-05-08 |
| 公开(公告)号: | CN111683294B | 公开(公告)日: | 2021-05-07 |
| 发明(设计)人: | 吴雯;班启敏;陈嘉逸;贺樑 | 申请(专利权)人: | 华东师范大学 |
| 主分类号: | H04N21/4788 | 分类号: | H04N21/4788;H04N21/466;H04N21/475;H04N21/435;G06F16/33;G06F16/35;G06F40/30;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 上海蓝迪专利商标事务所(普通合伙) 31215 | 代理人: | 徐筱梅;张翔 |
| 地址: | 200241 *** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 信息 抽取 弹幕 评论 推荐 方法 | ||
1.一种信息抽取的弹幕评论推荐方法,其特征在于采用周围弹幕评论词嵌入模块、周围弹幕评论句子语义嵌入模块、周围弹幕评论间相似度计算模块、周围弹幕评论分数预测模块,以及基于深度学习的信息抽取方法,使用周围弹幕评论之间的相关性使弹幕评论之间进行关联,在用户发送弹幕评论时提供候选的弹幕评论列表,为目标用户推荐在某一时间点合适的评论,具体包括以下具体步骤:
步骤1:目标弹幕评论以及周围弹幕评论的获取
根据弹幕的发送时间,选取最近的10%弹幕评论作为目标弹幕评论,用于之后的模型训练和性能评估,其余的作为候选集,用于为用户生成弹幕评论推荐;所述模型训练时每个目标弹幕评论根据其对应的视频内容播放时间,选取周围的50条弹幕评论用于训练;
步骤2:弹幕评论的词嵌入表示
所述周围弹幕评论词嵌入模块采用Skip-Gram算法在Gensim平台,对用于训练的每条弹幕评论中的词进行词嵌入训练,使每个词以300维度的向量表示,得到每条弹幕评论的词嵌入表示;
步骤3:弹幕评论语义表示的生成
所述周围弹幕评论句子语义嵌入模块采用双向GRU网络,所述双向GRU包含一个顺向读取句子信息的前向GRU网络和一个逆向读取句子信息的反向GRU网络,将词嵌入表示的每条弹幕评论输入双向的GRU网络中,将两个网络的最后隐藏状态进行拼接,且由下述(a)式计算生成的每条弹幕评论表示:
zi=σ(Wz[xi,hi-1])
ri=σ(Wx[xi,hi-1])
式中:xi为每条周围弹幕评论中的第i个词;Wz,Wx,Wh为模型参数;zi,ri对应门控循环单元GRU中的重置门和更新门;和hi分别为对应于门控循环单元GRU中的候选隐状态和隐状态;
步骤4:弹幕相似性生成
所述周围弹幕评论间相似度计算模块将生成的弹幕评论表示按下述(b)和(c)式计算弹幕相似性:
hsj=[sim(c1,cj),…,sim(cT,cj)] (c);
式中:hgj为cj通过双向GRU之后的表示;
步骤5:评分预测
所述周围弹幕评论分数预测模块由多层感知机和softmax组成,将弹幕评论表示和弹幕相似性拼接后输入多层感知机和softmax中进行周围弹幕评论的评分预测,并将分值大的推荐给用户,所述分数预测模型训练包括下述步骤:
1)按下述(d)式计算模型预测的周围弹幕评论的概率分布评分标签
式中:cj为第j条周围弹幕评论;hsj为cj与其它周围弹幕评论之间的相似性向量值;hgj为第j条弹幕评论通过双向GRU之后的向量表示;
2)使用ROUGE指标计算目标弹幕评论和周围弹幕评论之间的分数,按下述(e)式计算周围弹幕评论cj和目标弹幕评论t之间的ROUGE-n分数
式中:Count(gramn)表示t中n-gram的个数,CountmMtch(gramn)表示cj,t共有的n-gram个数;
3)对上述ROUGE-n分数按(f)式进行归一化处理,并按下述(g)式计算概率分布评分标签:
4)利用KL散度DKL作为目标函数使模型得到的分布和ROUGE得到的分数尽可能相同,按下述(h)式计算:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华东师范大学,未经华东师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010380057.4/1.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置





