[发明专利]评论信息的识别方法、介质、装置和计算设备在审
申请号: | 202110486043.5 | 申请日: | 2021-04-30 |
公开(公告)号: | CN113033214A | 公开(公告)日: | 2021-06-25 |
发明(设计)人: | 李家诚;沙雨辰;胡光龙;汪源;刘东 | 申请(专利权)人: | 网易(杭州)网络有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/284;G06F16/9535 |
代理公司: | 北京市铸成律师事务所 11313 | 代理人: | 曹远;阎敏 |
地址: | 310052 浙江省杭州*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 评论 信息 识别 方法 介质 装置 计算 设备 | ||
1.一种评论信息的识别方法,其特征在于,包括:
获取待识别的评论信息以及对应于该评论信息的评论回复信息;
将所述待识别的评论信息以及所述评论回复信息送入预先训练的评论识别模型中进行识别,以确定对应于所述待识别的评论信息的识别结果;
其中,所述评论识别模型通过评论信息样本和对应于所述评论信息样本的评论回复信息样本训练获得。
2.根据权利要求1所述的方法,其特征在于,将所述待识别的评论信息以及所述评论回复信息送入预先训练的评论识别模型中进行识别,包括:
对所述待识别的评论信息进行特征提取,以获得对应于所述待识别的评论信息的第一特征向量;
对所述评论回复信息进行特征提取,以获得对应于所述评论回复信息的第二特征向量;
将所述第一特征向量和所述第二特征向量融合为最终特征向量,基于该最终特征向量确定对应于所述待识别的评论信息的识别结果。
3.根据权利要求1所述的方法,其特征在于,所述评论回复信息的确定方式,包括:
获取对所述待识别的评论信息直接进行回复的候选评论回复信息;
在所述候选评论回复信息的数量不少于对应阈值的情况下,将所述候选评论回复信息按照预定规则进行排序;
根据所述排序,从所述候选评论回复信息中筛选出预定数量的评论回复信息。
4.根据权利要求3所述的方法,其特征在于,所述将所述候选评论回复信息按照预定规则进行排序,包括:
分别确定每条所述候选评论回复信息所属用户的标识;
利用所述标识,确定每个用户的用户画像;
根据所述待识别的评论信息对应的评论对象与所述用户画像的关联性,对所述候选评论回复信息进行排序。
5.根据权利要求1所述的方法,其特征在于,所述评论识别模型的训练方式,包括:
将所述评论信息样本和所述对应于所述评论信息样本的评论回复信息样本输入待训练的评论识别模型,得到所述评论信息样本的预测识别结果;
根据所述评论信息样本的预测识别结果及所述评论信息样本对应的真实识别结果,调整所述待训练的评论识别模型的参数,直至所述预测识别结果与所述真实识别结果的误差在允许范围内。
6.根据权利要求5所述的方法,其特征在于,还包括:
利用所述预测识别结果,筛选高置信的评论信息样本;
提取所述高置信的评论信息样本中的关键词;
将所述关键词按照类别进行标注,将具有相同标注结果的关键词组成关键词集合;所述标注结果对应所述真实识别结果;
利用所述关键词集合和所述关键词集合的标注结果,对未识别的评论信息进行标注;
利用标注后未识别的评论信息,以及对应于所述标注后未识别的评论信息的评论回复信息,对所述评论信息样本和所述对应于所述评论信息样本的评论回复信息样本进行扩充。
7.根据权利要求6所述的方法,其特征在于,所述利用所述关键词集合和所述关键词集合的标注结果,对未识别的评论信息进行标注,包括:
分别在未识别的各评论信息中确定第一关键词;
根据所述第一关键词与所述关键词集合中所包含的关键词的相似性,在所述未识别的各评论信息中筛选出预定数量的待标注评论信息;
利用所述关键词集合的标注结果,对所述待标注评论信息进行标注。
8.一种评论信息的识别装置,其特征在于,包括:
评论回复信息获取模块,用于获取待识别的评论信息以及对应于该评论信息的评论回复信息;
识别结果确定模块,用于将所述待识别的评论信息以及所述评论回复信息送入预先训练的评论识别模型中进行识别,以确定对应于所述待识别的评论信息的识别结果;
其中,所述评论识别模型通过评论信息样本和对应于所述评论信息样本的评论回复信息样本训练获得。
9.一种介质,其存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一所述的方法。
10.一种计算设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1-7中任一所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于网易(杭州)网络有限公司,未经网易(杭州)网络有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110486043.5/1.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置