[发明专利]基于方面特征的虚假评论识别方法及装置有效
申请号: | 202110487429.8 | 申请日: | 2021-04-30 |
公开(公告)号: | CN112989056B | 公开(公告)日: | 2021-07-30 |
发明(设计)人: | 吕欣;蔡梦思;谭跃进;豆亚杰;谭索怡 | 申请(专利权)人: | 中国人民解放军国防科技大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/216;G06F40/289;G06K9/62;G06N3/04;G06Q30/02 |
代理公司: | 北京风雅颂专利代理有限公司 11403 | 代理人: | 曾志鹏 |
地址: | 410003 湖*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 方面 特征 虚假 评论 识别 方法 装置 | ||
本说明书一个或多个实施例提供一种基于方面特征的虚假评论识别方法及装置,包括:从待识别评论中提取方面信息;方面信息包括方面词;对所述方面词进行分类,得到分类后的方面词及方面词所属方面类别;根据所述方面信息和所述方面类别,确定方面特征;将所述方面特征输入预先训练的评论识别模型,由所述评论识别模型输出所述待识别评论是否为虚假评论的预测结果。本实施例能够较为准确地识别虚假评论。
技术领域
本说明书一个或多个实施例涉及人工智能技术领域,尤其涉及一种基于方面特征的虚假评论识别方法及装置。
背景技术
随着信息技术的发展,利用各种线上平台进行购物、旅游、点餐、交通等大幅提升了生活便利性。线上平台的各个产品下具有众多评论,用户可根据评论选择是否购买产品,商户也可根据评论改进产品质量和服务。然而,众多评论中往往存在一些虚假评论,影响用户和商户的判断力,不利于经济良性发展。由此,从评论中准确识别出虚假评论,并筛掉虚假评论,是线上平台需要解决的关键问题。
发明内容
有鉴于此,本说明书一个或多个实施例的目的在于提出一种基于方面特征的虚假评论识别方法及装置,能识别虚假评论。
基于上述目的,本说明书一个或多个实施例提供了基于方面特征的虚假评论识别方法,包括:
从待识别评论中提取方面信息;所述方面信息包括方面词;
对所述方面词进行分类,得到分类后的方面词及方面词所属方面类别;
根据所述方面信息和所述方面类别,确定方面特征;
将所述方面特征输入预先训练的评论识别模型,由所述评论识别模型输出所述待识别评论是否为虚假评论的预测结果。
可选的,所述从待识别评论中提取方面信息,包括:
从所述待识别评论中提取出评论者、评论产品、评分、评论内容、评论长度;
从所述评论内容中提取出所述方面词及其对应的情感词。
可选的,从所述评论内容中提取出所述方面词及其情感词为:
利用预先训练的Bi-LSTM分类模型从所述待识别评论中提取出方面词及其对应的情感词。
可选的,训练所述Bi-LSTM分类模型的方法是:
提供评论样本集,所述评论样本集中的评论包括所包含的所有词及各词对应的标签;所述词的标签为方面词、情感词或其他词中的一种;
利用所述评论样本集训练Bi-LSTM分类模型,得到能够输出评论中每个词的标签的Bi-LSTM分类模型。
可选的,对所述方面词进行分类,得到分类后的方面词及方面词所属的方面类别,包括:
按照预设的流行程度,从提取出的方面词中挑选出具有预定流行程度的部分方面词;
确定预定数量的方面类别;
利用K-means聚类方法按照所述预定数量的方面类别,将所述部分方面词划分为特定的方面类别。
可选的,根据所述方面信息和所述方面类别,确定方面特征,包括:
统计待识别评论中所具有的唯一方面词的数量;
统计待识别评论中所具有的方面类别的比例;
统计待识别评论中有关方面类别的评论长度;
确定待识别评论中方面词对应的情感词,确定情感词对应的情感分值;
确定待识别评论中的评分与各方面类别的情感词对应的情感分值之间的平均偏差;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科技大学,未经中国人民解放军国防科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110487429.8/2.html,转载请声明来源钻瓜专利网。