[发明专利]一种基于深度学习的虚假评论自动生成方法和装置在审

专利信息
申请号: 202010727769.9 申请日: 2020-07-24
公开(公告)号: CN111859959A 公开(公告)日: 2020-10-30
发明(设计)人: 许娟;李荣基 申请(专利权)人: 南京航空航天大学
主分类号: G06F40/289 分类号: G06F40/289;G06F40/30;G06F40/253;G06K9/62;G06F16/9535;G06N20/00
代理公司: 暂无信息 代理人: 暂无信息
地址: 210000 江*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 深度 学习 虚假 评论 自动 生成 方法 装置
【说明书】:

发明公开了一种基于深度学习的虚假评论自动生成方法和装置。所述方法包括获取真实的原始评论、根据真实评论生成初始虚假评论、通过筛选和检测标记出成熟的虚假评论三个步骤。与人工标注方法相比,本方法花费时间短、效率高,能够节约大量人力资源;与其他虚假评论生成方法相比,本方法属于无监督的深度学习方法,在面对海量数据的处理和多类型目标生成时,具备生成速度快、拟真度高等特点,因此本方法更适合应用到真实的电子商务环境中。基于该方法的装置包括获取、生成、判断和标记四个模块,生成和判断分别需要用到两个不同的深度学习模块。

本发明属于深度学习技术领域,具体涉及一种虚假评论自动生成的方法和装置。

背景技术

互联网的迅速发展使线上平台在人们购物、旅游、用餐、住宿等各个方面发挥了重要的作用。这些线上平台拥有大量评论。评论信息作为桥梁联结消费者和产品,不仅可以影响消费者的决策,还能作为反馈来促进商家改善产品细节。然而,评论者个体因为利益关系、品牌偏见等原因发布了许多虚假评论。他们甚至会协同合作发布虚假评论,组成虚假评论群组。据调查显示,美国版大众点评网站Yelp上的虚假评论的比例已从2006年的5%上涨至2013年的20%。研究深度学习生成虚假评论,可以在相关的网络安全领域占有先机,进而为研究检测虚假评论做好准备工作。

虚假评论生成技术属于文本生成研究领域,常见的中文文本生成主要分为两个方式:第一是抽取型,基于规则和统计的文本进行生成,目前已有大量的运用实践证明;第二是抽象型,基于深度学习模型的文本生成,近年来已经取得巨大进步。不管是2014年的encoder-decoder框架,还是2019年的GPT-2和Transformer-XL模型,都为文本生成方向的研究开辟了新的空间。

近十年来,虚假评论生成的相关研究多应用于英文文本领域。主流的虚假评论生成方法分为两种:第一是对原始真实评论进行解释化重构,属于机器翻译类型;第二是通过深度学习建模,将原始真实评论作为输入,通过预训练好的模型自动学习评论中的语义特征和语言信息,生成虚假评论。相比于人工标注的虚假评论,这种通过计算机大量生成的虚假评论具有成本低廉、效率高、时间短的优点。

发明内容

针对上述存在的技术问题,本发明提供了一种虚假评论自动生成的方法和装置。

根据本发明实施例的第一方面,提供一种虚假评论自动生成的方法,包括:

获取原始评论;

根据所述原始评论生成初始虚假评论;

判断初始虚假评论是否为成熟可用的虚假评论,并根据判断结果标记出成熟可用的虚假评论。

进一步地,所述初始虚假评论是由第一深度学习模型生成的。

进一步地,所述根据所述原始评论生成初始虚假评论,包括:

将所述原始评论输入第一深度学习模型;

所述第一深度学习模型根据输入的所述初始原始评论自动输出若干个初始虚假评论。

进一步地,所述第一深度学习模型为文本生成模型;

所述文本生成模型为经过预训练的模型,用于根据一个语句生成语义相似的语句。

进一步地,所述判断初始虚假评论是否为成熟可用的虚假评论,包括:

采用第二深度学习模型判断初始虚假评论是否为成熟可用的虚假评论,包括:

将所述原始评论和初始虚假评论输入第二深度学习模型;

所述第二深度学习模型根据所述初始虚假评论的语法、语句、语义判断是否可作为所述的成熟可用的评论;

如果初始虚假评论可作为所述的成熟可用的评论,保留,否则,丢弃。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京航空航天大学,未经南京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010727769.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top