[发明专利]一种基于关系的垃圾评论检测方法无效

专利信息
申请号: 201310002583.7 申请日: 2013-01-05
公开(公告)号: CN103020482A 公开(公告)日: 2013-04-03
发明(设计)人: 张卫丰;王云;周国强;张迎周;王子元;周国富;钱小燕;许碧欢;陆柳敏 申请(专利权)人: 南京邮电大学
主分类号: G06F19/00 分类号: G06F19/00;G06Q30/00
代理公司: 南京经纬专利商标代理有限公司 32200 代理人: 叶连生
地址: 210003 江苏*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要: 利用基于关系的垃圾评论检测方法,是一种基于网购的评论者,评论以及店家的关系特征的检测方法。提出了评论者的可信度,评论的诚实度以及店家的可靠度的概念,并引出了三者相互关系:评论者所写的评论的诚实度越高,他的可信度就越高;店家拥有的来自可信的评论者的诚实评论越多,他的可靠度就越高;评论被其他诚实评论支持的个数越多,他的诚实度就越高。第一次提出这样的迭代关系,并将其应用到实际的检测工作中。利用关系特征建模,并将这个模型和三者的其他特征所得到的模型相结合,得到改进后的用于垃圾评论检测的模型。
搜索关键词: 一种 基于 关系 垃圾 评论 检测 方法
【主权项】:
一种基于关系的垃圾评论检测方法,其特征在于该方法主要分为以下步骤:步骤1)计算评论的诚实度分数:步骤1.1)输入评论集合信息:步骤1.2)获取所有评论的评分值和评论时间;步骤1.3)计算评分的平均值和最早评论时间;步骤1.4)获取一个评论信息;步骤1.5)判断评论信息是否为空,如果不为空,则转步骤1.6),否则,转步骤1.10);步骤1.6)计算评论诚实度分数:步骤1.6.1)获取该评论的评分值;步骤1.6.2)根据步骤1.3)的平均值,计算评分差;步骤1.6.3)获取该评论的评论时间;步骤1.6.4)根据步骤1.3)的最早评论时间,计算评论时间差;步骤1.6.5)获取该评论的评论文本;步骤1.6.6)根据余弦定理,计算评论文本的文本相似度;步骤1.6.7)根据步骤1.6.2)的评分差IRD、步骤1.6.4)的时间差IETF、步骤1.6.6)的相似度ICS,计算评论的诚实度分数A:A=β1IRD+β2ICS+β3IETF    (1)其中β1,β2,β3为常量,且满足β1+β2+β3=1;步骤1.7)更新评论的诚实度属性;步骤1.8)获取下一个评论信息;步骤1.9)判断该评论信息是否为空,若为空,转步骤1.10),否则,转步骤1.2);步骤1.10)输出评论诚实度分数;步骤2)计算店家可靠度:步骤2.1)设置变量h=1;步骤2.2)获取第h个店家信息;步骤2.3)判断店家是否为空,若不为空,转步骤2.4),否则,转步骤2.8);步骤2.4)计算店家的可靠度分数:步骤2.4.1)获取该店家的商品相符度、卖方服务、商品服务、商品价格、货物配送的量化信息;步骤2.4.2)计算“S”型得分: S ( x ) = α x - β 3 + γ , x 0 0 , x < 0 - - - ( 2 ) 其中α、β、λ均为常量,x是店家的量化信息;步骤2.4.3)生成评分的权值向量;步骤2.4.4)步骤2.4.2)中的“S”型得分乘以权值向量,获得可靠度分数;步骤2.5)更新店家的可靠度属性;步骤2.6)h=h+1,转步骤2.2);步骤2.8)输出店家的可靠度分数;步骤3)计算评论者的可信度:步骤3.1)获取所有评论者信息;步骤3.2)获取一条评论者信息;步骤3.3)判断评论者信息是否为空,若不为空,转步骤3.4),否则,转步骤3.8);步骤3.4)计算评论者的可信度分数:步骤3.4.1)获取该评论者的交易金额,信用度信息;步骤3.4.2)获得对应的评分值;步骤3.4.3)生成评分值的权重向量;步骤3.4.4)步骤3.4.2)的评分值乘以权重向量,获得评论者的可信度分数;步骤3.5)更新评论者的可信度属性;步骤3.6)获取下一个评论者信息,转步骤3.3);步骤3.8)输出评论者的可信度分数;步骤4)初始化迭代次数为0;步骤5)更新评论的诚实度分数;步骤5.1)获取关系模型: H ( r ) = R ( s ) ( 2 1 + e T ( r ) - 1 ) - - - ( 3 ) 其中,R(s)为店家s的可靠度分数,T(r)为评论者r的可信度分数;步骤5.2)计算评论的诚实度分数:步骤5.2.1)获取发表该评论的评论者的可信度分数;步骤5.2.2)获取评论所评论的店家的可靠度分数;步骤5.3.3)根据步骤5.1)的模型计算诚实度分数;步骤5.4)更新评论的诚实度属性信息;步骤5.5)输出更新后的评论的诚实度分数;步骤6)更新评论者的可信度分数:步骤6.1)获取关系模型: T ( r ) = 2 1 + e H ( r ) - 1 - - - ( 4 ) 其中,H(r)为评论r的诚实度分数;步骤6.2)计算评论者的可信度分数:步骤6.2.1)获得该评论者所发表的所有评论的诚实度;步骤6.2.2)根据步骤6.1)的模型计算评论者的可信度分数;步骤6.3)更新评论者的可信度属性信息;步骤6.4)输出更新后的评论者的可信度分数;步骤7)更新店家的可靠度分数:步骤7.1)获取关系模型: R ( s ) = 2 1 + e - θ - 1 - - - ( 5 ) θ = Σ v U s , T ( k v ) > 0 T ( k v ) ( Ψ v - μ ) - - - ( 6 ) 其中,T(kv)是发表评论v的评论者kv的可信度,Ψv是评论v的评分,μ是系统评论的平均值;步骤7.2)计算店家的可靠度分数:步骤7.2.1)获取该店家的评论者的可信度分数;步骤7.2.2)获取评论者的所有评论的评分;步骤7.2.3)根据步骤7.1)的模型计算店家的可靠度分数;步骤7.3)更新店家的可靠度属性;步骤8)迭代次数加1;步骤9)判断迭代次数是否小于5,若是,转步骤5),否则,转步骤10);步骤10)输出店家的可靠度分数、评论的诚实度分数、评论者的可信度分数;步骤11)输出检测结果:正常评论、垃圾评论;正常评论者、垃圾评论者。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201310002583.7/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top