[发明专利]一种基于关系的垃圾评论检测方法无效
申请号: | 201310002583.7 | 申请日: | 2013-01-05 |
公开(公告)号: | CN103020482A | 公开(公告)日: | 2013-04-03 |
发明(设计)人: | 张卫丰;王云;周国强;张迎周;王子元;周国富;钱小燕;许碧欢;陆柳敏 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06F19/00 | 分类号: | G06F19/00;G06Q30/00 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 叶连生 |
地址: | 210003 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 利用基于关系的垃圾评论检测方法,是一种基于网购的评论者,评论以及店家的关系特征的检测方法。提出了评论者的可信度,评论的诚实度以及店家的可靠度的概念,并引出了三者相互关系:评论者所写的评论的诚实度越高,他的可信度就越高;店家拥有的来自可信的评论者的诚实评论越多,他的可靠度就越高;评论被其他诚实评论支持的个数越多,他的诚实度就越高。第一次提出这样的迭代关系,并将其应用到实际的检测工作中。利用关系特征建模,并将这个模型和三者的其他特征所得到的模型相结合,得到改进后的用于垃圾评论检测的模型。 | ||
搜索关键词: | 一种 基于 关系 垃圾 评论 检测 方法 | ||
【主权项】:
一种基于关系的垃圾评论检测方法,其特征在于该方法主要分为以下步骤:步骤1)计算评论的诚实度分数:步骤1.1)输入评论集合信息:步骤1.2)获取所有评论的评分值和评论时间;步骤1.3)计算评分的平均值和最早评论时间;步骤1.4)获取一个评论信息;步骤1.5)判断评论信息是否为空,如果不为空,则转步骤1.6),否则,转步骤1.10);步骤1.6)计算评论诚实度分数:步骤1.6.1)获取该评论的评分值;步骤1.6.2)根据步骤1.3)的平均值,计算评分差;步骤1.6.3)获取该评论的评论时间;步骤1.6.4)根据步骤1.3)的最早评论时间,计算评论时间差;步骤1.6.5)获取该评论的评论文本;步骤1.6.6)根据余弦定理,计算评论文本的文本相似度;步骤1.6.7)根据步骤1.6.2)的评分差IRD、步骤1.6.4)的时间差IETF、步骤1.6.6)的相似度ICS,计算评论的诚实度分数A:A=β1IRD+β2ICS+β3IETF (1)其中β1,β2,β3为常量,且满足β1+β2+β3=1;步骤1.7)更新评论的诚实度属性;步骤1.8)获取下一个评论信息;步骤1.9)判断该评论信息是否为空,若为空,转步骤1.10),否则,转步骤1.2);步骤1.10)输出评论诚实度分数;步骤2)计算店家可靠度:步骤2.1)设置变量h=1;步骤2.2)获取第h个店家信息;步骤2.3)判断店家是否为空,若不为空,转步骤2.4),否则,转步骤2.8);步骤2.4)计算店家的可靠度分数:步骤2.4.1)获取该店家的商品相符度、卖方服务、商品服务、商品价格、货物配送的量化信息;步骤2.4.2)计算“S”型得分: S ( x ) = α x - β 3 + γ , x ≥ 0 0 , x < 0 - - - ( 2 ) 其中α、β、λ均为常量,x是店家的量化信息;步骤2.4.3)生成评分的权值向量;步骤2.4.4)步骤2.4.2)中的“S”型得分乘以权值向量,获得可靠度分数;步骤2.5)更新店家的可靠度属性;步骤2.6)h=h+1,转步骤2.2);步骤2.8)输出店家的可靠度分数;步骤3)计算评论者的可信度:步骤3.1)获取所有评论者信息;步骤3.2)获取一条评论者信息;步骤3.3)判断评论者信息是否为空,若不为空,转步骤3.4),否则,转步骤3.8);步骤3.4)计算评论者的可信度分数:步骤3.4.1)获取该评论者的交易金额,信用度信息;步骤3.4.2)获得对应的评分值;步骤3.4.3)生成评分值的权重向量;步骤3.4.4)步骤3.4.2)的评分值乘以权重向量,获得评论者的可信度分数;步骤3.5)更新评论者的可信度属性;步骤3.6)获取下一个评论者信息,转步骤3.3);步骤3.8)输出评论者的可信度分数;步骤4)初始化迭代次数为0;步骤5)更新评论的诚实度分数;步骤5.1)获取关系模型: H ( r ) = R ( s ) ( 2 1 + e T ( r ) - 1 ) - - - ( 3 ) 其中,R(s)为店家s的可靠度分数,T(r)为评论者r的可信度分数;步骤5.2)计算评论的诚实度分数:步骤5.2.1)获取发表该评论的评论者的可信度分数;步骤5.2.2)获取评论所评论的店家的可靠度分数;步骤5.3.3)根据步骤5.1)的模型计算诚实度分数;步骤5.4)更新评论的诚实度属性信息;步骤5.5)输出更新后的评论的诚实度分数;步骤6)更新评论者的可信度分数:步骤6.1)获取关系模型: T ( r ) = 2 1 + e H ( r ) - 1 - - - ( 4 ) 其中,H(r)为评论r的诚实度分数;步骤6.2)计算评论者的可信度分数:步骤6.2.1)获得该评论者所发表的所有评论的诚实度;步骤6.2.2)根据步骤6.1)的模型计算评论者的可信度分数;步骤6.3)更新评论者的可信度属性信息;步骤6.4)输出更新后的评论者的可信度分数;步骤7)更新店家的可靠度分数:步骤7.1)获取关系模型: R ( s ) = 2 1 + e - θ - 1 - - - ( 5 ) θ = Σ v ∈ U s , T ( k v ) > 0 T ( k v ) ( Ψ v - μ ) - - - ( 6 ) 其中,T(kv)是发表评论v的评论者kv的可信度,Ψv是评论v的评分,μ是系统评论的平均值;步骤7.2)计算店家的可靠度分数:步骤7.2.1)获取该店家的评论者的可信度分数;步骤7.2.2)获取评论者的所有评论的评分;步骤7.2.3)根据步骤7.1)的模型计算店家的可靠度分数;步骤7.3)更新店家的可靠度属性;步骤8)迭代次数加1;步骤9)判断迭代次数是否小于5,若是,转步骤5),否则,转步骤10);步骤10)输出店家的可靠度分数、评论的诚实度分数、评论者的可信度分数;步骤11)输出检测结果:正常评论、垃圾评论;正常评论者、垃圾评论者。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310002583.7/,转载请声明来源钻瓜专利网。
- 上一篇:一种安全帽外壳结构
- 下一篇:一种蒲公英果醋饮料制作方法
- 同类专利
- 专利分类
G06 计算;推算;计数
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用