[发明专利]一种基于关系的垃圾评论检测方法无效
| 申请号: | 201310002583.7 | 申请日: | 2013-01-05 |
| 公开(公告)号: | CN103020482A | 公开(公告)日: | 2013-04-03 |
| 发明(设计)人: | 张卫丰;王云;周国强;张迎周;王子元;周国富;钱小燕;许碧欢;陆柳敏 | 申请(专利权)人: | 南京邮电大学 |
| 主分类号: | G06F19/00 | 分类号: | G06F19/00;G06Q30/00 |
| 代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 叶连生 |
| 地址: | 210003 江苏*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 关系 垃圾 评论 检测 方法 | ||
1.一种基于关系的垃圾评论检测方法,其特征在于该方法主要分为以下步骤:
步骤1)计算评论的诚实度分数:
步骤1.1)输入评论集合信息:
步骤1.2)获取所有评论的评分值和评论时间;
步骤1.3)计算评分的平均值和最早评论时间;
步骤1.4)获取一个评论信息;
步骤1.5)判断评论信息是否为空,如果不为空,则转步骤1.6),否则,转步骤1.10);
步骤1.6)计算评论诚实度分数:
步骤1.6.1)获取该评论的评分值;
步骤1.6.2)根据步骤1.3)的平均值,计算评分差;
步骤1.6.3)获取该评论的评论时间;
步骤1.6.4)根据步骤1.3)的最早评论时间,计算评论时间差;
步骤1.6.5)获取该评论的评论文本;
步骤1.6.6)根据余弦定理,计算评论文本的文本相似度;
步骤1.6.7)根据步骤1.6.2)的评分差IRD、步骤1.6.4)的时间差IETF、步骤1.6.6)的相似度ICS,计算评论的诚实度分数A:
A=β1IRD+β2ICS+β3IETF (1)
其中β1,β2,β3为常量,且满足β1+β2+β3=1;
步骤1.7)更新评论的诚实度属性;
步骤1.8)获取下一个评论信息;
步骤1.9)判断该评论信息是否为空,若为空,转步骤1.10),否则,转步骤1.2);
步骤1.10)输出评论诚实度分数;
步骤2)计算店家可靠度:
步骤2.1)设置变量h=1;
步骤2.2)获取第h个店家信息;
步骤2.3)判断店家是否为空,若不为空,转步骤2.4),否则,转步骤2.8);
步骤2.4)计算店家的可靠度分数:
步骤2.4.1)获取该店家的商品相符度、卖方服务、商品服务、商品价格、货物配送的量化信息;
步骤2.4.2)计算“S”型得分:
其中α、β、λ均为常量,x是店家的量化信息;
步骤2.4.3)生成评分的权值向量;
步骤2.4.4)步骤2.4.2)中的“S”型得分乘以权值向量,获得可靠度分数;
步骤2.5)更新店家的可靠度属性;
步骤2.6)h=h+1,转步骤2.2);
步骤2.8)输出店家的可靠度分数;
步骤3)计算评论者的可信度:
步骤3.1)获取所有评论者信息;
步骤3.2)获取一条评论者信息;
步骤3.3)判断评论者信息是否为空,若不为空,转步骤3.4),否则,转步骤3.8);
步骤3.4)计算评论者的可信度分数:
步骤3.4.1)获取该评论者的交易金额,信用度信息;
步骤3.4.2)获得对应的评分值;
步骤3.4.3)生成评分值的权重向量;
步骤3.4.4)步骤3.4.2)的评分值乘以权重向量,获得评论者的可信度分数;
步骤3.5)更新评论者的可信度属性;
步骤3.6)获取下一个评论者信息,转步骤3.3);
步骤3.8)输出评论者的可信度分数;
步骤4)初始化迭代次数为0;
步骤5)更新评论的诚实度分数;
步骤5.1)获取关系模型:
其中,R(s)为店家s的可靠度分数,T(r)为评论者r的可信度分数;
步骤5.2)计算评论的诚实度分数:
步骤5.2.1)获取发表该评论的评论者的可信度分数;
步骤5.2.2)获取评论所评论的店家的可靠度分数;
步骤5.3.3)根据步骤5.1)的模型计算诚实度分数;
步骤5.4)更新评论的诚实度属性信息;
步骤5.5)输出更新后的评论的诚实度分数;
步骤6)更新评论者的可信度分数:
步骤6.1)获取关系模型:
其中,H(r)为评论r的诚实度分数;
步骤6.2)计算评论者的可信度分数:
步骤6.2.1)获得该评论者所发表的所有评论的诚实度;
步骤6.2.2)根据步骤6.1)的模型计算评论者的可信度分数;
步骤6.3)更新评论者的可信度属性信息;
步骤6.4)输出更新后的评论者的可信度分数;
步骤7)更新店家的可靠度分数:
步骤7.1)获取关系模型:
其中,T(kv)是发表评论v的评论者kv的可信度,Ψv是评论v的评分,μ是系统评论的平均值;
步骤7.2)计算店家的可靠度分数:
步骤7.2.1)获取该店家的评论者的可信度分数;
步骤7.2.2)获取评论者的所有评论的评分;
步骤7.2.3)根据步骤7.1)的模型计算店家的可靠度分数;
步骤7.3)更新店家的可靠度属性;
步骤8)迭代次数加1;
步骤9)判断迭代次数是否小于5,若是,转步骤5),否则,转步骤10);
步骤10)输出店家的可靠度分数、评论的诚实度分数、评论者的可信度分数;
步骤11)输出检测结果:正常评论、垃圾评论;正常评论者、垃圾评论者。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310002583.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种安全帽外壳结构
- 下一篇:一种蒲公英果醋饮料制作方法
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用





