[发明专利]一种基于特征级与传播关系网络的评论文本置信检测方法有效
| 申请号: | 202110529114.5 | 申请日: | 2021-05-14 |
| 公开(公告)号: | CN113434628B | 公开(公告)日: | 2023-07-25 |
| 发明(设计)人: | 荣欢;季俊如 | 申请(专利权)人: | 南京信息工程大学 |
| 主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/35;G06F40/169;G06F40/194;G06F40/30;G06N7/01 |
| 代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 田凌涛 |
| 地址: | 210044 *** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 特征 传播 关系 网络 评论 文本 置信 检测 方法 | ||
1.一种基于特征级与传播关系网络的评论文本置信检测方法,其特征在于,所述检测方法包括:
S1,输入需要处理的众包评论文本,对评论者与评论文本分别进行特征提取,得到预处理之后的特征集合;
S2,对于步骤S1得到的特征集合分别以贝塔分布与伯努利分布进行判定,结合判定结果将所有特征的分布联系起来得到类贝叶斯生成型概率模型;
S3,根据步骤S2所获得的类贝叶斯生成型概率模型,按照类贝叶斯方式,迭代使用先验与后验参数估计,学习出生成概率模型中各个待估计分布具体参数取值;
S4,获得任意评论者及其所对应评论文本的可疑度分布,计算评论者的可疑度S后进行降序排列;保留后M个可靠评论者发布的评论文本,剔除前K个疑似欺诈评论者发布的评论文本,M为预设的初步保留评论数量,K为预设的初步评论剔除数量;
S5,选取位于可疑度排序中间段的Q个评论者所发布的评论文本,构建含有评论者A-评论文本R-评论对象P三元关系的ARP传播关系网,其中ARP三类节点的个数由选取样本决定,Q=X-M-K,X为众包评论文本总数;
S6,利用已有评论者和评论文本获得ARP传播关系网中各节点的先验置信度,并对联合概率分布P(A,R,P)进行因子分解,将其转化为无向因子图;
S7,将ARP传播关系网中每个节点的先验置信度在相邻节点间交换,构成全局范围的置信传播,不断更新每个节点的置信度;
S8,利用置信传播计算得出ARP传播关系网中各类节点的最终置信度C;为R类节点计算可疑度S=1-C并降序排列;剔除前K条疑似欺诈文本,保留剩余可靠文本,K为预设的最终评论剔除数量。
2.根据权利要求1所述的基于特征级与传播关系网络的评论文本置信检测方法,其特征在于,步骤S1中,评论者的特征集合包括用于以余弦相似度刻画评论者所发布评论集合Ra的最大相似度的特征CS、用于刻画评论者单日的最高发文量的特征MNR、用于表示评论者最后一条评论L(a)与首条评论F(a)的时间跨度的特征BST和用于刻画当前用户所发布评论集中占产品的首条评论R1的比率的特征RFR;
所述特征CS、特征MNR、特征BST和特征RFR的计算公式分别为:
MNR=maxPost(a)/maxa∈A(maxPost(a))
其中,特征CS、特征MNR、特征BST和特征RFR的取值范围均为[0,1],取值越接近1,评论者a的可疑度越高;ri代表评论i,rj代表评论j,Ra代表评论者a发布的评论集合,i、j均为任意正整数;Post(a)代表评论者a单日的最高发文量,A代表评论者集合,τ为最后一条评论L(a)与首条评论F(a)的时间跨度判断标准,为整数,r是当前用户的任意一条评论,是评论者a的首条评论集合。
3.根据权利要求1所述的基于特征级与传播关系网络的评论文本置信检测方法,其特征在于,步骤S1中,评论文本的特征集合包括用于刻画产品p所属评论集是否有与评论ra相似的内容的特征DUP、用于表示产品p上的评分是否存在两极性的特征EXT、用于刻画评论者a在产品p上的评论集中极值评分的跨度的特征RA、用于表示当前评论者在产品p上的评分与其他用户评分均值的差异的特征DEV和用于表示评论者a在产品p上的最后一次评论与产品上线时间On(p)之间的跨度的特征ETF;
所述特征DUP、特征EXT、特征RA、特征DEV和特征ETF的计算公式分别为:
其中,特征DUP、特征EXT、特征RA、特征DEV和特征ETF的取值范围均为{0,1},取值越接近1,评论者a的可疑度越高;Rp是产品p所属评论集,β1、β2、β3、δ为任意正数;p(ra)是评论者a对产品p的评论,Ra,p是评论者a在产品p上发布的评论集合,L(a,p)是评论者a在产品p上的最后一次评论的时间。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京信息工程大学,未经南京信息工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110529114.5/1.html,转载请声明来源钻瓜专利网。





