[发明专利]基于水军检测模型构建方法和系统及水军检测方法在审
| 申请号: | 201410146467.7 | 申请日: | 2014-04-09 |
| 公开(公告)号: | CN103955714A | 公开(公告)日: | 2014-07-30 |
| 发明(设计)人: | 李倩;牛温佳;管洋洋;黄超;孙卫强;李丹;胡玥;郭莉 | 申请(专利权)人: | 中国科学院信息工程研究所 |
| 主分类号: | G06K9/66 | 分类号: | G06K9/66;G06F19/00 |
| 代理公司: | 北京轻创知识产权代理有限公司 11212 | 代理人: | 杨立 |
| 地址: | 100093 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 水军 检测 模型 构建 方法 系统 | ||
1.一种水军检测模型构建方法,其特征在于,包括如下步骤:
步骤1:对一组给定的向量化的样本数据先进行任务分割,得到对应的多个任务,对多个任务进行平均特征抽取,得到多个任务的训练样本集;
步骤2:对多个任务的训练样本集进行多任务特征选择,得到多个任务的特征权重矩阵;
步骤3:设定一个阈值δ,判断所述特征权重矩阵中的一个列向量中的最大值是否大于阈值δ,如果是,执行步骤4;否则,放弃所述列向量,执行步骤5;
步骤4:将所述列向量添加到共享特征项集合中;
步骤5:判断特征权重矩阵中是否存在未与阈值δ进行比较的列向量,如果是,执行步骤3;否则,执行步骤6;
步骤6:输入新的已知水军特性的向量化的训练数据集,将训练数据集与共享特征项集合进行匹配,将在集合中排列位置匹配的特征项集合在一起,得到新共享特征项集合;
步骤7:对新共享特征项集合通过感知器学习算法(Perceptron Learning Algorithm)计算得到特征系数,通过计算共享特征项集合与特征系数的乘积得到标准线性分类值;
步骤8:根据标准线性分类值的大小设置水军阈值,使被测线性分类值大于水军阈值时判定其数据来源于水军,完成水军判断模型的构建,结束。
2.根据权利要求1所述的一种基于多任务学习的水军检测模型构建方法,其特征在于,还包括水军检测模型测试过程,所述水军检测模型测试过程包括以下步骤:
步骤9:给定一组已知是水军的水军用户集合,采集水军用户集合中所有用户的包括用户行为特征和内容特征的原始数据,并对每个维度的原始数据进行量化表示得到特征向量;
步骤10:将特征向量与步骤4中得到的共享特征项集合进行匹配,将位置匹配的特征项集合在一起,构成水军用户低维的特征向量;
步骤11:结合水军用户低维的特征向量与步骤7中的特征系数计算得到水军用户的线性分类值;
步骤12:判断线性分类值是否大于水军阈值,如果是,执行下一步,否则,将水军阈值适当减小并重新设置,返回执行步骤9;
步骤13:给定一组已知不是水军的正常用户集合,采集正常用户集合中所有用户的包括用户行为特征和内容特征的原始数据,并对每个维度的原始数据进行量化表示得到特征向量;
步骤14:将特征向量与步骤4中得到的共享特征项集合进行匹配,将位置匹配的特征项集合在一起,构成用户低维的特征向量;
步骤15:结合正常用户低维的特征向量与步骤7中的特征系数计算得到正常用户的线性分类值;
步骤16:判断线性分类值是否小于水军阈值,如果是,执行下一步,否则,将水军阈值适当增大并重新设置,返回执行步骤9;
步骤17:完成对水军检测模型的测试,结束。
3.根据权利要求1或2所述的一种基于多任务学习的水军检测模型构建方法,其特征在于,所述步骤2中采用求解正则化最小二乘法回归实现多任务特征选择。
4.根据权利要求3所述的一种基于多任务学习的水军检测模型构建方法,其特征在于,所述步骤1中的多个任务大小相同。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院信息工程研究所,未经中国科学院信息工程研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410146467.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:用于灯检机的瓶体检测装置
- 下一篇:全息底纹镭射包装材料印刷品质量检测系统





