[发明专利]基于纵向联邦学习的社交网络跨平台恶意用户检测方法有效
| 申请号: | 202110275639.0 | 申请日: | 2021-03-15 |
| 公开(公告)号: | CN113051557B | 公开(公告)日: | 2022-11-11 |
| 发明(设计)人: | 张志勇;宋斌;梁腾翔;张丽丽;卫新乐;牛丹梅;李玉祥;张孝国;向菲;张蓝方 | 申请(专利权)人: | 河南科技大学 |
| 主分类号: | G06F21/55 | 分类号: | G06F21/55;G06F21/60;G06F21/62;G06Q50/00;G06K9/62;G06N20/00 |
| 代理公司: | 洛阳公信知识产权事务所(普通合伙) 41120 | 代理人: | 宋晨炜 |
| 地址: | 471000 河*** | 国省代码: | 河南;41 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 纵向 联邦 学习 社交 网络 平台 恶意 用户 检测 方法 | ||
基于纵向联邦学习的社交网络跨平台恶意用户检测方法,包括:步骤1、构建基于纵向联邦学习的社交网络跨平台恶意用户检测层次化架构;步骤2、将参与方分为主动方和被动方,对主动方和被动方样本数据在数据预处理层进行预处理操作,得到结构化数据;步骤3、经数据预处理层处理后的结构化数据,映射主动方和被动方共有的样本数据;步骤4、在机器学习的定义下协同训练一个全局模型,利用了同态加密对主动方和被动方数据进行加解密,完成联邦学习层训练;步骤5、主动方和被动方更新自身的本地模型训练参数,并将预测结果输出;步骤6、在数据应用层将联邦学习层得到的预测结果回传到各参与方,实现高质量的恶意用户检测效果。
技术领域
本发明属于互联网技术领域,具体说的是基于纵向联邦学习的社交网络跨平台恶意用户检测方法。
背景技术
随着在线社交网络(Online Social Networks,OSNs)的飞速发展,截至2020年3月,第45次《中国互联网发展状况统计报告》显示,OSNs用户规模达到9.04亿,互联网普及率达64.5%,因此,OSNs帮助人们在建立社会性网络应用服务的同时,也逐渐成为恶意用户试图执行非法活动和恶意危害的首要目标,这些恶意行为给当今社会造成了不良的影响和巨大的危害。
目前,传统的机器学习方法,如半监督聚类、支持向量机的分类器等,依靠大数据手段,对恶意用户行为特征进行提取和训练,在OSNs平台取得高质量的检测效果。
技术方案1:Shi P等人的论文《Detecting Malicious Social Bots Based onClickstream Sequences》(IEEE Access,2019),基于情景感知的点击流之间的转移概率特征,提出了一种基于空间和时间特征的恶意用户检测算法。
技术方案2:WU等人的论文《Android平台的恶意程序多特征检测》小型微型计算机系统,提出了一种基于多类特征的混合算法,利用大规模的特征数据构建不同分类器,实现高效率的检测结果。
然而,上述方案成功的应用无一不是建立在社交大数据基础之上的,在实际应用场景中,恶意用户具有分散性,潜伏性、复杂性等特点,单方的数据很难满足检测要求,需要双方乃至多方的数据联合进行训练,方达到令人满意的检测效果;其次,随着法律法规的健全,重视用户隐私和数据安全已经成为世界性的公认趋势,如欧盟颁布的《通用数据保护条例》(General Data Protection Regulation,GDPR)中规定,未经用户同意,擅自将各方用户数据集中到一处已经被明令禁止。因此,如何能在遵守法律法规的前提下,解决数据碎片化的问题毫无疑问是当今社交网络场景中一个重要的研究课题。
发明内容
为解决上述技术问题,本发明提供一种基于纵向联邦学习的社交网络跨平台恶意用户检测方法,在保障普通用户数据隐私的前提下,融合多方数据进行建模分析,实现高质量的恶意用户检测效果。
为实现上述技术目的,所采用的技术方案是:基于纵向联邦学习的社交网络跨平台恶意用户检测方法,包括以下步骤:
步骤1、构建基于纵向联邦学习的社交网络跨平台恶意用户检测层次化架构,该架构包括数据预处理层、加密样本对齐层、联邦学习层、数据应用层;
步骤2、首先选取若干个参与方,将参与方分为主动方和被动方,提供用户的样本数据和标签值的为主动方,只提供用户的样本数据的为被动方,对主动方和被动方样本数据在数据预处理层进行预处理操作,得到结构化数据;
步骤3、经数据预处理层处理后的结构化数据,在样本对齐层通过使用RSA非对称加密算法和哈希机制的安全求交集方案,来映射主动方和被动方共有的样本数据;
步骤4、在经过步骤3阶段处理后,主动方和被动方已经确定双方共有样本数据,主动方和被动方利用自身的本地模型,在机器学习的定义下协同训练一个全局模型,利用了同态加密对主动方和被动方数据进行加解密,完成联邦学习层训练;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河南科技大学,未经河南科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110275639.0/2.html,转载请声明来源钻瓜专利网。





