[发明专利]一种基于深度神经网络的微博社交机器人检测方法有效
| 申请号: | 202010509757.9 | 申请日: | 2020-06-08 |
| 公开(公告)号: | CN111428116B | 公开(公告)日: | 2021-01-12 |
| 发明(设计)人: | 王海舟;商帅康;武玉豪;晋京;方钰舟;魏来 | 申请(专利权)人: | 四川大学 |
| 主分类号: | G06F16/951 | 分类号: | G06F16/951;G06N3/04;G06N3/08 |
| 代理公司: | 成都正华专利代理事务所(普通合伙) 51229 | 代理人: | 代维凡 |
| 地址: | 610064 四川*** | 国省代码: | 四川;51 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 深度 神经网络 社交 机器人 检测 方法 | ||
1.一种基于深度神经网络的微博社交机器人检测方法,其特征在于,包括以下步骤:
S1、采集微博中的用户数据并进行人工标注,构建人工标记数据集;
S2、提取步骤S1采集的用户数据的分类特征,所述分类特征包括元数据特征、互动特征、内容特征和时序特征;
其中元数据特征包括用户名长度特征、粉丝关注比特征、默认用户名特征、默认头像特征、信息完整度特征和综合等级特征;
所述粉丝关注比特征的计算公式为
其中,
所述信息完整度特征的计算公式为
其中,
所述综合等级特征的计算公式为
其中,
互动特征包括博文评论数目均值特征、博文转发数目均值特征、博文点赞数目均值特征、博文来源多样性特征和博文转发比特征;
所述博文评论数目均值特征、博文转发数目均值特征、博文点赞数目均值特征的计算公式分别为
其中,
所述博文来源多样性特征的计算公式为
其中,
所述博文转发比特征的计算公式为
其中,
内容特征包括博文@数目均值特征、博文@数目方差特征、博文#数目均值特征、博文#数目方差特征、博文URL数目均值特征、博文URL数目方差特征、博文字数方差特征、博文标点数目均值特征、博文标点数目方差特征、博文感叹词数目均值特征、博文感叹词数目方差特征、博文情感值均值特征和博文图片数目方差特征;
所述博文@数目均值特征、博文@数目方差特征的计算公式分别为
其中,
所述博文#数目均值特征、博文#数目方差特征的计算公式分别为
其中,
所述博文URL数目均值特征、博文URL数目方差特征的计算公式分别为
其中,
所述博文字数方差特征的计算公式为
其中,
所述博文标点数目均值特征、博文标点数目方差特征的计算公式分别为
其中,
所述博文感叹词数目均值特征、博文感叹词数目方差特征的计算公式分别为
其中,
所述博文情感值均值特征的计算公式为
其中,
所述博文图片数目方差特征的计算公式为
其中,
时序特征包括发布博文时间间隔均值特征、发布博文时间间隔方差特征、发布博文时间间隔最小值特征、发布博文时间间隔最大值特征、发布博文时间间隔突发性参数特征和发布博文时间间隔信息熵特征;
所述发布博文时间间隔均值特征、发布博文时间间隔方差特征的计算公式分别为
其中,
所述发布博文时间间隔最小值特征为用户最小的
其中,为时间间隔,
所述发布博文时间间隔突发性参数特征的计算公式为
其中,
所述发布博文时间间隔信息熵特征的计算公式为
其中,
S3、构建基于残差神经网络、双向门控循环单元及注意力机制的深度神经网络模型,所述深度神经网络模型包括由三个残差块构成的残差神经网络单元、由一层BiGRU和一层随机失活层构成的双向门控循环单元及由注意力机制层构成的注意力机制单元;所述残差神经网络单元中每个残差块由一维卷积层和正则化层的组合叠加三次组成,并通过由一层一维卷积层和一层正则化层叠加组成的跳跃连接部分直接连接每个残差块的输入和输出;所述注意力机制层后通过一层全连接层结合Sigmoid激活函数进行二分类并输出分类结果;
所述深度神经网络模型进行分类的方法为:
从数据集中的用户数据中提取特征向量构建时间序列;
对时间序列进行正则化处理,得到正则化处理后的特征序列
将特征序列
将新的特征序列
将新的特征序列
将赋予权值的所有特征输入到全连接层通过Sigmoid激活函数进行二分类并输出分类结果;
利用步骤S1构建的人工标记数据集训练模型,进行新浪微博社交机器人检测。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川大学,未经四川大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010509757.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种亚光铁砂金陶瓷釉料的制备方法
- 下一篇:一种电商平台交货系统





