[发明专利]一种定量预测微博转发广度与深度的方法在审
| 申请号: | 202110760062.2 | 申请日: | 2021-07-05 |
| 公开(公告)号: | CN113592058A | 公开(公告)日: | 2021-11-02 |
| 发明(设计)人: | 王彦本;白菊蓉 | 申请(专利权)人: | 西安邮电大学 |
| 主分类号: | G06N3/00 | 分类号: | G06N3/00;G06N20/20;G06F16/951 |
| 代理公司: | 西安长和专利代理有限公司 61227 | 代理人: | 黄伟洪 |
| 地址: | 710061 陕西省西安*** | 国省代码: | 陕西;61 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 定量 预测 转发 广度 深度 方法 | ||
1.一种定量预测微博转发广度与深度的方法,其特征在于,所述定量预测微博转发广度与深度的方法将提取的特征分为三类:用户特征、微博特征和社交特征,并存入文件中;读取处理好的全部数据,将数据的70%作为训练数据集,30%作为测试数据集;提取训练数据集中对训练模型有用的特征;使用改进的随机森林算法建立模型,预测每条微博转发的广度和深度;使用测试集数据测试算法的准确性,计算平均绝对百分比误差和预测精度。
2.如权利要求1所述的定量预测微博转发广度与深度的方法,其特征在于,所述定量预测微博转发广度与深度的方法具体包括:
输入:微博数据集S,微博预测数据集P;
步骤一:对数据集S用十折交叉验证方法采样,得到训练数据集Sn;
步骤二:对数据集Sn,用信息增益算法计算每个特征的权重,根据权重对特征排序并排除小于设定阈值的特征;
步骤三:对于Sn的所有大于阈值的特征,基于特征的权重大小,随机选取m个特征,构成新的数据集Sm;
步骤四:对数据集构造完整的决策树,不进行剪枝;
步骤五:循环步骤一-步骤四,直到K个决策树建立,一个随机森林构造完成;
步骤六:循环步骤一-步骤五,共构建N个随机森林;
步骤七:对预测数据集P的每一条微博,使用一个随机森林预测转发广度和深度;
步骤八:循环步骤七,直到N个随机森林完成预测;
步骤九:循环步骤七、步骤八,直到数据集P所有微博的转发广度和深度被预测。
输出:预测数据集P的预测值集合。
3.如权利要求1所述的定量预测微博转发广度与深度的方法,其特征在于,所述用户特征与用户个体相关,包括性别、所属区域、是否为认证用户、粉丝数、关注数、原创微博数、转发微博数、评论数、点赞数;
所述微博特征从微博文本中提取,包括内容情感倾向、内容长度、内容是否含有@符号、内容是否带有话题、内容是否含有链接、发布微博所属时间段;
所述社交特征体现两个用户之间的社交特性,包括活跃度、交互强度、兴趣爱好、社会地位。
4.如权利要求1所述的定量预测微博转发广度与深度的方法,其特征在于,所述定量预测微博转发广度与深度的方法对数据集进行处理并提取了相应的特征,并存入文件中,预测模型实现步骤如下:
(1)准备数据:读取处理好的全部数据;
(2)数据划分:将数据的70%作为训练数据集,30%作为测试数据集;
(3)提取特征:提取训练数据集中对训练模型有用的特征;
(4)设置目标变量:每条微博转发的广度和深度;
(5)训练模型:使用预测算法建立模型;
(6)测试模型:使用测试集数据测试算法的准确性,计算平均绝对百分比误差和预测精度。
5.如权利要求4所述的定量预测微博转发广度与深度的方法,其特征在于,平均绝对百分比误差MAPE(t)定义如下:
公式中的M是预测微博的总数,Nprem(t)是在t时刻微博m用预测模型预测出的转发广度或深度,Ntruem(t)是微博m在t时刻的实际转发广度或深度。
6.如权利要求4所述的定量预测微博转发广度与深度的方法,其特征在于,
预测的精度Precision(t)定义为:
Precision(t)=1-MAPE(t)。
7.一种计算机设备,其特征在于,所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如下步骤:将提取的特征分为三类:用户特征、微博特征和社交特征,并存入文件中;读取处理好的全部数据,将数据的70%作为训练数据集,30%作为测试数据集;提取训练数据集中对训练模型有用的特征;使用改进的随机森林算法建立模型,预测每条微博转发的广度和深度;使用测试集数据测试算法的准确性,计算平均绝对百分比误差和预测精度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安邮电大学,未经西安邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110760062.2/1.html,转载请声明来源钻瓜专利网。





