[发明专利]一种基于计量经济学的移动应用评论分析与挖掘方法有效
| 申请号: | 201811536003.1 | 申请日: | 2018-12-14 |
| 公开(公告)号: | CN109669968B | 公开(公告)日: | 2022-09-23 |
| 发明(设计)人: | 郭斌;郭彤;於志文;王柱;王亮;周兴社 | 申请(专利权)人: | 西北工业大学 |
| 主分类号: | G06F16/2458 | 分类号: | G06F16/2458 |
| 代理公司: | 西安利泽明知识产权代理有限公司 61222 | 代理人: | 刘伟 |
| 地址: | 710072 *** | 国省代码: | 陕西;61 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 计量 经济学 移动 应用 评论 分析 挖掘 方法 | ||
1.一种基于计量经济学的移动应用评论分析与挖掘方法,其特征在于:包括如下步骤:
S1、将网上下载的数据整理融合并写入数据库;
S2、数据初处理:将数据处理成符合条件的格式;
S3、生成候选特征集合T:根据S2的结果,人工选择若干种子特征,通过自助采样模型BootStrapping自动提取具有高置信度的移动应用特征,生成候选特征集合T;
S4、获取用户反馈集合F:根据S3得到的候选特征集合T,筛选生成候选评论集R;利用NLP模型判断每一条候选评论的情感倾向,若情感倾向计算结果为中性或者负面,将其添加到用户反馈集合F;
S5、基于候选特征集合T和用户反馈集合F构建计量经济学模型,分析不同因素对于下载量的影响,挖掘具有显著影响效力的因素;
S6、融合S3与S4的结果,计算单条评论的影响指数,基于用户反馈集合F生成用户反馈。
2.根据权利要求1所述的一种基于计量经济学的移动应用评论分析和挖掘方法,其特征在于:所述S1中的数据包括用户评论、各版本发布时间、下载量信息。
3.根据权利要求1所述的一种基于计量经济学的移动应用评论分析和挖掘方法,其特征在于:所述S2数据初处理步骤具体包括以下步骤:
S21:根据文本评论的长度筛选原始评论,降低无意义内容引入的噪声;
S22:同时根据是否包含非法字符过滤异常数据;
S23:利用标点符号或空格符将原始文本评论分割为短句,将结果保存。
4.根据权利要求1所述的一种基于计量经济学的移动应用评论分析和挖掘方法,其特征在于:所述步骤S3的置信度定义为:
其中,conf(asp)代表移动应用特征asp的置信度,conf(pati)代表第i种文本模式pat的置信度(在预处理阶段直接计算得出),n表示相应文本模式的数量;匹配文本模式数量越多的应用特征,其置信度越高;通过计算置信度,得到有效的种子特征集合以便进一步的迭代。
5.根据权利要求1所述的一种基于计量经济学的移动应用评论分析和挖掘方法,其特征在于:所述NLP模型输出-1代表负面,0代表中性,1代表正面,若情感倾向计算结果为0或者-1。
6.根据权利要求1所述的一种基于计量经济学的移动应用评论分析和挖掘方法,其特征在于:所述步骤S5的计量经济学模型为,
其中,log(downloads)t代表在t时刻对移动应用下载量取对数的结果,βi代表第i个移动应用特征的系数,α代表移动应用相关的人工调节参数,εt代表在t时刻的误差项。
7.根据权利要求1所述的一种基于计量经济学的移动应用评论分析和挖掘方法,其特征在于:所述S5中所述下载量指标需要归一化处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学,未经西北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811536003.1/1.html,转载请声明来源钻瓜专利网。





