[发明专利]一种基于用户管理应用行为的应用质量判别方法及系统有效
| 申请号: | 201510983204.6 | 申请日: | 2015-12-24 |
| 公开(公告)号: | CN105630957B | 公开(公告)日: | 2019-05-21 |
| 发明(设计)人: | 刘譞哲;黄罡;梅宏;李豁然;陆璇 | 申请(专利权)人: | 北京大学 |
| 主分类号: | G06F16/958 | 分类号: | G06F16/958;G06F17/18;G06Q10/04 |
| 代理公司: | 北京君尚知识产权代理事务所(普通合伙) 11200 | 代理人: | 邱晓锋 |
| 地址: | 100871*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 用户 管理 应用 行为 质量 判别 方法 系统 | ||
1.一种基于用户管理应用行为的应用质量判别方法,其特征在于,包括如下步骤:
1)对用户的应用管理行为进行数据预处理,将每个用户与每个应用之间的所有管理行为按照时间先后顺序进行排序,得到管理行为序列,作为训练集;
2)利用得到的管理行为序列,对用户的应用管理行为进行特征抽取;
3)利用抽取的行为特征建立多维自变量空间,每一个训练集中的应用被视作该空间当中的一个点,每个自变量维度的值即为该维度对应的特征的值,因变量的值为应用的用户评分;根据此空间进行模型训练,调试出最优的模型参数,最终得到一个确定的回归模型;
4)利用训练得到的回归模型,将每一个待预测的应用的管理行为数据按照步骤1)和步骤2)进行整理,然后输入该回归模型,模型的输出即为对应用质量的判别结果。
2.如权利要求1所述的方法,其特征在于,步骤1)所述用户的应用管理行为包括三种:下载应用、卸载应用、更新应用;行为记录中包含三个域:进行该行为的用户标识、该行为管理的应用的标识、该行为发生的时间。
3.如权利要求2所述的方法,其特征在于,步骤1)所述管理行为序列以“D”表示下载应用行为,以“U”表示卸载应用行为,以“P”表示更新应用行为,并在序列的头部添加标识“S”表示序列开始,在尾部添加标识“E”表示序列结束。
4.如权利要求3所述的方法,其特征在于,步骤1)还对管理行为序列进行筛选,过滤掉用户评价不明确的应用,只保留用户展现出明显喜好倾向的应用。
5.如权利要求4所述的方法,其特征在于,所述进行筛选的方法是:通过过滤器对所有的应用根据其喜欢、不喜欢的评价个数进行二项分布概率测试,只有能够以95%概率证明该应用的用户倾向较为明显时才保留该应用;然后对于被保留应用的管理行为序列,只保留除S、E外至少包含两个操作的序列。
6.如权利要求1所述的方法,其特征在于:步骤2)中,每个应用的行为特征包括:该应用拥有的管理行为序列数、管理行为序列的平均长度、管理行为序列中至多连续若干步考虑时间间隔长短的连续管理行为。
7.如权利要求6所述的方法,其特征在于:步骤2)对于每一种行为特征,抽取得到该应用中该种特征的个数,最后得到平均每一个管理行为序列的该种特征个数,即为此种特征的值。
8.如权利要求1所述的方法,其特征在于:步骤3)所述多维自变量空间中,因变量的值为应用的用户评分线性规约至[0,1]区间后的值。
9.如权利要求1所述的方法,其特征在于:步骤3)采用多折训练的方法对模型进行训练。
10.一种基于用户管理应用行为的应用质量判别系统,其特征在于,包括:
数据预处理器,负责对用户的应用管理行为进行数据预处理,将每个用户与每个应用之间的所有管理行为按照时间先后顺序进行排序,得到管理行为序列,作为训练集;
行为特征抽取器,负责利用得到的管理行为序列,对用户的应用管理行为进行特征抽取;
训练器,负责利用抽取的行为特征建立多维自变量空间,每一个训练集中的应用被视作该空间当中的一个点,每个自变量维度的值即为该维度对应的特征的值,因变量的值为应用的用户评分;根据此空间进行模型训练,调试出最优的模型参数,最终得到一个确定的回归模型;
预测器,负责通过数据预处理器和行为特征抽取器抽取其特征,然后将得到的特征输入训练好的回归模型,模型的输出即为对应用质量的判别结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学,未经北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510983204.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种可自定义组态的数据可视化展示系统
- 下一篇:一种广告素材查找方法及装置





