[发明专利]一种基于移动应用的分类识别方法及系统有效
| 申请号: | 201810300929.4 | 申请日: | 2018-04-04 |
| 公开(公告)号: | CN108647201B | 公开(公告)日: | 2021-12-31 |
| 发明(设计)人: | 吴岳辉 | 申请(专利权)人: | 卓望数码技术(深圳)有限公司 |
| 主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/36;G06F40/289;G06F40/30 |
| 代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 唐致明;洪铭福 |
| 地址: | 518000 广东省深圳市南山区粤海街*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 移动 应用 分类 识别 方法 系统 | ||
1.一种基于移动应用的分类识别方法,其特征在于,其包括以下步骤:
系统建立基础分类特征库;
通过互联网爬取移动应用及应用页面中关键信息;
系统识别所述关键信息中的分类信息及应用特征关键词;
系统预先设定识别应用分类的默认映射关系;
获取所述移动应用及应用页面中关键信息;
通过分词组件获取所述移动应用及应用页面中关键信息中的分词结果,并剔除忽略词库中的内容;
采用最大匹配算法匹配基础分类特征词;
依据匹配阈值判断是否匹配成功,若匹配成功,则直接识别对应基础特征及分类,并持续进行分类信息识别;
否则,系统进行映射策略选择,并进入匹配基础特征库关键词识别;其中,所述映射策略选择包括发送无法识别分类通知至系统以进行手动映射,或自动映射为未识别分类;
系统对采集到的应用特征关键词进行处理,获取到最优分类;
构建应用基础画像,并将新的分类结果补充至基础分类特征库。
2.根据权利要求1所述的基于移动应用的分类识别方法,其特征在于,所述基础分类特征库的基础分类包括:社交类、影音类、游戏类。
3.根据权利要求1或2所述的基于移动应用的分类识别方法,其特征在于,所述系统对采集到的应用特征关键词进行处理,获取到最优分类,其中通过最大公约算法获取最优分类。
4.根据权利要求1所述的基于移动应用的分类识别方法,其特征在于,所述匹配阈值包括设定命中词的个数。
5.根据权利要求4所述的基于移动应用的分类识别方法,其特征在于,当命中情况为非唯一命中或全未命中,则进行手动映射。
6.根据权利要求1所述的基于移动应用的分类识别方法,其特征在于,当自动映射为未识别分类,则系统持续进行分类识别,直至匹配完成。
7.一种基于移动应用的分类识别系统,其特征在于,其包括:
初始化控制模块,用于执行步骤系统建立基础分类特征库;
通过互联网爬取移动应用及应用页面中关键信息;
识别分类信息模块,用于执行系统识别所述关键信息中的分类信息及应用特征关键词;
系统预先设定识别应用分类的默认映射关系;
获取所述移动应用及应用页面中关键信息;
通过分词组件获取所述移动应用及应用页面中关键信息中的分词结果,并剔除忽略词库中的内容;
采用最大匹配算法匹配基础分类特征词;
依据匹配阈值判断是否匹配成功,若匹配成功,则直接识别对应基础特征及分类,并持续进行分类信息识别;
否则,系统进行映射策略选择,并进入匹配基础特征库关键词识别;其中,所述映射策略选择包括发送无法识别分类通知至系统以进行手动映射,或自动映射为未识别分类;
系统对采集到的应用特征关键词进行处理,获取到最优分类;
构建应用基础画像,并将新的分类结果补充至基础分类特征库。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于卓望数码技术(深圳)有限公司,未经卓望数码技术(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810300929.4/1.html,转载请声明来源钻瓜专利网。





