[发明专利]基于CNN的应用程序行业分类方法、存储介质及终端有效
| 申请号: | 201910048882.1 | 申请日: | 2019-01-18 |
| 公开(公告)号: | CN109816005B | 公开(公告)日: | 2021-08-03 |
| 发明(设计)人: | 廖兴龙 | 申请(专利权)人: | 北京智游网安科技有限公司 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04 |
| 代理公司: | 深圳市君胜知识产权代理事务所(普通合伙) 44268 | 代理人: | 王永文;刘文求 |
| 地址: | 100000 北京市海淀区东北旺西路8*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 cnn 应用程序 行业 分类 方法 存储 介质 终端 | ||
1.一种基于CNN的应用程序行业分类方法,其特征在于,其包括:
获取各应用程序的主页面图片,并将获取到的主页面图片划分为第一主页面图片集和第二主页面图片集,其中,所述第一主页面图片集包含第一预设数量的主页面图片;
通过预设的增强算法将获取到的第一主页面图片集扩大至第二预设数量的第三主页面图片集;
根据深度学习算法和所述第三主页面图片集构建行业关系模型;
根据所述行业关系模型对第二主页面图片集进行分类,以对第二主页面图片集中各主页面图片对应的应用程序进行行业分类;
所述第一主页面图片集包含第一预设数量的主页面图片具体包括:
选取第三预设数量的行业类型,并在各行业类型下选取第四预设数量的应用程序;
所述第三预设数量的行业类型下的第四预设数量的应用程序的主页面图片构成了第一主页面图片集;
所述根据所述行业关系模型对第二主页面图片集进行分类,以对第二主页面图片集中各主页面图片对应的应用程序进行行业分类具体包括:
获取主页面图片与行业类型的行业关系模型;
根据所述行业关系模型对第二主页面图片集中各主页面图片进行分类;
根据各主页面图片的分类,进而对各主页面图片对应的应用程序进行行业分类;
所述预设的增强算法具体包括:
对图片进行旋转90度,旋转180度,旋转270度,镜像,平移,改变亮度,改变对比度,色彩调整,加入噪声中的一种或者多种;
所述根据深度学习算法和所述第三主页面图片集构建行业关系模型具体包括:
将第三主页面图片集按照预设的比例划分为训练集、测试集和验证集;
根据深度学习算法和划分后的训练集、测试集和验证集生成行业关系模型;
所述根据深度学习算法和划分后的训练集、测试集和验证集生成行业关系模型具体包括:
增加深度学习算法对划分后的训练集、测试集和验证集的运行次数,以减少测试集和验证集的损失;
当损失降至最低时,保存生成的行业关系模型;
所述获取各应用程序的主页面图片还包括:
获取各应用程序的包名,并建立各应用程序的主页面图片与包名的对应关系。
2.根据权利要求1所述基于CNN的应用程序行业分类方法,其特征在于,所述深度学习算法为LeNet-5深度学习算法。
3.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现如权利要求1~2任意一项所述的基于CNN的应用程序行业分类方法中的步骤。
4.一种终端设备,其特征在于,包括:处理器和存储器;所述存储器上存储有可被所述处理器执行的计算机可读程序;所述处理器执行所述计算机可读程序时实现如权利要求1~2任意一项所述的基于CNN的应用程序行业分类方法中的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京智游网安科技有限公司,未经北京智游网安科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910048882.1/1.html,转载请声明来源钻瓜专利网。





