[发明专利]一种获取APP类型的数据处理系统在审
| 申请号: | 202211429023.5 | 申请日: | 2022-11-15 |
| 公开(公告)号: | CN115687981A | 公开(公告)日: | 2023-02-03 |
| 发明(设计)人: | 段永康;董霖;叶新江;朱为宁 | 申请(专利权)人: | 每日互动股份有限公司 |
| 主分类号: | G06F18/24 | 分类号: | G06F18/24;G06F18/22;G06F18/214;G06F40/289;G06F16/38;G06F16/35 |
| 代理公司: | 北京锺维联合知识产权代理有限公司 11579 | 代理人: | 原春香 |
| 地址: | 310012 浙江省杭州*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 获取 app 类型 数据处理系统 | ||
本发明涉及一种获取APP类型的数据处理系统,系统包括:第一数据库、第二数据库、第三数据库、处理器和存储有计算机程序的存储器,其中,第一数据库包括原始APP集,第二数据库包括样本APP集,第三数据库包括非样本APP集,当计算机程序被处理器执行时,实现以下步骤:获取初始APP列表对应的目标标签集,根据样本APP集和目标标签集获取非样本APP的最终标签,根据最终标签,获取非样本APP对应的APP类型。本发明提供了一种新的获取APP类型的方法,通过对非样本APP采用不同的处理手段,获取所有APP的标签,从而进行APP的分类,使得获取到的APP类型的准确度较高。
技术领域
本发明涉及APP处理技术领域,特别是涉及一种获取APP类型的数据处理系统。
背景技术
随着智能化的普及和发展,越来越多的应用软件(APP)出现在设备端的应用平台中,技术的不断创新与发展,使得应用软件的类型越来越多,每个类型下应用软件的数量也越来越多,如何对设备端应用平台中的应用软件进行清晰的分类处理成为热门研究问题,通过获取APP标签从而对APP进行精准分类,能够为用户提供更加精准化服务。
目前,现有技术中,获取APP分类的方法为:基于APP的id获取对应的描述信息,将对应的描述信息输入模型中生成向量,基于APP的id获取预设安装序列生成向量,将生成的所有向量输入到分类模型中进行APP类型的输出,以上所述获取APP类型的方法存在的问题:
一方面,因方法的局限性,APP标签简单化,使得对APP分类的精确度较低;
另一方面,因APP数量的巨大,只局限于对特定部分的APP进行分类,不能全面自动覆盖所有APP,使获取到的APP类型的准确度较低。
发明内容
针对上述技术问题,本发明采用的技术方案为:一种获取APP类型的数据处理系统,系统包括:第一数据库、第二数据库、第三数据库、处理器和存储有计算机程序的存储器,其中,第一数据库包括原始APP集,其中,原始APP集为所有的应用平台中所有APP的集合,第二数据库包括样本APP集,其中,样本APP集包括第一样本APP集和第二样本APP集,第三数据库包括非样本APP集,其中,非样本APP集为原始APP集中除所述样本APP集之外的APP集合,当计算机程序被处理器执行时,实现以下步骤:
S10,从非样本APP集中获取第一非样本APP列表FA={FA1,……,FAα,……,FAλ}和第二非样本APP列表FB={FB1,……,FBβ,……,FBγ},FAα为第α个第一非样本APP信息,α=1……λ,λ为第一非样本APP的数量,FBβ为第β个第二非样本APP信息,β=1……γ,γ为第二非样本APP的数量。
S20,根据第一样本APP集,获取初始APP列表B={B1,……,Bi,……,Bm}、B对应的初始文本列表C={C1,……,Ci,……,Cm}和B对应的初始pkg列表Q={Q1,……,Qi,……,Qm},Bi为第i个初始APP名称,Ci为Bi对应的初始APP文本,Qi为Bi对应的pkg名称,i=1……m,m为初始APP的数量。
S30,根据B和C,获取B对应的目标标签集D'={D'1,……,D'i,……,D'm},D'i为Bi对应的目标标签列表。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于每日互动股份有限公司,未经每日互动股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211429023.5/2.html,转载请声明来源钻瓜专利网。





