[发明专利]目标类型app的确定方法、电子设备和介质有效
| 申请号: | 202011259036.3 | 申请日: | 2020-11-12 |
| 公开(公告)号: | CN112100386B | 公开(公告)日: | 2021-02-05 |
| 发明(设计)人: | 陈玉琪;朱金星;张静雅 | 申请(专利权)人: | 北京云真信科技有限公司 |
| 主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/216;G06F40/289;G06K9/62 |
| 代理公司: | 北京锺维联合知识产权代理有限公司 11579 | 代理人: | 丁慧玲 |
| 地址: | 100080 北京*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 目标 类型 app 确定 方法 电子设备 介质 | ||
1.一种目标类型app的确定方法,其特征在于,包括:
步骤S1、获取预设数量的样本app对应的名称信息和描述信息,所述名称信息和描述信息均为文本信息;
步骤S2、根据所述样本app的名称信息、描述信息、预设的第一词表、第二词表和第三词表构建特征向量,基于所述样本app的特征向量和对应的app类型构建训练样本,其中,app类型为目标类型的训练样本为正样本,对应的因变量实际值为1;app类型为非目标类型的训练样本为负样本,对应的因变量实际值为0;所述第一词表用于存储目标app类型特征词,所述第二词表用于存储非目标app类型特征词,所述第三词表用于存储目标app类型特征信息;
步骤S3、将所述训练样本输入预设的分类模型中进行训练,得到app分类模型;
步骤S4、获取待测app对应的特征向量,并输入所述app分类模型,得到分类预测值,若所述分类预测值大于预设分类阈值,则确定所述待测app是为目标类型app;
所述步骤S2包括:
步骤S21、根据所述样本app的名称信息、第一词表和第二词表构建第一特征向量,基于所述第一特征向量和对应的app类型构建第一训练样本;
步骤S22、根据所述样本app的描述信息、第一词表和第二词表构建第二特征向量,基于所述第二特征向量和对应的app类型构建第二训练样本;
步骤S23、根据所述样本app的描述信息、第三词表构建第三特征向量,基于所述第三特征向量和对应的app类型构建第三训练样本;
所述步骤S21包括:
步骤S211、根据预设的第一分词词库将所述样本app的名称信息进行分词处理,得到多个名称分词信息;
步骤S212、根据预设的第一停用词词库将所述多个名称分词信息进行去停用词处理,得到名称特征分词;
步骤S213、将所述名称特征分词与所述第一词表和第二词表匹配,获取第一词表中出现所述名称特征分词的数量、第二词表中出现所述名称特征分词的数量、每一名称特征分词在第一词表中出现的次数,每一名称特征分词在第二词表中出现的次数;
步骤S214、基于所述第一词表中出现所述名称特征分词的数量、第二词表中出现所述名称特征分词的数量、每一名称特征分词在第一词表中出现的次数,每一名称特征分词在第二词表中出现的次数构建所述第一特征向量。
2.根据权利要求1所述的目标类型app的确定方法,其特征在于,
所述步骤S22包括:
步骤S221、从所述样本app的描述信息中提取第一描述字段信息;
步骤S222、根据预设的第二分词词库将所述第一描述字段信息进行分词处理,得到多个描述分词信息;
步骤S223、根据预设的第二停用词词库将所述多个描述分词信息进行去停用词处理,得到描述特征分词;
步骤S224、将所述描述特征分词与所述第一词表和第二词表匹配,获取第一词表中出现所述描述特征分词的数量、第二词表中出现所述描述特征分词的数量、每一描述特征分词在第一词表中出现的次数,每一描述特征分词在第二词表中出现的次数;
步骤S225、基于所述第一词表中出现所述描述特征分词的数量、第二词表中出现所述描述特征分词的数量、每一描述特征分词在第一词表中出现的次数,每一描述特征分词在第二词表中出现的次数构建所述第二特征向量。
3.根据权利要求2所述的目标类型app的确定方法,其特征在于,
所述第一分词词库和第二分词词库相同或不相同,所述第一停用词词库和第二停用词词库相同或不相同,所述方法还包括:
步骤S100、接收用户输入的词库更新指令;
步骤S111、从所述词库更新指令中解析出待更新的词库id、待更新的词语文本信息;
步骤S112、根据所述待更新的词库id、待更新的词语文本信息更新对应的词库。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京云真信科技有限公司,未经北京云真信科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011259036.3/1.html,转载请声明来源钻瓜专利网。





