[发明专利]检测方法、装置、存储介质、设备及程序产品在审
申请号: | 202210405467.9 | 申请日: | 2022-04-18 |
公开(公告)号: | CN115130537A | 公开(公告)日: | 2022-09-30 |
发明(设计)人: | 樊鹏 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京励诚知识产权代理有限公司 11647 | 代理人: | 熊金凤 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 检测 方法 装置 存储 介质 设备 程序 产品 | ||
1.一种检测方法,其特征在于,包括:
获取第一样本集和第二样本集,所述第一样本集和所述第二样本集的对象属性不同,所述第一样本集的样本数量大于所述第二样本集的样本数量;
将所述第一样本集分为多个子样本集,根据所述第一样本集的样本数量和所述第二样本集的样本数量的样本数量比例,确定每个所述子样本集的采样个数;
根据所述采样个数对每个所述子样本集进行随机采样,以生成第三样本集,并根据所述第三样本集和所述第二样本集生成训练集,所述第三样本集的样本数量和所述第二样本集的样本数量的样本数量比例小于预设比例;
根据所述训练集训练检测模型,以得到训练好的所述检测模型;
根据训练好的所述检测模型检测待检测对象,以得到所述待检测对象的检测信息,所述检测信息用于表示所述待检测对象的对象属性。
2.根据权利要求1所述的检测方法,其特征在于,所述获取第一样本集和第二样本集,包括:
从原始训练样本中获取带有标签信息的种子对象,所述标签信息用于表示所述种子对象的对象属性;
对所述种子对象进行特征向量处理,以得到所述种子对象的特征向量;
根据所述种子对象的特征向量确定所述第一样本集和第二样本集。
3.根据权利要求2所述的检测方法,其特征在于,所述从原始训练样本中获取带有标签信息的种子对象,包括:
获取所述种子对象的基础画像;
根据所述种子对象的基础画像,确定异常对象评价指标;
根据所述异常对象评价指标和分布异常定理,从所述种子对象中过滤掉异常种子对象,以得到更新后的所述种子对象。
4.根据权利要求2所述的检测方法,其特征在于,所述对所述种子对象进行特征向量处理,以得到所述种子对象的特征向量,包括:
基于所述种子对象的历史行为数据,构建所述种子对象的基础画像特征,所述基础画像特征至少包括对象基础属性、设备基础属性和网络连接属性;
基于所述种子对象的业务特性,构建所述种子对象的业务垂直类型特征;
结合预设时间维度对所述种子对象的基础画像特征和业务垂直类型特征进行聚合处理,以聚合出不同时间维度的聚合后的基础画像特征和聚合后的业务垂直类型特征;
对所述聚合前的基础画像特征和聚合后的基础画像特征中的至少一个与业务垂直类型特征进行特征向量处理,以获取所述种子对象的第一特征信息;
对所述种子对象的第一特征信息中的类目特征进行处理,以得到所述种子对象的第二特征信息;
将所述种子对象的第一特征信息和第二特征信息进行合并,以得到所述种子对象的特征向量,所述种子对象的特征向量为数值型特征向量。
5.根据权利要求4所述的检测方法,其特征在于,所述对所述聚合前的基础画像特征和聚合后的基础画像特征中的至少一个与业务垂直类型特征进行特征向量处理,包括:
对所述聚合前的基础画像特征和聚合后的基础画像特征中的至少一个和业务垂直类型特征中的数值型特征进行归一化处理;及
对所述聚合前的基础画像特征和聚合后的基础画像特征中的至少一个和业务垂直类型特征中的非数值型特征进行离散化处理。
6.根据权利要求1-5任一项所述的检测方法,其特征在于,所述将所述第一样本集分为多个子样本集,根据所述第一样本集的样本数量和所述第二样本集的样本数量的样本数量比例,确定每个所述子样本集的采样个数,包括:
在所述第一样本集和所述第二样本集的样本数量比例大于所述预设比例的情况下,根据所述预设比例、所述子样本集的样本数量和所述第二样本集的样本数量,确定所述采样个数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210405467.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种离散刃变齿距立铣刀
- 下一篇:跑步数据监测方法、装置、终端设备及存储介质