[发明专利]数据处理方法、装置、设备及存储介质在审
申请号: | 201910765590.X | 申请日: | 2019-08-19 |
公开(公告)号: | CN112396084A | 公开(公告)日: | 2021-02-23 |
发明(设计)人: | 鲍媛媛;马丽秋;李杨 | 申请(专利权)人: | 中国移动通信有限公司研究院;中国移动通信集团有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 高洁;张颖玲 |
地址: | 100053 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 方法 装置 设备 存储 介质 | ||
1.一种数据处理方法,其特征在于,所述方法包括:
确定从历史样本中筛选的特征样本和所述特征样本的类型;所述特征样本的类型构成第一类型集合;
确定目标样本和所述目标样本的类型;所述目标样本的类型构成第二类型集合;所述第二类型集合与所述第一类型集合不同;
根据所述特征样本、所述特征样本的类型、所述目标样本以及所述目标样本的类型,调整第一分类模型的参数,得到第二分类模型;所述第一分类模型能够识别所述第一类型集合所包括的类型;所述第二分类模型能够识别第三类型集合所包括的类型;所述第三类型集合为所述第一类型集合和所述第二类型集合的并集。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
将所述历史样本进行降维;
从降维后的历史样本中选取所述特征样本。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
根据不同历史样本的类型,将所述历史样本构成的历史样本集合划分为至少一个样本子集合;属于同一样本子集合的历史样本的类型相同,属于不同样本子集合的历史样本的类型不同;
从所述至少一个样本子集合所包括的历史样本中选取相应样本子集合中的特征样本。
4.根据权利要求3所述的方法,其特征在于,所述从所述至少一个样本子集合所包括的历史样本中选取相应样本子集合中的特征样本,包括:
对于每一样本子集合,分别执行以下处理,得到相应样本子集合中的特征样本:
确定所述样本子集合中各历史样本的密度;
根据各历史样本的密度对所述样本子集合中的历史样本进行排序;
将排序在前的设定数量个历史样本作为所述样本子集合的特征样本。
5.根据权利要求4所述的方法,其特征在于,所述确定所述样本子集合中各历史样本的密度,包括:
对于所述样本子集合中的每一历史样本,分别执行以下处理,得到相应历史样本的密度:
确定所述历史样本分别与所述样本子集合中其他历史样本之间的距离;
将所确定的距离相加,得到所述历史样本的密度。
6.根据权利要求1或2所述的方法,其特征在于,所述根据所述特征样本、所述特征样本的类型、所述目标样本以及所述目标样本的类型,调整第一分类模型的参数,得到第二分类模型,包括:
对所述目标样本进行降维;
根据所述特征样本、所述特征样本的类型、降维后的目标样本以及所述目标样本的类型,调整第一分类模型的参数,得到第二分类模型。
7.根据权利要求6所述的方法,其特征在于,所述根据所述特征样本、所述特征样本的类型、降维后的目标样本以及所述目标样本的类型,调整第一分类模型的参数,得到第二分类模型,包括:
对所述降维后的目标样本进行升维,得到更新后的目标样本;
将所述更新后的目标样本作为第三分类模型的输入,得到所述第三分类模型输出的将所述更新后的目标样本识别为对应类型的概率;所述第三分类模型能够识别第二类型集合所包括的类型;
根据所述特征样本、所述特征样本的类型、降维后的目标样本以及相应的更新后的目标样本对应概率,调整第一分类模型的参数,得到第二分类模型。
8.根据权利要求7所述的方法,其特征在于,所述方法还包括:
将所述目标样本输入设置的网络模型,得到所述网络模型的输出结果;
将所述目标样本对应的输出结果和相应目标样本的类型进行比较,根据比较结果调整所述网络模型的参数,直到所述网络模型收敛,得到所述第三分类模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国移动通信有限公司研究院;中国移动通信集团有限公司,未经中国移动通信有限公司研究院;中国移动通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910765590.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:可穿戴设备、信号处理方法和计算可读存储介质
- 下一篇:硬膜开口闭合装置