[发明专利]基于随机特征的迁移成分处理方法、装置及存储介质在审
| 申请号: | 202210864796.X | 申请日: | 2022-07-21 |
| 公开(公告)号: | CN115147724A | 公开(公告)日: | 2022-10-04 |
| 发明(设计)人: | 王源杰;冯湛博;廖振宇;邱才明;密铁宾;兰军;拾婷婷 | 申请(专利权)人: | 徐州才聚智能科技有限公司 |
| 主分类号: | G06V20/10 | 分类号: | G06V20/10;G06V10/44;G06V10/764;G06N20/00 |
| 代理公司: | 成都顶峰专利事务所(普通合伙) 51224 | 代理人: | 叶昌威 |
| 地址: | 221000 江苏省徐州市高新技术产业开发区*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 随机 特征 迁移 成分 处理 方法 装置 存储 介质 | ||
本发明涉及迁移学习技术领域,具体公开了基于随机特征的迁移成分处理方法、装置及存储介质。通过对预处理后原始场景的特征数据集和目标场景的特征数据集进行拼接,得到总特征数据集,基于总特征数据集进行随机傅里叶特征计算,然后进行相应的征向量矩阵计算,进而计算得到迁移特征,利用原始场景的迁移特征数据集进行分类器训练,利用训练后的分类器对目标场景的迁移特征数据集进行预测分类,以通过随机傅里叶特征映射实现原始场景数据特征到目标场景据特征的快速迁移,在保证迁移计算处理性能的同时,大大提升了计算运行速度,为迁移学习在工业界大规模场景的应用提供了可行性。
技术领域
本发明属于迁移学习技术领域,具体涉及基于随机特征的迁移成分处理方法、装置及存储介质。
背景技术
人工智能领域飞速发展得益于现代机器学习技术的进步,现代机器学习技术的进步依赖于数据的飞速增长以及硬件计算性能的巨大提升。然而数据需要先进行人工标记才能应用于实际生产之中,这会造成高昂的人力成本。一些领域,例如医疗疾病领域,甚至需要大量专家标记的数据。虽然硬件计算性能仍然在持续增长,但高昂的数据标记本限制了机器学习技术的发展。
迁移学习能够从一个或多个应用场景中提取知识以帮助提高目标场景中的学习性能。由于各个领域的数据分布并不相同,将传统机器学习算法直接应用到不同的领域得到的结果与实际往往有很大出入。如果原始场景的数据集拥有充足的标记数据,而想要进行学习的目标场景只有很少的标记数据或者只有少量数据且没有任何标记,这时迁移学习可以利用原本场景的数据集中包含的知识对目标场景的数据进行学习,得到需要的结果。迁移学习可以应用到诸多领域,例如提升模型的泛化性、推荐系统在新用户使用时的冷启动问题、模拟实验对现实场景的拟合问题等。
然而目前存在的迁移学习算法计算复杂度很高,会消耗大量的时间进行计算。在现实应用中,机器学习领域的数据量往往非常大,巨大的时间复杂度导致迁移学习在工业界的应用并不广泛,无法大规模应用于实际场景。
发明内容
本发明的目的是提供基于随机特征的迁移成分处理方法、装置及存储介质,用以解决现有技术中存在的上述问题。
为了实现上述目的,本发明采用以下技术方案:
第一方面,提供基于随机特征的迁移成分处理方法,包括:
获取原始场景的数据集和目标场景的数据集;
对原始场景的数据集和目标场景的数据集分别进行预处理,得到原始场景的特征数据集和目标场景的特征数据集,其中,原始场景的特征数据集包含Ns个样本,目标场景的特征数据集包含Nt个样本;
将原始场景的特征数据集和目标场景的特征数据集进行拼接,得到总特征数据集,所述总特征数据集包含Ns+Nt个样本;
根据总特征数据集计算得到随机傅里叶特征矩阵;
利用随机傅里叶特征矩阵计算得到相应的特征向量矩阵;
根据随机傅里叶特征矩阵和特征向量矩阵计算得到总迁移特征数据集,所述总迁移特征数据集包含Ns+Nt个样本,且与总特征数据集中的样本一一对应;
从总迁移特征数据集中提取前Ns个样本作为原始场景的迁移特征数据集,提取后Nt个样本作为目标场景的迁移特征数据集;
利用原始场景的迁移特征数据集训练预置的分类器,得到训练后的分类器;
利用训练后的分类器对目标场景的迁移特征数据集进行预测分类,得到分类结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于徐州才聚智能科技有限公司,未经徐州才聚智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210864796.X/2.html,转载请声明来源钻瓜专利网。





