[发明专利]伪造样本检测模型的训练方法、伪造样本识别方法、装置、介质和设备有效
申请号: | 202110507606.4 | 申请日: | 2021-05-10 |
公开(公告)号: | CN113128619B | 公开(公告)日: | 2022-05-31 |
发明(设计)人: | 不公告发明人 | 申请(专利权)人: | 北京瑞莱智慧科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京箴思知识产权代理有限公司 11913 | 代理人: | 李春晖;朱乐敏 |
地址: | 100084 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 伪造 样本 检测 模型 训练 方法 识别 装置 介质 设备 | ||
提供了一种伪造样本检测模型的训练方法、伪造样本识别方法、装置、介质和设备,该训练方法包括:获取真实样本集和包括多种已知伪造类型的伪造样本的伪造样本集;重复执行以下步骤,直到预设条件:根据所述真实样本集,确定训练真实样本集和测试真实样本集;根据所述伪造样本集,确定元训练伪造样本集和元测试伪造样本集,所述元训练伪造样本集与所述元测试伪造样本集包括的伪造样本的伪造类型不同;采用所述训练真实样本集、元训练伪造样本集对所述伪造样本检测模型进行元训练,得到内层优化后的伪造样本检测模型;采用所述训练真实样本集、元测试伪造样本集对内层优化后的伪造样本检测模型进行元测试,得到外层优化后的伪造样本检测模型。
技术领域
本发明的实施方式涉及伪造样本检测技术领域,更具体地,本发明的实施方式涉及一种伪造样本检测模型的训练方法、伪造样本识别方法、装置、介质和设备。
背景技术
本部分旨在为权利要求书中陈述的本发明的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
伪造样本检测是一项十分重要且具有挑战性的任务,这项任务旨在区分待识别的样本是否为伪造技术恶意篡改形成的。随着各种新型伪造技术的不断涌现和迭代,现有的大多数伪造样本检测方法通常由于过分依赖检测模型训练过程中使用过的伪造样本,因此无法很好地检测出通过所述检测模型未见过的伪造技术制造的伪造样本。
发明内容
在本上下文中,本发明的实施方式期望提供一种伪造样本检测模型的训练方法、伪造样本识别方法、装置、介质和设备。
在本发明实施方式的第一方面中,提供了一种伪造样本检测模型的训练方法,包括:
获取真实样本集和伪造样本集,所述伪造样本集中包括多种已知伪造类型的伪造样本;
重复执行以下步骤,直到达到预设条件:
根据所述真实样本集,确定训练真实样本集和测试真实样本集;
根据所述伪造样本集,确定元训练伪造样本集和元测试伪造样本集,所述元训练伪造样本集中任一伪造样本的伪造类型与所述元测试伪造样本集中任一伪造样本的伪造类型不同;
采用所述训练真实样本集、元训练伪造样本集对所述伪造样本检测模型进行元训练,得到内层优化后的伪造样本检测模型;
采用所述训练真实样本集、元测试伪造样本集对内层优化后的伪造样本检测模型进行元测试,得到外层优化后的伪造样本检测模型。
在本实施方式的一个实施例中,按照第一预设方式从所述伪造样本集中采样多个伪造样本作为元测试伪造样本集,并将所述伪造样本集中剩余的多个伪造样本作为元训练伪造样本集。
在本实施方式的一个实施例中,按照第一预设方式从所述伪造样本集中采样多个伪造样本作为元测试伪造样本集,包括:
计算一服从预设均匀分布的采样概率;
按照所述采样概率从所述伪造样本集中采样多个伪造样本作为元测试伪造样本集。
在本实施方式的一个实施例中,按照第一预设方式从所述伪造样本集中采样多个伪造样本作为元测试伪造样本集,包括:
选择所述伪造样本检测模型更不熟悉的一个或多个伪造类型的多个伪造样本作为元测试伪造样本集。
在本实施方式的一个实施例中,选择所述伪造样本检测模型更不熟悉的一个或多个伪造类型的多个伪造样本作为元测试伪造样本集,包括:
计算各个伪造类型的伪造样本与真实样本的特征在再生核希尔伯特空间的范数距离;
确定距离较大的一个或多个伪造类型的多个伪造样本为元测试伪造样本集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京瑞莱智慧科技有限公司,未经北京瑞莱智慧科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110507606.4/2.html,转载请声明来源钻瓜专利网。