[发明专利]一种基于支持点学习的开集类别发掘方法与装置在审
| 申请号: | 201910882778.2 | 申请日: | 2019-09-18 |
| 公开(公告)号: | CN110807467A | 公开(公告)日: | 2020-02-18 |
| 发明(设计)人: | 田永鸿;陈光耀;乔李盟;史业民;曾炜 | 申请(专利权)人: | 北京大学 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京辰权知识产权代理有限公司 11619 | 代理人: | 刘广达 |
| 地址: | 100871*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 支持 学习 类别 发掘 方法 装置 | ||
1.一种开集类别发掘方法,其特征在于,包括:
将样本输入训练好的深度神经网络获得样本特征,
计算样本特征与每个类别的支持点集的距离,根据分类阈值和最大距离确定样本为未知样本或已定义样本,
如果是已定义类别样本,对样本进行分类,如果是未知样本,对样本进行拒绝;
所述深度神经网络的训练包括
初始化深度神经网络,将网络的最后一层作为特征输出;
构建和特征维度一致的支持点集,每个类别至少包含K个支持点,其中K大于等于1,按照随机正态分布初始化支持点集;构建和支持点集数目一致的自更新半径,每个支持点对应一个半径,所有的自更新半径初始化为零;
将已知类别的样本输入深度神经网络;
通过损失函数最小化以及梯度下降算法更新神经网络特征提取器、支持点集以及自更新半径,当损失达到阈值或设定条件时停止更新。
2.如权利要求1所述的一种开集类别发掘方法,其特征在于,
所述的支持点定义为:类别A的支持点为非类别A样本空间中的代表性的点,所述类别A相对于其他类别与其支持点的差异更大。
3.如权利要求2所述的一种开集类别发掘方法,其特征在于,所述损失函数为
其中,x为输入样本,K表示每个类别所包含的支持点数目,p(y|x)为x属于类别y的概率,λ为参数,为第y个类别第j个支持点,为第y个类别的第j个半径,d(*,*)为距离函数,‖*‖2为二阶范数;
所述p(y|x)的计算方法为:
其中x为输入样本,y为类别,K表示每个类别所包含的支持点数目,P表示支持点,代表i类别第j个支持点,为第y个类别第j个支持点,f(x)为网络输出,‖*‖2为二阶范数,γ为超参数。
4.如权利要求3所述的一种开集类别发掘方法,其特征在于,所述计算样本特征与每个类别的支持点集的距离,根据分类阈值和最大距离确定样本为未知样本或已定义样本,包括
计算样本特征和支持点集之间的最大距离;将样本x到每个类别支持点集的最大距离小于阈值δ时,样本x被分为未定义样本。
5.如权利要求4所述的一种开集类别发掘方法,其特征在于,阈值δ的计算方法包括
其中,max为计算最大值函数,mean(*)为计算平均值函数,β为阈值尺度超参数;
其中dM的计算方法包括
计算每个已知类别的样本和训练得到的支持点集之间的距离,得到每个已知类别的样本与支持点集的最大距离集合dM:
其中,M为已知类别的样本总个数,N为类别总数,xi为第i个输入样本,K表示每个类别所包含的支持点数目,为第k个类别的第j个支持点,λ为参数,为第y个类别第j个支持点,为第y个类别的第j个半径,d(*,*)为距离,‖*‖2为二阶范数。
6.一种开集类别发掘装置,其特征在于,包括深度神经网络模块、样本确定模块、样本分类模块、预训练模块,
深度神经网络模块用以将样本输入训练好的深度神经网络获得样本特征,
样本确定模块用以计算样本特征与每个类别的支持点集的距离,根据分类阈值和最大距离确定样本为未知样本或已定义样本,
样本分类模块用以对已定义类别样本进行分类;
预训练模块,用以对深度神经网络进行训练,具体包括
初始化深度神经网络模块,将深度神经网络模块的最后一层作为特征输出;
构建和特征维度一致的支持点集,每个类别至少包含K个支持点,其中K大于等于1,按照随机正态分布初始化支持点集;构建和支持点集数目一致的自更新半径,每个支持点对应一个半径,所有的自更新半径初始化为零;
将已知类别的样本输入深度神经网络;
通过损失函数最小化以及梯度下降算法更新神经网络特征提取器、支持点集以及自更新半径,当损失达到阈值或设定条件时停止更新。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学,未经北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910882778.2/1.html,转载请声明来源钻瓜专利网。





