[发明专利]一种基于模糊双超球分类模型的数据分类方法及系统有效
申请号: | 201810623801.1 | 申请日: | 2018-06-15 |
公开(公告)号: | CN110555054B | 公开(公告)日: | 2023-06-09 |
发明(设计)人: | 刘忠宝 | 申请(专利权)人: | 泉州信息工程学院 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F18/2411 |
代理公司: | 北京安博达知识产权代理有限公司 11271 | 代理人: | 徐国文 |
地址: | 362000 福*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 模糊 双超球 分类 模型 数据 方法 系统 | ||
本发明涉及一种基于模糊双超球分类模型的数据分类方法及系统,所述方法包括:获取待测数据;通过预先建立的模糊双超球分类模型的决策函数确定所述待测数据的分类结果;其中,所述模糊双超球分类模型包括决策函数和两个模糊超球模型;所述决策函数通过两个模糊超球模型的最优球心和最优半径进行确定,所述两个模糊超球模型的最优球心和最优半径通过对各自的训练样本集进行训练确定,采用该技术方案不仅时间复杂度低,效率更高,同时在构建超球模型的过程中引入模糊隶属度函数,避免现有技术中易受奇异点和噪声点影响的问题,实现高精确度的数据分类。
技术领域
本发明涉及数据分类技术领域,具体涉及一种基于模糊双超球分类模型的数据分类方法及系统。
背景技术
随着高科技数据采集和探测技术的发展,获取数据的途径越来越广,效率也大幅上升,观测数据的规模也日益庞大,传统的数据分类方法无法满足实际需要,需将智能分类方法引入到数据分类方法中,在现有的数据分类方法中,应用比较广泛的有支持向量机(Support Vector Machine,SVM)和双支持向量机(Twin Support Vector Machine,TWSVM);其中,支持向量机通过构建一个超平面达到对数据进行分类的效果,但由于时间复杂度过高,导致计算效率低下,双支持向量机采用构造一对分类超平面将两类数据分开,该方法的时间复杂度仅是SVM的1/4,这在很大程度上提高了支持向量机的计算效率。然而,该方法易受到奇异点和噪声点的影响,分类精度有待提高。
发明内容
本发明提供种基于模糊双超球分类模型的数据分类方法及系统,其目的是通过训练每一类训练样本数据分别构造两个模糊超球模型,然后利用两个模糊超球模型的最优球心和最优确定决策函数并达到数据分类的目的,其中引入模糊隶属度函数,有效地降低了奇异点和噪声点对分类结果的影响,提升分类精确度。
本发明的目的是采用下述技术方案实现的:
一种基于模糊双超球分类模型的数据分类方法,其改进之处在于,所述方法包括:
获取待测数据;
通过预先建立的模糊双超球分类模型的决策函数确定所述待测数据的分类结果;
其中,所述模糊双超球分类模型包括决策函数和两个模糊超球模型;所述决策函数通过两个模糊超球模型的最优球心和最优半径进行确定,所述两个模糊超球模型的最优球心和最优半径通过对各自的训练样本集进行训练确定;所述两个模糊超球模型的训练样本集为分别从对应类型的实验数据中随机抽取的数据集合。
优选地,所述决策函数通过两个模糊超球模型的最优球心和最优半径进行确定,包括:按下式确定所述模糊双超球分类模型的决策函数f(x):
式中,c'+为第一模糊超球模型的最优球心,c'-为第二模糊超球模型的最优球心,R'+为第一模糊超球模型的最优半径,R'-为第二模糊超球模型的最优半径,x为待测样本点。
优选地,所述两个模糊超球模型的最优球心和最优半径通过对各自的训练样本集进行训练确定,包括:
从所述实验数据中随机抽取数据确定为训练样本集,并根据实验数据的类别标签将所述训练样本集分为第一类训练样本集和第二类训练样本集;
分别对所述第一类训练样本集和第二类训练样本集进行训练构建第一模糊超球模型和第二模糊超球模型;
利用拉普拉斯乘子法,引入拉格朗日乘子,将第一模糊超球模型和第二模糊超球模型的最优化问题转换为对偶形式,获取数据模糊双超球分类模型的最优球心和最优半径。
进一步地,所述分别对所述第一类训练样本集和第二类训练样本集进行训练构建第一模糊超球模型和第二模糊超球模型,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于泉州信息工程学院,未经泉州信息工程学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810623801.1/2.html,转载请声明来源钻瓜专利网。