[发明专利]基于模糊大间隔最小球分类的恒星光谱离群数据挖掘方法有效

专利信息
申请号: 201610031687.4 申请日: 2016-01-18
公开(公告)号: CN105718941B 公开(公告)日: 2017-06-27
发明(设计)人: 刘忠宝;赵文娟;杨秋翔 申请(专利权)人: 中北大学
主分类号: G06K9/62 分类号: G06K9/62
代理公司: 武汉华旭知识产权事务所42214 代理人: 刘荣,江钊芳
地址: 030051*** 国省代码: 山西;14
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 模糊 间隔 小球 分类 恒星 光谱 离群 数据 挖掘 方法
【说明书】:

技术领域

发明涉及一种基于模糊大间隔最小球分类的恒星光谱离群数据挖掘方法,属于天体光谱分类领域。

背景技术

大型天文望远镜采集到的海量天体数据使天文学家摆脱了“数据贫乏”的窘境,但随之而来的问题是如何对这些数据进行有效分析和处理。由于人类对宇宙的认识还较为有限,因此,大型天文望远镜巡天的任务之一就是发现一些新的、特殊的天体。特殊天体的发现对于人类了解宇宙演变规律具有重要意义。目前,常见特殊天体发现方法的基本思想是利用智能分类算法对离群数据进行处理和分析。离群数据是指不满足其他数据的一般规律或分布性状,与已有数据不一致的数据。与一般数据相比,离群数据包含更重要的信息,深入挖掘这部分数据对于特征天体发现至关重要。

近年来天体光谱数据分类方法不断涌现,主要包括:Autoclass基于贝叶斯理论并采用非监督学习算法;Starck将小波变换引入光谱分析;Gulati等采用两层BP网络实现恒星光谱分类;Bailer-Jones利用多层感知神经网络和主元分析进行恒星光谱自动分类;覃冬梅等利用主元分析和最近邻分类器实现恒星光谱自动分类;刘蓉等利用小波特征对光谱星系进行分类;杨金福等提出基于核技巧与覆盖算法的光谱自动分类方法;许馨等利用核技巧将非线性问题转化为高维线性问题并利用线性判别分析算法进行光谱分类;赵梅芳等提出基于自适应增强的光谱分类方法;孙士卫等提出基于数据仓库的星系光谱分类方法;张怀福等利用小波包和支持向量机技术对活动天体和非天体光谱分类问题展开研究;张继福等提出基于约束概念格的恒星光谱数据自动分类方法;刘蓉等提出基于贝叶斯和主元分析的光谱分类方法;李乡儒等提出基于最近邻算法的光谱分类方法;Mahdi利用自组织映射算法进行光谱分类;Navarro等利用人工神经网络进行光谱分类;刘忠宝等提出基于流形判别分析和支持向量机的恒星光谱分类方法。

上述分类方法均能较好地完成天体光谱分类任务,但它们均对离群数据不敏感,分类性能甚至受离群点影响较大,因而无法完成特殊天体发现任务。

发明内容

为了解决现有技术的不足,本发明提供了一种基于模糊大间隔最小球分类的恒星光谱离群数据挖掘方法,该方法基于模糊最大间隔最小球模型(Fuzzy Large Margin and Minimum Ball Classification Model,FLM-MBC),该模型对离群点较为敏感,在一定程度上克服了已有分类方法在特殊天体发现方面的不足,为特殊天体发现研究提供了新的思路。在该模型中,模糊技术的引入保证将样本区别对待,这样便减少噪声点和奇异点对分类结果的影响。

本发明为解决其技术问题所采用的技术方案是:提供了一种基于模糊大间隔最小球分类的恒星光谱离群数据挖掘方法,包括以下步骤:

(1)对于斯隆望远镜采集回的天体光谱数据,根据每一个光谱数据的流量、峰宽和形状将其离散化,得到待处理的数据集;假设所述样本集由m1′个一般类样本和m2′个离群类样本构成,样本总数n′=m1′+m2′,m2′<<m1′;由m1′个一般类样本组成的集合中xi表示一般类样本,1≤i≤m1′,yi表示类别标签,yi=1表示该样本属于一般类;m2′个离群类样本组成的集合中xj表示离群类样本,m1′+1≤j≤n′,yj表示类别标签,yj=-1,表示该样本属于离群类;从样本集中随机选取n个样本构成训练样本集,使训练样本集中的一般类样本和离群类样本的数量分别为m1和m2,比例保持为m1/m2=m1′/m2′,样本集中除其训练样本集以外的样本组成测试样本集;

(2)利用训练样本集构建基于模糊大间隔最小球分类模型,所述基于模糊大间隔最小球分类模型的最优化问题为:

其约束条件为:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中北大学,未经中北大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201610031687.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top