[发明专利]恒星光谱数据增强方法及系统在审

专利信息
申请号: 202110813458.9 申请日: 2021-09-16
公开(公告)号: CN113656754A 公开(公告)日: 2021-11-16
发明(设计)人: 邹志强;杨文宇;吴家皋;洪舒欣;韩杨 申请(专利权)人: 南京邮电大学
主分类号: G06F17/18 分类号: G06F17/18;G06N3/04;G06N3/08
代理公司: 南京纵横知识产权代理有限公司 32224 代理人: 陈珉
地址: 210046 江*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 恒星 光谱 数据 增强 方法 系统
【说明书】:

发明公开了一种恒星光谱数据增强方法及系统,包括光谱数据预处理模块:对原始的恒星光谱数据进行清洗、归一化、深度学习标签构建等数据预处理工作;搭建与训练条件生成对抗网络模块:基于博弈论理论搭建条件生成对抗网络,构建随机噪声向量,训练生成恒星光谱数据;基于训练好的生成模型进行数据增强模块:基于前面训练好的条件生成对抗网络,从随机的噪声向量生成恒星光谱数据。本发明的恒星光谱数据增强方法基于博弈论的理论基础,利用生成对抗网络,建立了不同类别恒星光谱的数据增强模型,使得本发明以较小的时间代价获得了足够的恒星光谱数据。

技术领域

本发明属于天文光谱智能处理技术领域,尤其涉及一种恒星光谱数据增强方法及系统。

背景技术

天文学是一门历史悠久的观测科学,随着斯隆数字巡天(SDSS)和大天区面积多目标光纤光谱天文望远镜(LAMOST)等多光纤光谱大型巡天计划的出现,天文光谱数据规模正以指数级爆炸性增长,由此导致了天文光谱数据自动分类方法研究的必要性和迫切性日益增强。通过分析光谱数据可以得到天体位置和状态的信息,这些信息有助于挖掘出宇宙中特殊的、未知的天体,对恒星演化研究和宇宙奥秘探索都有着积极的意义。

天文光谱数据分类就是要从上千维的光谱数据特征中选择和提取对分类识别最有效的特征来构建特征空间,例如选择特定波长或波段上的光谱流量值等作为特征,并运用算法对各种天体进行区分。目前常用的光谱分类模型可以分为基于距离计算的天文光谱分类与基于神经网络的天文光谱数据分类。

关于基于距离计算的天文光谱数据分类,美国学者Gray利用含有标准光谱模板的知识库,基于距离差值实现分类。赵永恒教授和罗阿理教授团队通过从光谱数据中提取特定波长的关键数据实现分类任务。陈淑鑫等学者采用基于距离计算的模板匹配完成天文光谱数据分类。但是,上述方法的计算复杂度一般都是数据量和数据维度的平方,不适合海量高维数据的分类。以来自LAMOST的光谱数据为例,目前已经有超过1000万条的光谱数据,很多光谱的数据维度都在数千以上,面对这样高维的天文大数据,传统的人工或半人工的数据分类越来越困难。

关于基于神经网络的天文光谱数据分类,有基于使用全连接网络和自组织映射方法进行天文光谱分类。Wang等学者通过伪逆学习逐层训练的方法,构建了神经网络分类模型。Fabbro和Zou等学者构建了深度神经网络,通过卷积的方法来进行分类。上述方法可以对部分光谱进行较好地分类,但是基于神经网络的分类方法需要大量的训练数据,而这常常不能得到满足。例如,LAMOST第4版数据集中,识别的碳星还不到3000。

在天体实际分布中,各类天体种类不是均衡的,其特征差异也很大,目前大多数研究或者单独挖掘稀有光谱数据或者直接对全体数据集进行分类,导致数据识别的效率和精度并不能让人满意。

发明内容

为了解决现有技术存在的问题,本发明提供一种恒星光谱数据增强方法,能够为了克服现有的深度神经网络过于依赖充足的训练数据的不足,生成模拟的缺失数据,补全不完整的数据分布。

本发明所要解决的技术问题是通过以下技术方案实现的:

第一方面,提供了一种恒星光谱数据增强方法,包括:

对恒星光谱进行预处理,对处理后的光谱数据按照类别设置标签;

构建条件生成对抗网络模型并采用设置标签的的光谱数据对网络模型进行训练;

基于训练好的条件生成对抗网络模型进行数据增强。

结合第一方面,进一步的,所述对恒星光谱进行预处理包括:

对于光谱样本集中D中的每个每个恒星光谱样本Si,设置统一的维度m,在维度m处将Si截断得到使其每个维度都有值;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110813458.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top