基于深度残差网络的恒星光谱类别预测 | |
其他题名 | Prediction of Stellar Spectrum Categories Based on Deep Residual Network |
王天翔1,2; 范玉峰1![]() ![]() ![]() ![]() | |
发表期刊 | 光谱学与光谱分析(Spectroscopy and Spectral Analysis)
![]() |
2021-05 | |
卷号 | 41期号:5页码:1602-1606 |
DOI | 0.3964/j.issn.1000-0593(2021)05-1602-05 |
分类号 | P152 |
产权排序 | 第1完成单位 |
收录类别 | SCI ; EI ; CSCD ; 核心 |
关键词 | 恒星光谱 光谱次型预测 深度学习 回归 特征映射 |
摘要 | 近年来,随着各大光谱巡天项目的陆续实施,观测得到的天体光谱数据急剧增长。大型光谱巡天项目对光谱的自动分类和分析提出了更高的要求。本文将分类问题转化为回归问题,提出一种基于深度残差网络的光谱类别预测方法,对恒星光谱进行光谱次型预测。网络主要包括25个卷积层,1个最大池化层,1个平均池化层,全连接层以及12个残差结构。最大池化层用来筛选特征,卷积层提取特征,平均池化层用于减少模型参数,提高效率。残差结构可以防止网络退化,加深网络来提取高维抽象特征以及提高训练速度。考虑到数据有非零几率存在错误标签以及损坏数据,采用Log-Cosh作为损失函数来降低坏样本带来的负面影响。实验数据使用的是从LAMOST DR5中随机抽取的80 000条光谱,由于光谱质量等原因,每个光谱型的光谱数量不一。经过剔除坏值,流量归一化后,按7∶1∶2分为训练集、验证集和测试集。实验包括两个部分,第一个部分是使用数据集训练网络在光谱次型上进行类别预测,使用最大绝对误差、平均绝对误差以及标准差来比较不同形状卷积核的性能。将预测值作为横坐标,标签作为纵坐标,对测试集所有样本点使用二阶非线性拟合,得到了一条与y=x重合的直线。证明模型可以很好的预测光谱次型。第二部分是对模型进行内部分析,使用类别激活映射的方法分别研究了模型预测A,F,G和K四种类型光谱时所关注的主要特征,赋予了模型可解释性。在文中数据集上,该方法对91.4%的光谱预测误差在0.5个光谱次型以内,预测的平均绝对误差为0.3个光谱次型。并与非参数回归、Adaboost回归树、K-Means三种方法进行同数据集比较,结果表明文中提出的方法可以很好地预测光谱次型并且速度更快,准确率更高。 |
其他摘要 | In recent years, the spectral data of celestial bodies observed have archived a dramatic increase thanks to the suceessful implementation of various projects of spectral sky survey. Therefore, higher requirements for the automatic classification and analysis of spectrum are proposed for large-scale projects of spectral sky survey. The classification problem is transformed into a regression one in this paper, and a method of spectral category regression based on the residual depth network is put forward to conduct a prediction of MK spectral subtype on stellar spectrum. The network is mainly composed of 25 convolution layers, 1 maximum pooling layer, 1 average pooling layer, full connection layer and 12 residual structures. The maximum pooling layer is efficiency. The residual structure can prevent the degradation of the network, extract high-dimensional abstract features by deepening the network and improve training speed. Considering the non-zero probability of data with false labels and corrupted data, Log-Cosh is adopted as a loss function in this paper to reduce the negativ impact of bad samples. 80000 spectra that are randomly selected from LAMOST DR5 are used as the experimental data. The spectra are divided into the training set, verification set and test set according to the proportion of 7:1:2 after eliminating the bad value and normalizing the flow. The experiment includes two parts. In the first part, the network is adopted to carry out a prediction on the spectral subtype, and the maximum abasolute error, the average absolute error and the standard deviation are used to compare the performance of convolution kernels with different shapes. The predicted value is taken as the abscissa and the label as the ordinate, and the second-order nonlinear fitting is used for all sample points in the test set, a straight line that is coincident with y==x is obtained., poving that the model can predict the spectral subtype well. The second part is concerning the internal analysis of the model. The main characteristics of the odel in predicting four types of spectra, A, F, G, K, are mainly explored with the method of category activation mapping, thus endowing the model with interpretability. In the text data set, 91.4% of the spectral prediction errors of this method are within 0.5 soectrak subtypes, and the average absolute error of the prediction is 0.3 spectral subtypes. It is shown that the method proposed in this paper can better predict spectral subtypes with faster speed and higher accuracy according to the comparison of the same data set with nonparametric regression, Adaboost regression tree and K-means. |
资助项目 | 国家自然科学基金项目[111773074] ; 国家自然科学基金项目[11603072] ; 云南省科技厅科技入滇项目[202003AD150003] |
项目资助者 | 国家自然科学基金项目[11603072, 11773074] ; 云南省科技厅科技入滇项目[202003AD150003] |
语种 | 中文 |
学科领域 | 天文学 ; 恒星与银河系 ; 恒星与银河系其他学科 ; 计算机科学技术 ; 计算机应用 |
ISSN | 1000-0593 |
WOS记录号 | WOS:000658891700043 |
WOS研究方向 | Spectroscopy |
WOS类目 | Spectroscopy |
CSCD记录号 | CSCD:6966040 |
EI入藏号 | 20212010355639 |
EI主题词 | Forecasting |
EI分类号 | 657.2 Extraterrestrial Physics and Stellar Phenomena - 716.1 Information Theory and Signal Processing - 723 Computer Software, Data Handling and Applications - 921.4 Combinatorial Mathematics, Includes Graph Theory, Set Theory |
引用统计 | |
文献类型 | 期刊论文 |
条目标识符 | http://ir.ynao.ac.cn/handle/114a53/24277 |
专题 | 南方基地 |
通讯作者 | 范玉峰 |
作者单位 | 1.中国科学院云南天文台, 云南, 昆明, 650011 2.中国科学院大学, 北京, 100049 |
第一作者单位 | 中国科学院云南天文台 |
通讯作者单位 | 中国科学院云南天文台 |
推荐引用方式 GB/T 7714 | 王天翔,范玉峰,王晓丽,等. 基于深度残差网络的恒星光谱类别预测[J]. 光谱学与光谱分析(Spectroscopy and Spectral Analysis),2021,41(5):1602-1606. |
APA | 王天翔,范玉峰,王晓丽,龙潜,&王传军.(2021).基于深度残差网络的恒星光谱类别预测.光谱学与光谱分析(Spectroscopy and Spectral Analysis),41(5),1602-1606. |
MLA | 王天翔,et al."基于深度残差网络的恒星光谱类别预测".光谱学与光谱分析(Spectroscopy and Spectral Analysis) 41.5(2021):1602-1606. |
条目包含的文件 | ||||||
文件名称/大小 | 文献类型 | 版本类型 | 开放类型 | 使用许可 | ||
基于深度残差网络的恒星光谱类别预测_王天(2235KB) | 期刊论文 | 出版稿 | 开放获取 | CC BY-NC-SA | 浏览 请求全文 |
个性服务 |
推荐该条目 |
保存到收藏夹 |
查看访问统计 |
导出为Endnote文件 |
谷歌学术 |
谷歌学术中相似的文章 |
[王天翔]的文章 |
[范玉峰]的文章 |
[王晓丽]的文章 |
百度学术 |
百度学术中相似的文章 |
[王天翔]的文章 |
[范玉峰]的文章 |
[王晓丽]的文章 |
必应学术 |
必应学术中相似的文章 |
[王天翔]的文章 |
[范玉峰]的文章 |
[王晓丽]的文章 |
相关权益政策 |
暂无数据 |
收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论