發表於2024-11-13
隨著LAMOST正式巡天的實施,已成功獲取600萬條天體光譜以及星錶,並每天以海量的數字增長著,對長期傳統的人工分析、人眼證認等任務帶來瞭巨大挑戰。本書以河外星係和恒星光譜為研究背景,針對天文學研究中稀有天體的特徵分析以及天體光譜的分類等任務,將新興的數據挖掘技術應用到天體光譜規律的發現和研究中,並從天文物理學角度對挖掘結果進一步分析。主要包括稀有、離群天體光譜的搜尋與分析、天體光譜分類方法與分析兩個方麵的內容。
楊海峰,博士,太原科技大學計算機學院副教授,研究方嚮:人工智能與數據挖掘、河外星係光譜分析。近年來主持和參與***、省部級科研項目多項,發錶學術論文近30多篇,其中SCI收錄18篇。
第1 章 緒論?????????????????????????????????????????????????????????????????????????????????????? 1
1.1 天體光譜?????????????????????????????????????????????????????????????????????????????? 1
1.1.1 LAMOST 光譜巡天?????????????????????????????????????????????????????????? 2
1.1.2 SDSS 光譜巡天???????????????????????????????????????????????????????????????? 5
1.1.3 光譜分析???????????????????????????????????????????????????????????????????????? 6
1.2 數據挖掘?????????????????????????????????????????????????????????????????????????????? 7
1.2.1 産生和定義????????????????????????????????????????????????????????????????????? 7
1.2.2 數據挖掘任務與分類?????????????????????????????????????????????????????? 10
1.2.3 主要應用?????????????????????????????????????????????????????????????????????? 12
1.3 海量天體光譜數據挖掘?????????????????????????????????????????????????????? 14
1.3.1 分類???????????????????????????????????????????????????????????????????????????? 14
1.3.2 聚類及離群分析???????????????????????????????????????????????????????????? 17
1.3.3 關聯規則?????????????????????????????????????????????????????????????????????? 19
1.3.4 恒星大氣參數測量????????????????????????????????????????????????????????? 20
1第2 章 基於模糊識彆的雙紅移係統星係光譜搜尋與分析?????????????? 24
2.1 引言???????????????????????????????????????????????????????????????????????????????????? 25
2.2 基於模糊識彆的搜尋方法?????????????????????????????????????????????????? 27
2.2.1 樣本選擇?????????????????????????????????????????????????????????????????????? 27
2.2.2 方法描述?????????????????????????????????????????????????????????????????????? 28
2.3 結果分析???????????????????????????????????????????????????????????????????????????? 35
2.3.1 SDSS DR9 和LAMOST DR1 中SGPs 樣本????????????????????????? 35
2.3.2 光譜與圖像分析???????????????????????????????????????????????????????????? 39
2.3.3 塵埃消光測量???????????????????????????????????????????????????????????????? 48
2.4 討論???????????????????????????????????????????????????????????????????????????????????? 51
第3 章 稀有光譜檢索的PU 學習方法???????????????????????????????????????????? 53
3.1 問題提齣???????????????????????????????????????????????????????????????????????????? 54
3.2 二部排序模型????????????????????????????????????????????????????????????????????? 56
3.2.1 TopPush 方法???????????????????????????????????????????????????????????????? 57
3.2.2 麵嚮稀有光譜檢索的BaggingTopPush 方法???????????????????????? 58
3.3 實驗設計???????????????????????????????????????????????????????????????????????????? 59
3.3.1 樣本選擇?????????????????????????????????????????????????????????????????????? 60
3.3.2 實驗設置?????????????????????????????????????????????????????????????????????? 61
3.3.3 評價指標?????????????????????????????????????????????????????????????????????? 64
3.4 結果分析???????????????????????????????????????????????????????????????????????????? 65
3.4.1 排序效果?????????????????????????????????????????????????????????????????????? 65
3.4.2 排序效率?????????????????????????????????????????????????????????????????????? 72
3.4.3 參數敏感性??????????????????????????????????????????????????????????????????? 74
3.5 討論???????????????????????????????????????????????????????????????????????????????????? 76
第4 章 E+A 星係搜尋與分析?????????????????????????????????????????????????????????? 78
4.1 問題提齣???????????????????????????????????????????????????????????????????????????? 78
4.2 E+A 星係光譜搜尋方法?????????????????????????????????????????????????????? 80
4.2.1 樣本選擇―LAMOST 數據集????????????????????????????????????????? 80
4.2.2 搜尋方法?????????????????????????????????????????????????????????????????????? 80
4.2.3 近鄰E+A 星係星錶???????????????????????????????????????????????????????? 83
4.3 結果分析???????????????????????????????????????????????????????????????????????????? 87
4.3.1 樣本分布特徵???????????????????????????????????????????????????????????????? 87
4.3.2 星族閤成分析???????????????????????????????????????????????????????????????? 90
4.3.3 圖像分析?????????????????????????????????????????????????????????????????????? 92
4.4 討論???????????????????????????????????????????????????????????????????????????????????? 95
第5 章 基於貝葉斯支持嚮量機的光譜分類方法????????????????????????????? 98
5.1 問題提齣???????????????????????????????????????????????????????????????????????????? 98
5.2 基於貝葉斯支持嚮量機的分類方法?????????????????????????????????? 100
5.2.1 支持嚮量機????????????????????????????????????????????????????????????????? 100
5.2.2 貝葉斯推理????????????????????????????????????????????????????????????????? 101
5.2.3 馬爾可夫鏈濛特卡羅???????????????????????????????????????????????????? 101
5.2.4 貝葉斯支持嚮量機??????????????????????????????????????????????????????? 102
5.3 實驗分析?????????????????????????????????????????????????????????????????????????? 107
5.3.1 樣本選擇???????????????????????????????????????????????????????????????????? 107
5.3.2 預處理方法????????????????????????????????????????????????????????????????? 108
5.3.3 實驗參數設置?????????????????????????????????????????????????????????????? 112
5.3.4 結果分析???????????????????????????????????????????????????????????????????? 113
5.4 討論?????????????????????????????????????????????????????????????????????????????????? 116
第6 章 基於分類模式樹的恒星光譜自動分類方法??????????????????????? 117
6.1 問題提齣?????????????????????????????????????????????????????????????????????????? 118
6.2 恒星光譜分類模式樹???????????????????????????????????????????????????????? 119
6.3 分類模式樹構造方法???????????????????????????????????????????????????????? 120
6.3.1 算法思想???????????????????????????????????????????????????????????????????? 120
6.3.2 算法描述???????????????????????????????????????????????????????????????????? 121
6.3.3 算法分析???????????????????????????????????????????????????????????????????? 122
6.4 分類規則提取及恒星光譜分類????????????????????????????????????????? 122
6.5 實驗分析?????????????????????????????????????????????????????????????????????????? 123
6.6 討論?????????????????????????????????????????????????????????????????????????????????? 127
第7 章 恒星光譜分類規則後處理方法????????????????????????????????????????? 129
7.1 問題提齣?????????????????????????????????????????????????????????????????????????? 129
7.2 基於謂詞邏輯的分類規則後處理方法?????????????????????????????? 131
7.2.1 恒星光譜分類規則??????????????????????????????????????????????????????? 131
7.2.2 恒星光譜分類規則後處理?????????????????????????????????????????????? 132
7.2.3 實驗分析???????????????????????????????????????????????????????????????????? 136
7.3 基於集閤運算的分類規則後處理方法?????????????????????????????? 138
7.3.1 分類規則問題描述??????????????????????????????????????????????????????? 138
7.3.2 分類規則後處理算法???????????????????????????????????????????????????? 140
7.3.3 實驗分析???????????????????????????????????????????????????????????????????? 142
7.4 討論?????????????????????????????????????????????????????????????????????????????????? 143
參考文獻?????????????????????????????????????????????????????????????????????????????????????????? 144
附錄A SDSS DR9 和LAMOST DR1 的SGPs 樣本清單???????????? 149
附錄B LAMOST DR2 的E+A 樣本清單??????????????????????????????????????? 159
附錄C LAMOST DR2 的E+A 樣本測光信息清單???????????????????????? 163
前 言
仰望璀璨的星空,遼闊而深邃,自由而寜靜,吸引著人們苦苦追尋與不斷探索的嚮往。LAMOST 是一架橫臥南北方嚮的中星儀式反射施密特望遠鏡,在5 度視場、直徑為1.75 米的焦麵上放置4000 根光縴,可以同時獲得4000 個天體的光譜,是當前世界上光譜獲取率最高的望遠鏡。隨著LAMOST 正式巡天的實施,已成功獲取600 萬條天體光譜以及星錶,並每天以海量的數字增長著,對長期傳統的人工分析、人眼證認等任務帶來瞭巨大挑戰。而數據挖掘,作為一門新興的學科分支,涉及人工智能、機器學習、模式識彆等多個學科領域,主要任務是從大量的原始數據中提取潛在的、人們感興趣的知識,已被廣泛地應用於科學、工程、商業等領域。將數據挖掘技術應用於海量的天體光譜數據中,獲取潛在的、有意義的天體規律及性質,對更有效地使用巡天數據、進一步深入天文學理論研究都具有比較重要的應用價值。
近年來作者一直從事數據挖掘應用與天體光譜分析交叉領域的研究,在深入瞭解光譜分析任務、分析當前數據急劇增長特點的基礎上,結閤計算機技術優勢,開展瞭一係列的研究工作,本書是近年來相關科研成果的總結。全書除緒論主要介紹天體光譜數據的主要特徵以及數據挖掘技術的基本理論外,主要內容分兩大部分共6 章,具體章節編排如下:
(一)特殊、稀有天體的挖掘及分析(包括第2 章至第4 章)。第2 章針對星係光譜中呈現的雙紅移係統,提齣一種基於模糊識彆的光譜特徵綫識彆方法,並采用SDSS DR9 和LAMOST DR2 的星係光譜數據,係統地搜尋瞭具有雙紅移係統的星係光譜並對其結果進行瞭光譜及圖像分類、特例分析、前景星係消光測量等方麵的討論;第3 章針對碳星光譜中存在的模闆較少從而導緻從海量數據中搜尋比較睏難的問題,提齣一種新的高效的PU 學習方法,並選擇SDSS DR10 中十萬餘條光譜實現驗證瞭該方法的搜尋質量和效率。第4 章針對LAMOST 河外星係光譜分辨率及信噪比等特徵,修正瞭[OII]、H?、H?特徵綫邊界,通過測量其等值寬度並按照經典(Goto.提齣)的判定依據,從LAMOST DR2 中係統搜尋瞭E+A 星係,並對其結果進行瞭紅移分布、空間分布、星等分布特徵、圖像特徵以及星族特徵等方麵的討論。
(二)光譜分類及後處理方法研究(包括第5 章至第7 章)。第5章針對巡天數據分析中最基本的光譜型分類問題,提齣一種基於貝葉斯支持微量機的光譜自動分類方法,選擇SDSS DR10 的M 型恒星光譜,實驗驗證瞭該方法在光譜子型的分類上具有較高的準確率及效率,同時對預處理過程中噪聲、歸一化方法、特徵提取方法對分類結果的影響進行瞭討論;第6 章針對恒星光譜分類任務,提齣一種基於分類模式樹的恒星光譜分類規則挖掘方法。采用SDSS 恒星光譜作為實驗數據,驗證瞭該方法的正確性,而且具有較高的分類正確率;第7 章針對采用數據挖掘方法提取的光譜分類規則中存在的冗餘嚴重影響分類效率和質量的問題,提齣基於謂詞邏輯、集閤運算的兩種分類規則後處理方法,從而減小分類器的大小。采用SDSS 恒星光譜數據,實驗驗證瞭這兩種方法在不降低分類準確率的前提下,可以有效提高分類效率。)特殊、稀有天體的挖掘及分析(包括第2 章至第4 章)。本書的完成得到瞭太原科技大學人工智能實驗 天體光譜數據挖掘與分析 下載 mobi epub pdf txt 電子書 格式
天體光譜數據挖掘與分析 下載 mobi pdf epub txt 電子書 格式 2024
天體光譜數據挖掘與分析 下載 mobi epub pdf 電子書天體光譜數據挖掘與分析 mobi epub pdf txt 電子書 格式下載 2024