|
數(shù)據(jù)管理與保存得到重視
重大項目計劃產(chǎn)生的海量科學(xué)數(shù)據(jù)作為國家資源和人類知識庫,應(yīng)進行長期保存和管理,讓科學(xué)家在未來很長一段時間內(nèi)可以深入挖掘數(shù)據(jù)背后的知識。國內(nèi)外紛紛建立空間科學(xué)領(lǐng)域的數(shù)據(jù)中心/系統(tǒng),實施數(shù)據(jù)的長期保存和質(zhì)量管控。
美國國家航空航天局(NASA)建立了國家空間科學(xué)數(shù)據(jù)中心(National Space Science Data Center,NSSDC)用以保障空間科學(xué)衛(wèi)星任務(wù)(含空間天文、天文物理、太陽和空間等離子體物理、行星科學(xué)、月球科學(xué)和空間物理)檔案數(shù)據(jù)永久安全和長期可用,并為世界范圍的科學(xué)家提供公開數(shù)據(jù)服務(wù)。截至?2015?年?12?月,僅其所屬的行星數(shù)據(jù)系統(tǒng)(Planetary Data System,PDS)存儲和管理的火星、月球、金星、水星各等級軌道探測數(shù)據(jù)已超過?947?TB。
歐洲空間天文中心(European Space Astronomy Centre,ESAC)作為歐空局(European Space Agency,ESA)空間科學(xué)數(shù)據(jù)中心,也對所有歐洲空間天文、太陽系探測、行星科學(xué)、基礎(chǔ)物理等衛(wèi)星任務(wù)產(chǎn)生的科學(xué)檔案數(shù)據(jù)進行了集中管理和存儲。
在空間科學(xué)先導(dǎo)專項支持下,我國也建設(shè)了集科學(xué)衛(wèi)星數(shù)據(jù)匯集與分發(fā),數(shù)據(jù)全生命周期質(zhì)量控制,數(shù)據(jù)存儲、管理與歸檔為一體的空間科學(xué)先導(dǎo)數(shù)據(jù)管理系統(tǒng)(空間科學(xué)數(shù)據(jù)中心),有效支撐了“悟空”“SJ-10”“墨子”和“慧眼”衛(wèi)星任務(wù)的實施,促進了衛(wèi)星成果產(chǎn)出,可保障數(shù)據(jù)的永久安全。
研究范式發(fā)生轉(zhuǎn)變
科學(xué)大數(shù)據(jù)時代的典型特征是研究范式的轉(zhuǎn)變,與傳統(tǒng)基于少量數(shù)據(jù)樣本開展理論分析的科研模式不同,大數(shù)據(jù)時代下的科研人員主要通過對多源、多要素、全樣本空間的大數(shù)據(jù)進行分析,通常結(jié)合神經(jīng)網(wǎng)絡(luò)、機器學(xué)習(xí)等大數(shù)據(jù)技術(shù),挖掘科學(xué)大數(shù)據(jù)中蘊藏的科學(xué)知識。空間科學(xué)領(lǐng)域研究模式也正向數(shù)據(jù)密集型科學(xué)發(fā)現(xiàn)模式轉(zhuǎn)變。
作為數(shù)據(jù)驅(qū)動知識發(fā)現(xiàn)的典范,暗物質(zhì)粒子探測衛(wèi)星——“悟空”的科學(xué)家團隊通過對衛(wèi)星?530?天采集的?28?億份高能宇宙射線數(shù)據(jù)樣本分析,首次找到了電子宇宙線能譜在?~1?TeV?處的拐點(異常波動),而這個拐點反映著高能電子輻射源的典型加速能力,拐點下降行為對解釋電子宇宙線是否來自暗物質(zhì)起著關(guān)鍵作用。
針對開普勒太空望遠鏡(Kepler space telescope)獲取的海量數(shù)據(jù),NASA?科學(xué)家利用深度學(xué)習(xí)算法構(gòu)建的機器學(xué)習(xí)模型具備對低信噪比數(shù)據(jù)進行自動系外行星識別能力,模型對開普勒太空望遠鏡數(shù)據(jù)庫?20?萬個目標(biāo)星系數(shù)據(jù)進行自動搜尋,成功從中找到了Kepler-80?g?和?Kepler-90?i?兩顆系外行星。
早在?20?世紀?90?年代,空間物理學(xué)研究中便開始采用機器學(xué)習(xí)等大數(shù)據(jù)技術(shù)對衛(wèi)星獲取的數(shù)據(jù)進行分析,開展空間天氣研究和預(yù)報。諸如磁層亞暴觸發(fā)識別,太陽活動(日冕物質(zhì)拋射、耀斑)預(yù)測和行星際激波預(yù)報等。其中太陽耀斑預(yù)測更是使用?SDO?衛(wèi)星?4?年,超過?5.5?TB?的太陽光球?qū)印⑸驅(qū)拥葓D像大數(shù)據(jù)作為模型的訓(xùn)練輸入。事實證明,大數(shù)據(jù)分析技術(shù)對非線性空間天氣過程研究和高度復(fù)雜度空間天氣事件預(yù)報具有重要實踐意義,數(shù)據(jù)密集型的研究模式正逐漸發(fā)展成空間物理學(xué)的主流模式。