全球首個(gè)地理科學(xué)大模型“坤元”發(fā)布 深度融合人工智能
中國(guó)網(wǎng)/中國(guó)發(fā)展門(mén)戶網(wǎng)訊 (記者 王振紅)9月19日,中國(guó)科學(xué)院地理科學(xué)與資源研究所在北京召開(kāi)新聞發(fā)布會(huì),正式發(fā)布該單位聯(lián)合中國(guó)科學(xué)院青藏高原研究所、中國(guó)科學(xué)院自動(dòng)化研究所等單位研發(fā)的多模態(tài)地理科學(xué)大模型“坤元”(Sigma Geography)。
全球首個(gè)多模態(tài)地理科學(xué)大模型“坤元”發(fā)布,圖為發(fā)布現(xiàn)場(chǎng)。
據(jù)中國(guó)科學(xué)院地理科學(xué)與資源研究所副所長(zhǎng)、研究員蘇奮振介紹,該大模型是專注于地理科學(xué)的專業(yè)語(yǔ)言大模型,具備處理地理科學(xué)相關(guān)問(wèn)題的專業(yè)能力,研發(fā)團(tuán)隊(duì)完成了地理學(xué)全譜系高質(zhì)量語(yǔ)料庫(kù)構(gòu)建、地理科學(xué)語(yǔ)言大模型構(gòu)建、地理科學(xué)研究智導(dǎo)平臺(tái)研發(fā)等工作,“讓‘坤元’具備‘懂地理’‘精配圖’‘知人心’‘智生圖’等特點(diǎn),實(shí)現(xiàn)了地理專業(yè)問(wèn)題解答、地理學(xué)文獻(xiàn)智能分析、地理數(shù)據(jù)資源查詢、地理數(shù)據(jù)挖掘分析、專題地圖繪制等功能。”
研發(fā)團(tuán)隊(duì)建立了涵蓋4大類、16小類的地理全學(xué)科語(yǔ)料庫(kù),提供320億詞元供大模型自監(jiān)督學(xué)習(xí),并制作了4萬(wàn)余條高質(zhì)量地理學(xué)指令進(jìn)行模型微調(diào)。“相比通用語(yǔ)言大模型,‘坤元’更熟悉地理學(xué)的語(yǔ)言模式、專業(yè)術(shù)語(yǔ)和領(lǐng)域知識(shí),在地理學(xué)基準(zhǔn)測(cè)試集上的準(zhǔn)確性提升了31.3%。”蘇奮振介紹說(shuō)。
團(tuán)隊(duì)自主研發(fā)了面向多層次地圖信息的多模態(tài)檢索技術(shù)、支持地理認(rèn)知與圖形表達(dá)的知識(shí)推理技術(shù)。蘇奮振表示,這些技術(shù)使得“坤元”能夠在解答地理學(xué)提問(wèn)的同時(shí),可以根據(jù)生成的文字答案檢索不同地理要素,并匹配地理景觀照片、專題地圖或示意圖表呈現(xiàn)給提問(wèn)者。
據(jù)了解,團(tuán)隊(duì)創(chuàng)新提出了基于“認(rèn)知啟航-應(yīng)用智導(dǎo)-前沿研析”框架的用戶畫(huà)像精準(zhǔn)判別與響應(yīng)技術(shù),保證“坤元”能夠充分考慮地理知識(shí)愛(ài)好者、地理學(xué)專業(yè)學(xué)生以及科研人員的地理科學(xué)知識(shí)體系認(rèn)知和表達(dá)差異,以圖文共現(xiàn)的方式給出適配用戶知識(shí)結(jié)構(gòu)的地理學(xué)專業(yè)問(wèn)題解答。
團(tuán)隊(duì)基于“坤元”開(kāi)發(fā)的科研助手,可以根據(jù)用戶指令完成概念理解、數(shù)據(jù)獲取、信息分析、制圖綜合等流程,最終生成用戶需要的專業(yè)地理圖表。
“坤元”旨在拓寬普通大眾的地理視野,解放地理從業(yè)者的雙手,推動(dòng)地理智能發(fā)展,賦能地理科學(xué)研究、加速重大地理科學(xué)發(fā)現(xiàn)。
北京大學(xué)教授劉瑜點(diǎn)評(píng)認(rèn)為,“‘坤元’在地理學(xué)術(shù)論文發(fā)表上已經(jīng)展現(xiàn)出極大的應(yīng)用潛力,未來(lái)通過(guò)地圖大模型與地理推理機(jī)的研發(fā),預(yù)計(jì)能夠進(jìn)一步提升地理信息處理的智能化水平,為地理科研協(xié)作提供全新的范式。”
中國(guó)測(cè)繪科學(xué)研究院副院長(zhǎng)、研究員劉紀(jì)平點(diǎn)評(píng)認(rèn)為,“‘坤元’體現(xiàn)了我國(guó)地理信息領(lǐng)域的前沿創(chuàng)新能力。其研發(fā)成果不僅在學(xué)術(shù)上具有重要意義,還為地理科學(xué)與測(cè)繪領(lǐng)域的智能化發(fā)展提供了強(qiáng)有力的技術(shù)支撐。這一成果的廣泛應(yīng)用,將極大推動(dòng)測(cè)繪行業(yè)的進(jìn)步,為我國(guó)地理科學(xué)的全球競(jìng)爭(zhēng)力提升做出重要貢獻(xiàn)。”
蘇奮振表示,未來(lái),研發(fā)團(tuán)隊(duì)將推進(jìn)地圖大模型及地理推理機(jī)研發(fā),有望讓地理科學(xué)語(yǔ)言大模型讀懂地圖;將打造地理科研協(xié)作大平臺(tái),以期讓每個(gè)科學(xué)家和科研團(tuán)隊(duì)都可以擁有專屬的地理大模型,能夠與數(shù)百萬(wàn)科學(xué)家通過(guò)共享數(shù)據(jù)、模型、研究思路等方式協(xié)同工作。