亚洲成AV人的天堂在线观看,久久av免费精品首页,av这里只有精品大帝,免费国产一级av片

分享到:
鏈接已復(fù)制

LANGUAGES

新聞

新聞直播 要聞 國(guó)際 軍事 政協(xié) 政務(wù) 圖片 視頻

財(cái)經(jīng)

財(cái)經(jīng) 金融 證券 汽車 科技 消費(fèi) 能源 地產(chǎn) 農(nóng)業(yè)

觀點(diǎn)

觀點(diǎn) 理論 智庫(kù) 中國(guó)3分鐘 中國(guó)訪談 中國(guó)網(wǎng)評(píng) 中國(guó)關(guān)鍵詞

文化

文化 文創(chuàng) 藝術(shù) 時(shí)尚 旅游 鐵路 悅讀 民藏 中醫(yī) 中國(guó)瓷

國(guó)情

國(guó)情 助殘 一帶一路 海洋 草原 黃河 運(yùn)河 灣區(qū) 聯(lián)盟 心理 老年

首頁(yè)> 中國(guó)發(fā)展門(mén)戶網(wǎng)> 本網(wǎng)獨(dú)家>

人工智能驅(qū)動(dòng)的科學(xué)研究新范式:從?AI4S到智能科學(xué)

2023-05-11 15:21

來(lái)源:中國(guó)網(wǎng)·中國(guó)發(fā)展門(mén)戶網(wǎng)

分享到:
鏈接已復(fù)制
字體:

中國(guó)網(wǎng)/中國(guó)發(fā)展門(mén)戶網(wǎng)訊 在全球迎來(lái)前所未有之大變局的時(shí)代背景之下, ChatGPT在2022年底一經(jīng)推出便掀起新一輪人工智能(AI)浪潮。以?ChatGPT?為代表的大模型技術(shù)影響空前深遠(yuǎn),正推動(dòng)?AI技術(shù)從特定應(yīng)用和游戲等領(lǐng)域進(jìn)入人們?nèi)粘I睿蔀榍星袑?shí)實(shí)的生產(chǎn)力工具,人類社會(huì)的智能化革命已經(jīng)拉開(kāi)帷幕。

圖靈獎(jiǎng)得主?Jim Gary?認(rèn)為科學(xué)研究經(jīng)歷了經(jīng)驗(yàn)范式、理論范式、計(jì)算范式、數(shù)據(jù)驅(qū)動(dòng)范式等?4種范式。當(dāng)前,許多科學(xué)家認(rèn)為科學(xué)研究正在迎來(lái)新的范式,即第五范式。第五范式以虛實(shí)交互、平行驅(qū)動(dòng)的?AI技術(shù)為核心,以智聯(lián)網(wǎng)和區(qū)塊鏈構(gòu)建基礎(chǔ),考慮人的價(jià)值和知識(shí)的融入。在產(chǎn)業(yè)方面,第五范式也稱為工業(yè)?5.0。而?AI?驅(qū)動(dòng)的科學(xué)研究(AI for Science,AI4S),更是新范式在基礎(chǔ)科研的深度體現(xiàn)。

近期,科學(xué)技術(shù)部會(huì)同國(guó)家自然科學(xué)基金委員會(huì)啟動(dòng)“人工智能驅(qū)動(dòng)的科學(xué)研究”(AI for Science)專項(xiàng)部署。本文通過(guò)概述?AI4S?發(fā)展現(xiàn)狀、分析典型?AI?應(yīng)用范例,進(jìn)一步探討?AI4S范式創(chuàng)新之路。

AI4S發(fā)展現(xiàn)狀簡(jiǎn)述 

近幾年來(lái),在深度學(xué)習(xí)等?AI?技術(shù)的推動(dòng)下,AI4S?在數(shù)學(xué)、物理學(xué)、生物醫(yī)學(xué)、材料科學(xué)等領(lǐng)域取得了許多令人矚目的成績(jī)。

數(shù)學(xué)領(lǐng)域。2017?年以來(lái),科學(xué)家嘗試使用機(jī)器學(xué)習(xí)、ResNet、seq2seq?模型等技術(shù)求解偏微分方程,獲得了更快更準(zhǔn)的結(jié)果。2021?年,DeepMind開(kāi)發(fā)了啟發(fā)數(shù)學(xué)家直覺(jué)靈感的機(jī)器學(xué)習(xí)框架,幫助數(shù)學(xué)家和?AI?研究人員在?Knots?理論方面發(fā)現(xiàn)新定理,證明了已提出?40?年之久的?Kazhdan-Lusztig?多項(xiàng)式。2022?年?10?月,同樣是?DeepMind?在?Nature?發(fā)文,推出在?AlphaZero(前身是著名的?AlphaGo)基礎(chǔ)上開(kāi)發(fā)的AlphaTensor,并通過(guò)強(qiáng)化學(xué)習(xí)找到了矩陣相乘的最快算法。DeepMind?的系列工作,為?AI?驅(qū)動(dòng)的數(shù)學(xué)研究(AI for Math)提供了可供參考的新范式。

物理領(lǐng)域。AI?方法除了用于實(shí)驗(yàn)數(shù)據(jù)處理和分析之外,還幫助科學(xué)家設(shè)計(jì)實(shí)驗(yàn)、優(yōu)化參數(shù)。20世紀(jì)?90?年代,高能與核物理學(xué)界就使用神經(jīng)網(wǎng)絡(luò)和符號(hào)?AI?輔助研究。2014?年,人工神經(jīng)網(wǎng)絡(luò)贏得了?ATLAS?實(shí)驗(yàn)中識(shí)別希格斯玻色子的挑戰(zhàn)。2015?年,歐洲核子研究組織?CERN?成立了機(jī)器學(xué)習(xí)工作組來(lái)處理大型強(qiáng)子對(duì)撞機(jī)(LHC)產(chǎn)生的海量數(shù)據(jù)。2022?年2?月,DeepMind?在?Nature?上發(fā)表了其工作:通過(guò)深度強(qiáng)化學(xué)習(xí)對(duì)托卡馬克等離子體進(jìn)行磁控。2022?年?8?月,物理學(xué)家使用人工神經(jīng)網(wǎng)絡(luò)找到了質(zhì)子中存在隱性內(nèi)含粲夸克(intrinsic charm quarks)的證據(jù),這一發(fā)現(xiàn)可能會(huì)改寫(xiě)量子色動(dòng)力學(xué)的教科書(shū)。 

生物醫(yī)學(xué)領(lǐng)域。AlphaFold?是?AI4S?領(lǐng)域最成功的代表。從?2016?年開(kāi)始,DeepMind?構(gòu)建?AI?系統(tǒng)來(lái)挑戰(zhàn)蛋白質(zhì)三維結(jié)構(gòu)預(yù)測(cè)任務(wù)。AlphaFold?將預(yù)測(cè)誤差縮小到原子尺度,而計(jì)算時(shí)間從數(shù)年縮減到數(shù)分鐘,顯著提升了效率。DeepMind?宣布其?2?億個(gè)蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)向世界各地的科學(xué)家提供開(kāi)放訪問(wèn),這對(duì)加速藥物研究具有重大意義。除?AlphaFold?外,華盛頓大學(xué)開(kāi)發(fā)的?RoseTTAFold、中國(guó)科學(xué)技術(shù)大學(xué)研發(fā)的?SCUBA等模型,也在該領(lǐng)域不斷突破。

材料科學(xué)領(lǐng)域。2011?年,美國(guó)提出“材料基因組計(jì)劃”(MGI),旨在解碼材料的不同組成成分和性能的對(duì)應(yīng)關(guān)系,借助高通量計(jì)算、大數(shù)據(jù)、AI等技術(shù),有效縮短了材料研發(fā)周期、降低了研發(fā)成本。2016?年?Nature?發(fā)布了美國(guó)哈弗福德學(xué)院和普渡大學(xué)的研究成果,科研人員利用機(jī)器學(xué)習(xí)算法,用“失敗”的實(shí)驗(yàn)數(shù)據(jù)預(yù)測(cè)了新材料合成,這啟示機(jī)器學(xué)習(xí)等?AI?技術(shù)成為材料科學(xué)的重要研究方式。

正如我們所見(jiàn),AI?在科學(xué)研究中的角色隨著深度學(xué)習(xí)的繁榮而發(fā)生了變化。早期,AI?方法只是作為輔助工具,幫助分析實(shí)驗(yàn)數(shù)據(jù)。如今,AI?方法已成為更復(fù)雜任務(wù)(如定理證明、結(jié)構(gòu)設(shè)計(jì)和知識(shí)發(fā)現(xiàn))實(shí)現(xiàn)過(guò)程中的關(guān)鍵技術(shù)。AI?還在不斷拓展學(xué)科領(lǐng)域,“人工智能驅(qū)動(dòng)的科學(xué)研究”專項(xiàng)部署重點(diǎn)面向數(shù)學(xué)、物理學(xué)、化學(xué)、天文學(xué)等基礎(chǔ)學(xué)科,必將為這些學(xué)科快速發(fā)展帶來(lái)新契機(jī)。 

熱點(diǎn)背后的AI范式分析

在算法、數(shù)據(jù)、算力三大引擎的驅(qū)動(dòng)下,深度學(xué)習(xí)時(shí)代下的?AI?研究進(jìn)展迅速,AlphaGo、AlphaFold、ChatGPT?等成為?AI?發(fā)展歷史上一座座里程碑。分析這些案例特點(diǎn),總結(jié)成功經(jīng)驗(yàn),對(duì)于?AI?后續(xù)的創(chuàng)新和應(yīng)用具有十分重要的啟發(fā)意義。

AlphaFold?研究范式

DeepMind?推出的?AlphaFold?系列是?AI4S?的最成功的代表之一,尤其是第二代?AlphaFold2?在?2020?年全球蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)比賽(CASP14)中拔得頭籌,蛋白質(zhì)三維結(jié)構(gòu)預(yù)測(cè)準(zhǔn)確性接近實(shí)驗(yàn)結(jié)果。AlphaFold2?的目標(biāo)是根據(jù)輸入的一維氨基酸序列預(yù)測(cè)蛋白質(zhì)的三維結(jié)構(gòu),其成功可以歸因于領(lǐng)域知識(shí)與深度學(xué)習(xí)前沿技術(shù)的融合。

從深度學(xué)習(xí)的角度來(lái)看,AphaFold?2?有?3?個(gè)亮點(diǎn)。① AlphaFold?2?淘汰了第一代所采用的卷積神經(jīng)網(wǎng)絡(luò)(CNN)特征提取結(jié)構(gòu),替換為基于注意力機(jī)制的性能更強(qiáng)的Evoformer。② AlphaFold?2?不是簡(jiǎn)單的單向處理流程,而是采用了循環(huán)迭代優(yōu)化。③ AlphaFold?2?同時(shí)使用帶標(biāo)簽和未帶標(biāo)簽的數(shù)據(jù)進(jìn)行網(wǎng)絡(luò)訓(xùn)練,并融入含噪自蒸餾處理。整體來(lái)看,AlphaFold?2?是一個(gè)包含多種算法和學(xué)習(xí)策略的系統(tǒng)化方法。

從知識(shí)融合的角度來(lái)看,相對(duì)于神經(jīng)網(wǎng)絡(luò)模型層面的創(chuàng)新,多元知識(shí)的表示和融合在?AphaFold?2?中扮演著更為關(guān)鍵的角色。①蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)是一個(gè)專業(yè)方向,科學(xué)家通過(guò)數(shù)十年的研究積累了寶貴的知識(shí)和數(shù)據(jù)。ApphaFold?2?使用了?2?種類型的數(shù)據(jù)集:一種是序列數(shù)據(jù)集,如?UniRef?90、BFD、MGnify?等。基于“同一位置的氨基酸在物種間是不變的,2?個(gè)不同位置的氨基酸同步變化”這一領(lǐng)域知識(shí),AlphaFold?2?從遺傳序列數(shù)據(jù)庫(kù)中搜索并構(gòu)建多序列比對(duì)(MSAs),而?MSA?的質(zhì)量決定了 ApphaFold?2?的預(yù)測(cè)準(zhǔn)確性;另一種是結(jié)構(gòu)數(shù)據(jù)集,如?PDB?和?PDB70?等。ApphaFold?2?從這些結(jié)構(gòu)數(shù)據(jù)集中搜索并構(gòu)建殘基之間關(guān)系的配對(duì)(pair)表示。通過(guò)這種方式,一維氨基酸序列通過(guò)領(lǐng)域知識(shí)和數(shù)據(jù)集進(jìn)行擴(kuò)充,形成?2?個(gè)二維關(guān)系表示。② Evoformer?接收?MSA?和?Pair?表示,在行、列?2?個(gè)維度進(jìn)行注意力計(jì)算,完成?2?種表示的交叉融合。需要注意的是,在配對(duì)(pair)表示的注意力計(jì)算中引入了幾何知識(shí),即氨基酸之間的距離要滿足三角不等式約束。③在結(jié)構(gòu)預(yù)測(cè)模塊中,利用三維空間結(jié)構(gòu)平移和旋轉(zhuǎn)等變的知識(shí),ApphaFold?2?引入了不動(dòng)點(diǎn)注意力(IPA)計(jì)算。根據(jù)?IPA?輸出的殘基相對(duì)位移和旋轉(zhuǎn),AlphaFold?2?進(jìn)一步預(yù)測(cè)原子的空間位置。④引入?OpenMM?中的?Amber?力場(chǎng)優(yōu)化工具,以確保輸出的三維結(jié)構(gòu)滿足立體化學(xué)約束。

從對(duì)?AphaFold?2?研究范式的分析可以看出,其特點(diǎn)是深度學(xué)習(xí)技術(shù)與各類知識(shí)的有機(jī)融合,涵蓋了知識(shí)、數(shù)據(jù)、算法、算力這?4?種第三代?AI?的核心要素。因此,圍繞深度學(xué)習(xí),研究知識(shí)獲取、知識(shí)表示、知識(shí)集成、知識(shí)利用,即知識(shí)自動(dòng)化方法,探索“知識(shí)-學(xué)習(xí)”協(xié)同組織形式,開(kāi)發(fā)協(xié)助?AI4S?研究的系統(tǒng)化基礎(chǔ)框架,應(yīng)當(dāng)?shù)玫?AI?界和科學(xué)界的共同重視和大力投入。

ChatGPT?研發(fā)范式

自?2022?年?11?月起,ChatGPT?掀起新一輪?AI?全球浪潮。ChatGPT?因其能夠進(jìn)行多輪對(duì)話、承認(rèn)錯(cuò)誤、反駁錯(cuò)誤前提和拒絕回答不恰當(dāng)?shù)膯?wèn)題而享有盛譽(yù)。ChatGPT?在回答問(wèn)題的準(zhǔn)確性和邏輯完整性方面超越了現(xiàn)有的聊天機(jī)器人,在遵守道德、倫理、法律方面也有很好的表現(xiàn)。ChatGPT?是?OpenAI?近年來(lái)研發(fā)的一系列?GPT?模型在對(duì)話場(chǎng)景的實(shí)例,有?3?個(gè)技術(shù)特征。

ChatGPT?基于大規(guī)模預(yù)訓(xùn)練語(yǔ)言模型,即著名的?GPT-3?系列(GPT-3.5)。在過(guò)去的幾年里,大規(guī)模的預(yù)訓(xùn)練模型發(fā)展迅速。大規(guī)模預(yù)訓(xùn)練模型通過(guò)學(xué)習(xí)大量的公開(kāi)數(shù)據(jù),將學(xué)習(xí)到的知識(shí)存儲(chǔ)在大規(guī)模參數(shù)之中,不斷刷新多個(gè)領(lǐng)域中多數(shù)任務(wù)的最高性能紀(jì)錄,是通向通用人工智能的可行路徑。

ChatGPT?使用人類反饋強(qiáng)化學(xué)習(xí)(RLHF)在?GPT-3.5?上進(jìn)行微調(diào)。微調(diào)是包含?2?個(gè)數(shù)據(jù)集的過(guò)程,共有?3?步:第一步,由?2?個(gè)?AI?訓(xùn)練師基于給定采樣提示(prompt)通過(guò)對(duì)話生成人類演示數(shù)據(jù)集,用于?GPT-3.5?微調(diào)訓(xùn)練,結(jié)果稱為有監(jiān)督微調(diào)模型(SFT)。第二步,通過(guò)?AI?培訓(xùn)師和聊天機(jī)器人之間的對(duì)話收集比較數(shù)據(jù)集,對(duì)?SFT?模型輸出的多個(gè)結(jié)果,由?AI?培訓(xùn)師給出從最好到最差的打分排序。之后,用這個(gè)排序數(shù)據(jù)集訓(xùn)練強(qiáng)化學(xué)習(xí)的獎(jiǎng)勵(lì)模型,此過(guò)程也是有監(jiān)督的方式。第三步,使用近端策略優(yōu)化(PPO)算法,由獎(jiǎng)勵(lì)模型生成?reward,通過(guò)強(qiáng)化學(xué)習(xí)進(jìn)一步微調(diào)?SFT?模型。第二步和第三步重復(fù)多次,最后得到?PPO?模型,即?ChatGPT。

GPT?模型按照“開(kāi)發(fā)-部署”的理念迭代完善。將初步開(kāi)發(fā)完成的模型部署上線,為用戶提供測(cè)試服務(wù),由此收集用戶與模型的交互數(shù)據(jù)作為進(jìn)一步優(yōu)化模型的基礎(chǔ)。開(kāi)發(fā)(學(xué)習(xí))和部署(應(yīng)用)形成閉環(huán),這種迭代優(yōu)化策略在降低語(yǔ)言模型誤用風(fēng)險(xiǎn)方面起著至關(guān)重要的作用。

ChatGPT?范式再次展示了預(yù)訓(xùn)練大型模型的強(qiáng)大功能,凸顯了人類在引導(dǎo)大模型遵循人類規(guī)則方面的重要作用。由此可見(jiàn),針對(duì)大模型的微調(diào)、上下文學(xué)習(xí)、指示學(xué)習(xí)、提示學(xué)習(xí)是?AI?的重要研究方向。

探索AI4S研究新范式

AI?本身的研究范式也在不斷轉(zhuǎn)變。自?AI?誕生之初,人們基于幾個(gè)基本假設(shè)(如獨(dú)立同分布、Markov屬性等),使用初級(jí)方法(如?Perceptron等)解決簡(jiǎn)單的問(wèn)題(如簡(jiǎn)單的二元分類、回歸等),并由此產(chǎn)生了?3?種基本范式——監(jiān)督學(xué)習(xí)、無(wú)監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)。但面對(duì)復(fù)雜問(wèn)題時(shí),這些基本范式存在局限性。因此,隨著新的算法(BP?算法、分層訓(xùn)練等)和模型(CNN、長(zhǎng)短期記憶人工神經(jīng)網(wǎng)絡(luò)?LSTM?等)的出現(xiàn),AI?逐漸發(fā)展出主動(dòng)學(xué)習(xí)、遷移學(xué)習(xí)、終身學(xué)習(xí)等新范式。近年來(lái),AlphaGo?和?ChatGPT?等前沿進(jìn)展以其革命性的成就引領(lǐng)了新一輪的范式轉(zhuǎn)變。從范式轉(zhuǎn)變的角度看待人工智能的發(fā)展,對(duì)促進(jìn)探索?AI4S?創(chuàng)新應(yīng)用具有重要價(jià)值,為此,以下從算法、模型、數(shù)據(jù)、知識(shí)、人的角色等方面進(jìn)行分析。

算法

算法是人工智能的基石。典型?AI?新范式中使用的算法不僅限于機(jī)器學(xué)習(xí),還涉及整個(gè)人工智能領(lǐng)域,包括搜索和推理。例如,AlphaGo?的主干是蒙特卡洛樹(shù)搜索(MCTS)算法。近年來(lái)出現(xiàn)的新算法,例如受熱力學(xué)啟發(fā)的擴(kuò)散模型(Diffusion Model),在AI生成內(nèi)容(AIGC)領(lǐng)域顯示出巨大潛力。由此可以看出,Science for AI?對(duì)?AI?算法創(chuàng)新也具有重要意義,應(yīng)得到同?AI4S?一樣的重視。

模型

機(jī)器學(xué)習(xí)模型的創(chuàng)新是推動(dòng)人工智能發(fā)展的核心要素。尤其是神經(jīng)網(wǎng)絡(luò)新架構(gòu):從?M-P?模型到?Perceptron,從?LeNet?到?ResNet,從?LSTM?到?Transformer。AlphaGo?以?CNN?為主干網(wǎng)絡(luò),用于提取棋局特征、輔助走棋決策和棋局評(píng)估。AlphaFold?2?用Transformer(EvoFormer)替換?CNN?模型,這是其性能相比第一代有巨大提升的主要原因之一。ChatGPT?建立在基礎(chǔ)模型(GPT-3)之上,充分利用了大規(guī)模預(yù)訓(xùn)練語(yǔ)言模型的力量。利用大模型的規(guī)模效應(yīng),研究利用?prompt?等方法引導(dǎo)大模型釋放內(nèi)在能力,是?AI4S?重要方向之一。

數(shù)據(jù)

數(shù)據(jù)是深度學(xué)習(xí)的三大核心驅(qū)動(dòng)力之一,但存在標(biāo)簽數(shù)量少、標(biāo)注成本高、分布不平衡、隱私保護(hù)等問(wèn)題。主動(dòng)學(xué)習(xí)、溯因?qū)W習(xí)、對(duì)比學(xué)習(xí)、平行學(xué)習(xí)和遷移學(xué)習(xí)等學(xué)習(xí)范式,能夠在一定程度上克服數(shù)據(jù)標(biāo)注的不足;而多任務(wù)學(xué)習(xí)、遷移學(xué)習(xí)、元學(xué)習(xí)和終身學(xué)習(xí),在一定程度上能克服不同任務(wù)之間存在數(shù)據(jù)不平衡問(wèn)題;聯(lián)邦學(xué)習(xí)可用來(lái)解決數(shù)據(jù)安全和隱私問(wèn)題。

新范式在數(shù)據(jù)的使用方面有更多亮點(diǎn),Syn2Real和?Sim2Real?等數(shù)據(jù)生成方法得到越來(lái)越多的重視。例如,AlphaGo?首先在人類棋局上訓(xùn)練策略,通過(guò)自我對(duì)弈產(chǎn)生更多的數(shù)據(jù)來(lái)訓(xùn)練更強(qiáng)大的策略網(wǎng)絡(luò),進(jìn)而產(chǎn)生更多的數(shù)據(jù)來(lái)訓(xùn)練強(qiáng)大的價(jià)值網(wǎng)絡(luò)。AlphaFold?充分利用遺傳數(shù)據(jù)和結(jié)構(gòu)數(shù)據(jù),還通過(guò)自蒸餾的方式使用未標(biāo)注數(shù)據(jù)來(lái)彌補(bǔ)標(biāo)注數(shù)據(jù)的不足。ChatGPT?使用人類的演示數(shù)據(jù)來(lái)微調(diào)?GPT-3.5,并通過(guò)?prompt?在聊天機(jī)器人和?AI?訓(xùn)練師之間生成更多的數(shù)據(jù),進(jìn)一步訓(xùn)練獎(jiǎng)勵(lì)模型將數(shù)據(jù)生成過(guò)程自動(dòng)化。這些范式具有一個(gè)共同特征,即它們?cè)谌狈?biāo)記數(shù)據(jù)時(shí)嘗試生成數(shù)據(jù)以提高性能。

知識(shí)

AI?基本范式很少顯式引入知識(shí),但在模型設(shè)計(jì)(如?CNN)時(shí)引入的偏差(bias)也可以看作是先驗(yàn)知識(shí)。中級(jí)范式通常有?3?種引入知識(shí)的方式:①直接(如主動(dòng)學(xué)習(xí))或間接(如課程學(xué)習(xí))通過(guò)學(xué)習(xí)策略的設(shè)計(jì)來(lái)提高學(xué)習(xí)性能;②使用從先前任務(wù)或其他任務(wù)(數(shù)據(jù))中學(xué)到的知識(shí)來(lái)幫助新的學(xué)習(xí)任務(wù)。例如,多任務(wù)學(xué)習(xí)、遷移學(xué)習(xí)、元學(xué)習(xí)、平行學(xué)習(xí)等;③整合上述?2種方法,設(shè)計(jì)并維護(hù)一個(gè)專門(mén)的知識(shí)庫(kù)來(lái)輔助學(xué)習(xí)過(guò)程。例如,終身學(xué)習(xí)和溯因?qū)W習(xí)等。

目前,大多數(shù)機(jī)器學(xué)習(xí)范式都采用知識(shí)的嵌入表示,以便將知識(shí)融合到學(xué)習(xí)過(guò)程中;但其中有?2個(gè)例外,即終身學(xué)習(xí)和歸納學(xué)習(xí),它們具有獨(dú)立的知識(shí)庫(kù)。我們還發(fā)現(xiàn)反饋對(duì)于學(xué)習(xí)中的知識(shí)獲取、整合和自動(dòng)化至關(guān)重要。高級(jí)范式高度依賴知識(shí),例如,AlphaGo?首先利用人類棋手的經(jīng)驗(yàn)(可看作一種知識(shí))訓(xùn)練策略網(wǎng)絡(luò),然后利用圍棋規(guī)則(也是一種知識(shí))通過(guò)強(qiáng)化學(xué)習(xí)改進(jìn)策略,進(jìn)一步通過(guò)自我對(duì)弈生成大量棋局。AlphaFold?整合了生物學(xué)家的發(fā)現(xiàn),以及來(lái)自遺傳學(xué)、數(shù)學(xué)和化學(xué)領(lǐng)域的知識(shí),這種高級(jí)范式是知識(shí)密集型的代表,為?AI4S?的進(jìn)一步研究提供重要參考。ChatGPT?的基礎(chǔ)是大規(guī)模預(yù)訓(xùn)練語(yǔ)言模型(GPT3),可以看作是從海量數(shù)據(jù)中提煉出來(lái)的隱性知識(shí)庫(kù),而提示工程(prompt engineering)是引導(dǎo)大模型生成內(nèi)容并對(duì)齊到人類會(huì)話風(fēng)格、倫理和規(guī)范的過(guò)程。

運(yùn)用知識(shí)的能力很大程度上決定了學(xué)習(xí)能力。然而,將知識(shí)整合到機(jī)器學(xué)習(xí)的過(guò)程中具有很大挑戰(zhàn),知識(shí)的獲取、表示、集成、利用等環(huán)節(jié)通常需要人類的參與。“人工智能驅(qū)動(dòng)的科學(xué)研究”專項(xiàng)部署強(qiáng)調(diào)圍繞藥物研發(fā)、基因研究、生物育種、新材料研發(fā)等需求,而知識(shí)融入這些專業(yè)性強(qiáng)的?AI4S?領(lǐng)域中尤為突出。為此,將大模型打造為知識(shí)工廠,研究服務(wù)于科學(xué)家的知識(shí)自動(dòng)化方法,將是推動(dòng)高效?AI4S?的重要保障。

人的因素

在深度學(xué)習(xí)之前,依賴于人類的特征工程在?AI?研究中起著決定性的作用。特征工程既費(fèi)時(shí)又低效,而深度學(xué)習(xí)解決了這個(gè)問(wèn)題。深度神經(jīng)網(wǎng)絡(luò)能夠自動(dòng)、準(zhǔn)確、高效地提取特征,由此,端到端學(xué)習(xí)模型越來(lái)越受歡迎。然而,在某些應(yīng)用中,人扮演著重要的角色,如提出要求、設(shè)定目標(biāo)、提供知識(shí)、實(shí)施控制、執(zhí)行評(píng)估等。因此,端到端學(xué)習(xí)不是最終目標(biāo),不能簡(jiǎn)單地將人類從機(jī)器學(xué)習(xí)過(guò)程中移除。人類在環(huán)(human-in-loop)模式的價(jià)值在?ChatGPT?的成功中顯而易見(jiàn),其中來(lái)自人類反饋的強(qiáng)化學(xué)習(xí)(RLHF)發(fā)揮了關(guān)鍵作用。

除以上因素之外,開(kāi)展?AI4S?研究的組織方式也是不可回避的重要問(wèn)題。當(dāng)前,國(guó)際上多種針對(duì)產(chǎn)品開(kāi)發(fā)的?DAO(分布式開(kāi)放自主組織)和針對(duì)基礎(chǔ)研究的?DeSci(分布式開(kāi)放科學(xué)運(yùn)動(dòng))正蓬勃興起,特色就是利用智能科學(xué)與技術(shù)(IST),基于區(qū)塊鏈和智能合約的數(shù)字組織和數(shù)字治理。ChatGPT?的誕生本質(zhì)上也是得益于這種模式,DeSci?和?DAO?也值得我們關(guān)注。

(作者:王飛躍,中國(guó)科學(xué)院自動(dòng)化研究所;繆青海,中國(guó)科學(xué)院大學(xué)人工智能學(xué)院;編審:楊柳春,《中國(guó)科學(xué)院院刊》供稿)



【責(zé)任編輯:殷曉霞】
返回頂部
<noscript id="wwww0"><dd id="wwww0"></dd></noscript>
<nav id="wwww0"><code id="wwww0"></code></nav>
      • <small id="wwww0"></small><sup id="wwww0"><cite id="wwww0"></cite></sup>
      • <sup id="wwww0"></sup>