天天看點

智能時代呼喚新的科研方法 | 科技導報

作者:科技導報
智能時代呼喚新的科研方法 | 科技導報

智能化科研(AI4R)是科研方法的重大變革。本文提出科技界不僅要關注科學智能(AI for Science,AI4S),更要重視技術智能(AI for Technology,AI4T);不僅要關注大語言模型(LLM),更要重視大科學模型(LSM)。同時提出,人工智能的突破主要不是靠大算力,而是計算模型的轉變,中國應當争取在基礎模型上做出颠覆性的創新;智能化科研适合做複雜問題的組合搜尋,神經網絡模型也許已接近能處理困難問題的複雜度門檻值點;智能化科研的一種趨勢是放棄絕對性,擁抱不确定性,一定時期内要适當容忍“黑盒模型”。

近年來,科學智能(AI for science,AI4S)在科技界受到重視,也引起了人們對科學方法的讨論。筆者主張将“智能化科研”稱為“第五科研範式”,本文讨論與智能化科研有關的一些認識問題。智能化科研是科研方法的重大變革

在科學發展史上,人們把已經流行的某種類型的科研方法稱為科研範式。随着人類生産力的進步,科研範式在不斷演變。農業時代隻采用觀察和實驗歸納方法,稱為第一範式;工業時代開始流行以理論分析和邏輯演繹為特征的第二範式;資訊時代出現了計算機模拟仿真,稱為第三範式;網際網路普及後興起資料驅動的第四科研範式。現在人類處于資訊時代的智能化階段,正在向智能時代邁進,智能化科研範式順應而生。

人工智能經曆了60多年的長期研究,近10年來取得重大突破。大資料、大模型和大算力的組合加速了智能化的程序。智能化科研正在引發一場科技革命,它帶來的機遇和挑戰影響中國科技發展的前途。“AI for science”本質上是“AI for scientists”,各個領域的科研智能化一定是以本領域的科學家為主來完成,各行業的科學家是這一場科技革命的主角。各領域的科學家要擔當起這份重任,自身需要智能化轉型。隻有廣大科學家積極主動地參與這場變革,智能化科研才能走上良性發展的軌道。不僅要關注科學智能,更要重視技術智能

近年來出現了若幹智能化科研的成功案例。蛋白質三維結構預測是智能化科研的裡程碑式的科研成果。從2021年開始,利用深度學習技術,AlphaFold 2已預測了超過100萬個物種的2.14億個蛋白質三維結構,幾乎涵蓋了地球上所有已知的蛋白質。這一重大突破改變了生物領域科學家的觀念,照亮了智能化科研的道路。2024年5月,Deep Mind團隊在《Nature》期刊發表介紹新成果AlphaFold 3的封面文章,AlphaFold 3不僅能預測蛋白質結構,而且能以前所未有的精度預測所有生物分子(包括蛋白質、DNA及其他分子構成)的結構和互相作用,此成果對生物制藥等領域可能會産生颠覆性的推進作用。圖1是AlphaFold 3對蛋白質與DNA分子複合體的精确預測。

智能時代呼喚新的科研方法 | 科技導報

圖1 AlphaFold3對蛋白質與DNA雙螺旋分子複合體的精确預測(圖檔來源:DeepMind官網)

基于深度學習的分子動力學模拟是AI技術與超算結合的典型案例。2022年,中國科學院計算技術研究所的賈偉樂團隊将具有第一性原理精度的模拟規模提升至170億個原子,計算效率比2020年他的團隊獲得“戈登·貝爾獎”的成果提升1000倍以上。2022年5月,中國科學院計算技術研究所陳雲霁團隊成功地利用人工智能技術,設計出全球首款全自動生成的32位RISC-V CPU——“啟蒙1号”。設計周期縮短至傳統設計方法的1/1000,僅用5h就生成了400萬邏輯門。2023年11月,DeepMind團隊在《Science》上發表論文指出示,AI天氣預報的精度和預報速度超過傳統的數值天氣預報水準,在單個Google Cloud TPU v4系統上1分鐘内可生成10天的天氣預報。同月,DeepMind研究團隊在《Nature》上發文宣布,通過人工智能工具“材料探索圖形網絡(GNoME)”,發現了多達220萬種理論上穩定但絕大部分在實驗上尚未實作的晶體結構,其中有38萬種穩定的晶體結構有望通過實驗合成,具有實際應用前景。GNoME可被視為材料領域的“AlphaFold 2”,将人類已知的穩定材料的數量增長了近10倍。上述重大成果中,有些是探索自然界奧秘的基礎科學研究,有些是如何設計人造物的技術研究,既有科學智能(AI4S),也有技術智能(AI for technology,AI4T)。這說明,人工智能技術不僅用于基礎科學研究,也已滲透到技術研究甚至工程科學。筆者建議将可稱為第五科研範式的“智能化科研”翻譯成“AI for research”,簡稱AI4R,以反映科學、技術和工程整個科研領域的重大範式轉變。AI4S和AI4T分别類似于資訊編碼和資訊解碼,前者是将大量觀察資料編碼成符号化的規律或知識,後者是将大量滿足需求規範的樣例解碼成人造物的具體設計。無論是晶片全自動設計、新材料發現,還是AI天氣預報,都是技術發明或預測。目前人工智能的抽象能力有限,真正的科學發現還很少見,AI4R取得的成績主要是生物、材料、制藥等領域的技術突破。我們在探讨科研方法創新時,一定要高度重視AI4T的應用。不僅要關注大語言模型,更要重視大科學模型

不管是AI4S還是AI4T,都離不開大模型。現在國内的學者言必稱大模型,但國外并不流行large model或big model的說法,流行的是large language model(LLM),即大語言模型。這是由OpenAI公司帶領的方向,主要是 ChatGPT 的影響。OpenAI團隊堅信人類的知識大多包含在語言中,是以,LLM可以成為一種通用的人工智能模型。LLM确實有較強的泛化能力,不僅可以用于文本生成,也可以生成圖像、語音,甚至可以做數學推理。但是,目前的LLM盡管從網際網路上學習了海量樣本資料,但本質還是封閉範圍的AI,LLM學到的知識是訓練過程中接觸到的書本知識,與人類實踐活動有關的大量隐性知識還沒有學到。

DeepMind團隊(現合并到Google公司)采用的大模型中,也用LLM的方法學習必要知識,但更關注AI4R,主要是采用強化學習,機器本身也産生很多資料。上述智能化科研的成功案例中,有3個是DeepMind團隊做出的。在推進智能化科研的過程中,我們可能要更加關注DeepMind團隊的工作。為了差別于大語言模型,建議在智能化科研中提倡大科學模型(large science model,LSM)。大科學模型比LLM更複雜,需要資料驅動和模型驅動互相融合,有些研究要從第一性原理出發。LSM要考慮的内容很多,包括神經網絡架構、機器學習和優化算法、訓練資料集、科學倫理等。總體來講,AI模型有兩大類:一類是面向大衆的模型(AI for the masses),以LLM為代表,适應面較廣,對目前社會的影響大;另一類是面向科學研究的人工智能模型(AI for research),以DeepMind團隊采用的LSM為代表,這類模型對人類的未來可能有較大影響。

智能化科研強調跨學科合作,但是每一個垂直領域還是要建構專業大模型。建構垂直領域的大科學模型是一個複雜的動态過程,既需要懂得人工智能技術,又要對所涉及領域有深入的了解。對收集的資料進行嚴格的清洗和格式化,確定資料的品質和多樣性,是專業性大科學模型成敗的關鍵。大語言模型目前大多用于商業服務領域,科研領域成功的專業大模型還不多。原因之一是大語言模型不可避免存在“幻覺”,不能直接用于對正确性和精确性要求很高的科學研究。對于科研領域,模型具有識别自身能力不足的“自知之明”與提高模型準确性同等重要,科研大模型必須找到對付AI幻覺的辦法。人工智能的突破主要不是靠大算力,而是計算模型的轉變

近年來,人工智能取得重大突破,得益于大資料、大模型和大算力,三者缺一不可。有些文章過分宣傳“大算力出奇迹”,這是一種片面的認識,單純提高算力不是萬能藥。實際上,野蠻地提高算力對擴大複雜問題的求解規模沒有實際意義。如果圍棋擴大到20×20的棋盤(即增加一行一列),野蠻搜尋的算力需要提高1018倍。這2年訓練大語言模型的算力增加了265倍,每3個月翻一番。如果這種發展速度延續10年,算力就要增加1萬億倍,這不僅難以做到,也挑戰了地球可供資源和能源的極限。

有人說人工智能問題大多數是具有指數複雜性的NP困難問題,這隻是一種模糊籠統的說法。人工智能問題的計算複雜性究竟有多高,目前還不清楚。因為一個人工智能問題,如機器翻譯,其輸入輸出并沒有給出嚴格的定義,“問題解決了”是什麼意思也沒有明确的說法。所謂NP困難問題(在多項式時間内可被圖靈機驗證結果的問題,往往具有指數級的計算複雜性)是對圖靈計算模型而言的。問題的複雜性随計算模型的改變而改變,不同模型的計算效率有天壤之别。1943年麥卡洛克和皮茨提出了神經元計算模型,這個模型在可計算性上與圖靈模型是等價的,但對自動機理論而言,比圖靈模型更有價值。馮·諾依曼曾指出:“圖靈機和神經網絡模型分别代表了一種重要的研究方式:組合方法和整體方法。麥卡洛克和皮茨對底層的零件作了公理化定義,可以得到非常複雜的組合結構;圖靈定義了自動機的功能,并沒有涉及具體的零件。”過去的幾十年裡,神經元模型一直比不過圖靈模型,在學術界受到排擠。但Hinton等學者堅持不懈,終于讓神經元模型大翻身。

自然語言了解、模式識别等困難問題在神經元模型上能有效解決,說明神經元計算模型對這類問題的求解效率遠超圖靈計算模型。近些年人工智能的成功本質上不是大算力出奇迹,而是改變計算模型的結果,從基于邏輯的确定性計算模型改成基于人腦啟發的機率統計型模型。人工神經網絡和機器學習都是不等同于圖靈機的計算模型,因而表現出不同的計算效率。現有的計算複雜性理論還不能對近年來機器學習解決複雜問題的高效率做出科學的解釋,需要加強關于人工智能和複雜性科學的交叉研究。

在智能化科研中,資料、模型和算力的規模需要協調配合。神經元計算模型、反向傳播和梯度下降算法都已提出幾十年了,由于算力不足,這種計算模型的潛力沒有顯現。GPU的問世滿足了這一需求,讓神經元計算模型處理一些複雜問題的優勢發揮出來,令人震驚。但神經網絡模型并不是在所有問題的計算效率上都超過圖靈機模型,在許多問題上圖靈機模型仍有優勢。有研究發現,使用神經網絡來近似解決某些問題時,随着求解精度提高,網絡與訓練資料的規模都呈指數級增長,這說明神經元計算模型的擴充性仍有問題。我們提倡的LSM不局限于神經元模型。實際上,“啟蒙1号”就沒有采用神經元模型,而是獨創的二進制推測圖(DSM)模型。值得指出的是,早在1948年,圖靈就寫了一篇題為“Intelligent Machinery”(智能機器)的論文,提出了與圖靈機不同的計算模型——“無組織機器”,模拟嬰兒的大腦皮層,通過适當的幹擾訓練來實作組織化。這篇文章實際是早期的随機連接配接神經網絡模型,幾乎描述了目前人工智能聯結主義的基本原理,包括遺傳算法和強化學習等。由于他沒有得到老闆的認可,一直沒有發表,直到2004年才被發現。如果學術界早看到這篇論文,今天的計算機世界可能是另一副模樣。

人工智能的研究還處在“伽利略時代”,或者說處在“牛頓時代的前夜”,面臨諸多未知和挑戰。我們要看到現有技術路徑的局限性,不能隻追求增量式改進。在人工智能領域,成為主流的機器學習模型的紅火期一般不超過10年。當今主流的Transformer模型已經流行6年多,可能幾年内就會被新的模型取代。如果依葫蘆畫瓢,重複開發許多沒有新意的小模型,對推進人工智能作用不大。中國應當争取在基礎模型上做出颠覆性的創新,為人工智能和智能化科研的發展做出曆史性的貢獻。智能化科研适合做複雜問題的組合搜尋

以大科學模型為代表的第五科研範式并沒有取代以前的4種科研範式,實驗歸納、理論分析和計算機模拟仍然是科研的主要範式,智能化科研隻有和傳統科研範式密切配合才能發揮作用。但有一些複雜問題,如果不是要獲得完全正确的解或最優解,采用深度學習方法似乎能大大提高求解效率,這類問題很适合智能化科研。上面列出了幾個成功案例,有幾個就是這類組合搜尋問題。

許多科學問題的假設空間非常大,例如小分子候選藥物的數量估計有1060種,可能成為穩定材料的總數多達10180種,CPU設計的組合空間相對于設計者考慮到的範圍,幾乎是無窮大。這就是人們常說的“組合爆炸”,數學家稱之為“次元災難”。過去的4種科研範式難以解決的組合爆炸問題正好是第五範式的用武之地。

要把幾乎無窮大的理論搜尋空間壓縮到超級計算機甚至PC機可以承受的足夠小的搜尋空間,需要啟發性的知識做指導。通過海量資料的訓練學習,計算機可以學習到一些過去人類不知道的啟發資訊,這可能是智能化科研的威力之一。神經網絡不是按照确定的算法實作圖靈計算,其主要功能是“猜測加驗證”。猜測和計算是兩個不同的概念,基于神經網絡的機器更合适的名稱是“猜測機”,而不是“計算機”,其解決複雜問題的能力很強,可能背後有更深層次的奧秘。

馮·諾伊曼(圖2)對複雜系統背後的奧秘,曾提出一種假說,叫作“複雜性門檻值”。他去世後整理發表的著作《自複制自動機理論》指出:自動機理論的核心概念在于複雜性,超複雜的系統會湧現出新的原理。突破了複雜度門檻值的系統,就會由于在資料層的擴散和變異作用而不斷進化,可以做很困難的事情。現在的神經網絡模型有數千億甚至上萬億個參數,可能已接近能處理困難問題的複雜度門檻值點。複雜度門檻值不僅僅與模型的規模有關,為什麼超過門檻值就能做很複雜的事,現在還沒有完全明白,需要做深入研究。馮·諾伊曼的《Theory of Self-Reproducing Automata》(《自複制自動機理論》)可能是研究複雜性理論最深刻的一本書,令人肅然起敬。

智能時代呼喚新的科研方法 | 科技導報

圖2 馮·諾依曼與他的遺著《Theory of Self-Reproducing Automata》放棄絕對性,有效應對不确定性

早期AI研究的數學基礎是數理邏輯,以符号處理為主,很多數學工具都用不上。AI能夠再創輝煌,主要的改進是采用了機率論和統計學的方法,處理的對象是資料而不是符号,大量的數學工具可以發揮作用。複雜問題往往具有不确定性和動态變化的特點,不容易找到形式化的精确解答,隻能通過對輸入輸出的比較分析去拟合未知的函數。一般而言,求近似解既不是降低算法複雜性的必要條件,也不是充分條件,有些問題即使求近似解仍然具有指數複雜性。但是,智能化科研的實踐已表明:對許多問題,隻要找到足夠多的具有代表性的樣本(資料),就可以通過機器學習找到合适的模型(組合),使得它和真實的函數非常接近地拟合。AI研究的新近發展展現一種趨勢:放棄絕對性,擁抱不确定性,即隻求滿足一定精度的解,這或許是這次AI“意外”取得成功的深層原因。

馮·諾伊曼早就預言:“資訊理論包括2大塊:嚴格的資訊論和機率的資訊論。以機率統計為基礎的資訊理論大概對于現代計算機設計更加重要。”長期以來,計算機界解決問題的思路都是為特定應用編寫計算機程式。經過幾十年努力,現在有了另一種問題求解的思路,一個基于學習而不是編寫計算機程式的替代方案。大模型相當于一種可能導緻通用智能的應用程式,這種求解方式有時會失敗,但在現實世界中可以對付許多複雜的問題。統計意義的正确性與确定性計算程式的嚴格正确性是解決複雜問題的不同思路,放棄對百分之百正确性或最優解的追求,可能是智能化科研獲得巨大威力的前提之一。科學研究可以被視為将“黑盒模型”逐漸轉化為“白盒模型”的過程,即從對某些現象或過程不了解逐漸推進到充分了解其内部機制和原理。解決複雜度不高的問題,我們已掌握其基本原理,是以要強調可解釋性,盡可能采用白盒模型。但對于非常複雜的問題,一開始不可能有白盒模型,一定時期要适當容忍黑盒模型,承認黑盒模型某種程度的合理性。這就是筆者在許多場合強調的,機器有人類暫時還不明白的“暗知識”,機器的“了解”不同于人的了解,要提倡人機智能融合。為了防止黑盒模型潛在的失控或可能出現的不良後果,要加強科技倫理監管,讓智能化科研始終在安全可控的軌道上良性發展。

作者簡介:李國傑,計算機專家,中國工程院院士、開發中國家科學院(TWAS)院士,中國科學院計算技術研究所首席科學家。研究方向為計算機體系結構、并行算法、人工智能、計算機網絡、資訊技術發展戰略等。

原文發表于《科技導報》2024年第10期,歡迎訂閱檢視。

智能時代呼喚新的科研方法 | 科技導報

内容為【科技導報】公衆号原創,歡迎轉載

白名單回複背景「轉載」

《科技導報》創刊于1980年,中國科協學術會刊,主要刊登科學前沿和技術熱點領域突破性的成果報道、權威性的科學評論、引領性的高端綜述,發表促進經濟社會發展、完善科技管理、優化科研環境、培育科學文化、促進科技創新和科技成果轉化的決策咨詢建議。常設欄目有院士卷首語、智庫觀點、科技評論、熱點專題、綜述、論文、學術聚焦、科學人文等。

《科技導報》微信公衆平台建立于2014年,主要刊登《科技導報》期刊内容要點,報道熱點科技問題、科技事件、科學人物,打造與紙刊緊密聯系又特色鮮明的新媒體平台。科技導報公衆号聚集了數萬名專心學術的未來之星和學術大咖,添加編輯微信,讓優秀的你有機會與志趣相同的人相遇。

智能時代呼喚新的科研方法 | 科技導報

繼續閱讀