天天看點

中國一定要有自己的大模型?看看清華教授怎麼說 |科學多面體

中國一定要有自己的大模型?看看清華教授怎麼說 |科學多面體

出品|搜狐科技

作者|鄭松毅

編輯|楊錦

在百年未有之大變局的當下,科學技術作為推動經濟社會發展的第一推動力,她的每一次革新都為大衆矚目。搜狐科技《思想大爆炸-科學多面體》欄目,力圖展現不同視角,争鳴基礎科學和前沿科技領域的重大進展與突破。

GPT拉開強人工智能時代的序幕後,“學院派”“大廠派”“創業派”争上大模型,到底有沒有必要投入重金做自己的大模型?ChatGPT能稱得上技術革命嗎?圍繞這些熱點問題,本期對話清華大學國強教授、智能産業研究院(AIR)首席研究員聶再清。

嘉賓簡介

聶再清,現任清華大學國強教授、智能産業研究院(AIR)首席研究員。師從美國人工智能學會前主席Subbarao Kambhampati教授,大學和碩士畢業于清華大學計算機科學與技術系。2017年加入阿裡巴巴,任阿裡巴巴人工智能實驗室北京負責人和阿裡巴巴天貓精靈首席科學家,帶領團隊從無到有實作天貓精靈的所有相關算法研發和創新工作。此前就職于微軟亞洲研究院,任首席研究員。發明的知識圖譜相關技術等,被廣泛應用于網際網路搜尋引擎、聊天機器人等領域,在微軟期間被授予Microsoft Golden Star獎。

劃重點

1、中國至少要有一個大模型可以給咱們中國人使用,多一些做大模型的人是一件好事。

2、大模型的智能湧現能力是ChatGPT被認定為重大技術革命的原因之一。

3、目前業内對于大模型“大廠派”“創業派”“學院派”的分類方法并不科學,“學院派”的産品最終也大機率會走向産業。”

4、參數的需求實際和資料量之間是強相關的,如果有用資料太少,參數太多是沒有意義的。

5、AI造成一些現有工作的減少是必然的,但技術進步也會帶來新的工作機會。技術進步改變了服務模式,但對于人的需求是持續存在的。

6、企業的工作可以更了解市場對于技術的實際需求,而院校研究機構更為靈活,可以更專注于科研工作,做一些有興趣想做的研究。

就在劉慈欣憂慮“科技發展變慢了”之際,今年年初,ChatGPT的爆發開啟AI大航海時代,為下一輪技術變革帶來新的動力與可能。

“一人捅破窗戶紙,千軍萬馬獨木橋。”正如周鴻祎所說,OpenAI捅破通用人工智能的窗戶紙後,國内科技産業内外伺機而動,就在4月,從大廠到高校,從華為、阿裡、百度、商湯,到清北、複旦、浙大,再到王小川、李志飛、李開複......這些噤聲已久的大公司和大佬紛紛高調起來,卷入大模型混戰。

“中國至少要有一個大模型可以給咱們中國人使用,多一些做大模型的人是一件好事。”

近日,聶再清在與搜狐科技對話時表示,在目前比較初期的階段,競争會促進大模型技術領域的不斷更新,随着大模型技術的發展,尾部的一些研發機構自然會向頭部機構聚攏。

據搜狐科技不完全統計,目前國内各派大模型主要玩家總和已40有餘。而關于要做自己的大模型,還是接入大廠的大模型,業内争議很多,有大佬表示,“通用大模型不一定适合所有人,商業應用價值是首先需要考慮的因素。”也有聲音認為,“每個行業、企業甚至每個人都應該有自己定制的GPT大模型。”

《2022中國大模型發展白皮書》指出,中國的大模型數量從2020年驟增,僅2020年到2021年,中國大模型數量就從2個增至21個,和美國量級同等,大幅領先于其他國家。

在聶再清看來,大模型大緻分為兩類:通用大模型和專用大模型。通用大模型是各行各業的基礎模型,未來也會包含多模态的資訊,處了文字外,也可以把視覺、語音等多模态資訊用來學習一個通用大模型。專用大模型更多聚焦某一個領域,例如生物醫藥,研發或選用哪一種要根據實際任務選擇。

同時,他認為,目前業内對于大模型“大廠派”“創業派”“學院派”的分類方法并不科學,“學院派的産品最終也大機率會走向産業。”

從技術的角度看,大模型發端于自然語言處理領域,參數規模逐漸提升至千億、萬億,同時用于訓練的資料量級也顯著提升,帶來了模型能力的提高。

談及這一輪技術變革,聶再清分析稱,大模型的智能湧現能力是ChatGPT被認定為重大技術革命的原因之一。

在“大模型是否需要持續增加大量參數”的問題上,他與OpenAI創始人山姆·阿爾特曼的觀點一緻:參數的數量需求是與資料量相關的,當資料量并未大幅增加時,也沒有必要持續大量增加參數。

以下為對話實錄(經整理編輯)

搜狐科技:您認為大模型可以分為哪幾類?

聶再清:目前大模型大緻可以分為兩類:通用大模型和專用大模型。通用大模型是各行各業的基礎模型,未來也會包含多模态的資訊,除了文字外,也可以把視覺、語音等多模态資訊用來學習一個通用大模型,使用者所表達的問題含義機器模型大緻都可以了解。專用大模型更多的是聚焦某一個領域,例如生物醫藥,那麼大模型将隻懂生物醫藥方面的知識,别領域的了解不如在生物醫藥領域深刻。具體研發或選用哪一種大模型還是要根據實際任務進行選擇。

搜狐科技:有大佬表示大模型并不适用于所有人,您認為企業、機構有沒有必要都去做自己的大模型?為什麼?

聶再清:中國一定要至少有一個大模型可以給咱們中國人用,至于是否每個人都要做,我認為肯定不需要每個人都做,但是在開始階段多一些人一起做也問題不大。随着大模型技術發展,尾部的一些研發機構自然會向頭部機構聚攏,發展的過程可以讓更多人參與思考和學習,那麼也就培養了更多做大模型的人才。同時,競争也會促進大模型技術的不斷更新。

搜狐科技:您認為大模型具備哪些優勢?

聶再清:其實包含兩方面,一方面是開放域的任務完成,之前的閑聊技術(ChitChat)時代發現使用者在與機器聊一段時間後覺得沒意思就不聊了,那現在可能你想幹啥機器都可以幫你完成(雖然還有些回複不能保證準确性)。面對陌生任務,他可以通過之前對于其它任務的學習,來提升對于陌生任務的處理性能,也就是說越來越多通用性的能力出現了。另一方面,是大模型的智能湧現能力,這也正是ChatGPT被認定是重大技術革命的原因之一,對于問題的處理性能會突然有一個加速式的提升,随着參數的增加,其回答問題的準确率也在提升。

搜狐科技:OpenAI創始人阿爾特曼在近期的一場演講中表示,“下一階段并不會以持續增加參數為發展方向,更多的會選用其它的方式增強人工智能的應用性”,您怎麼看待這個問題?

聶再清:這是一個好問題,參數的需求實際和資料量之間是強相關的,如果資料太少,參數太多是沒有意義的。也就是說,當資料量沒有大幅變化的時候,也沒有必要去增加太多參數。我想下一階段增強人工智能應用性的一個很好的方式是從優化算法結構出發。

搜狐科技:您所在的團隊一直緻力于研究所學生物醫藥領域大模型,但您實際上是計算機專業背景出身,是什麼樣的契機讓您選擇了生物醫藥領域的大模型研究工作?生物醫藥大模型能帶來哪些影響?

聶再清:生物醫藥領域是我加入清華後開始做的,是清華非常看重的一個研究領域,但其實生物醫藥大模型與我一直從事的工作領域也是有密切關系的。我之前很長一段時間是在微軟從事學術搜尋的研究工作,現在思考的是如何把不同學術文獻中科學家多年研究積累的知識、結構化知識圖譜、及分子結構蘊含的知識都融合在一個大模型裡,期望利用大模型技術通過分析基因序列等資訊找到藥物靶點(藥物靶點:藥物作用相應位點),進而推進更多新藥物研發的程序,縮短藥物研發周期,為目前無法有效治療的病症帶來希望。

搜狐科技:近期ChatGPT因資訊洩露、造謠産生不少醜聞,馬斯克也簽署聯名信呼籲暫停訓練更強大的AI系統至少6個月,且應及時制定AI強監管政策,您認為這是馬斯克給自己的AI公司争取時間,還是AI真的需要及時的強監管政策了?

聶再清:為AI制定有效的監管政策是有必要的,尤其對于AI可能會造成的重大惡性影響方面是100%需要制止的,但是,目前AI技術總體上都還在控制範圍内,通過對具體的技術和産品提供方提要求都可以對功能進行更改(或暫停某個具體的産品和技術),是以暫停所有AI系統的訓練是沒有必要的。

對于負面事件來說,還是應該歸責到人,承擔責任的應是AI應用的提供者,嚴格的稽核及監管制度是尤為重要的,全球各地監管政策也應根據實際情況差異化制定,這樣才能更好的發展。當然我們還是需要給予AI創新工作一些包容的。在安全可控的前提下,既要鼓勵創新,又要嚴格限制有害創新。

搜狐科技:很多人擔心AI的快速發展會沖擊就業市場,造成大範圍失業,您怎麼看待這個問題?

聶再清:在我看來,一些現有工作的減少是必然的,但技術的進步也會帶來新的工作機會。曾經在人力車時代隻靠人每天拉着車跑,後來随着技術的發展有了汽車,也衍生出了計程車司機、維修工等職業。技術的進步實際上是改變了一種服務模式,但對于人的需求是持續存在的。

搜狐科技:了解到您之前一直在阿裡、微軟這樣的企業工作,并做出了很多産品研發貢獻,請問您為何最終選擇回歸到院校研究機構繼續工作的呢?

聶再清:企業的工作經曆讓我更了解市場對于技術的實際需求,但企業可能會因為業務線的規劃調整會限制一些短期看上無用的科研創新工作,而院校研究機構更為靈活,可以更專注于科研工作,做一些有興趣想做的研究。