天天看點

兩萬字實錄:大語言模型、提示學習與未來科技研發的交彙點

兩萬字實錄:大語言模型、提示學習與未來科技研發的交彙點
大資料文摘受權轉載自AI科技評論

作者丨陳鹭伊

編輯丨岑峰

當在幾年前GPT剛誕生、大模型尚未成為AI的主流方向的時候,一批科學家已經開始探索大語言模型在科研工作中的潛力。

這個方向的第一篇論文來自于生物資訊學領域——早在上個世紀90年代生物資訊學“資料大爆炸”時期,這個領域的研究者就開始嘗試使用人工智能技術來助力科研工作,今天,他們再次成為了這一前沿方向的弄潮兒。

在過去幾年中,大模型技術作為人工智能的一個重要分支,已經從理論研究的深奧殿堂走向了實踐應用的廣闊天地,從實驗室的封閉空間走向了我們日常生活的各個角落。在生物資訊學、材料科學、藥物發現等領域,大模型技術正在發揮着越來越重要的作用。

近期,美國密蘇裡大學電子工程和計算機科學系的校董講座教授許東教授的一篇論文《Iterative Prompt Refinement for Mining Gene Relationships from ChatGPT》上線期刊《International Journal of Artificial Intelligence and Robotics Research》(IJAIRR)。該論文聚焦于大語言模型在生物資訊學領域的應用。主要研究了如何利用大型語言模型(如ChatGPT)來挖掘基因關系,并提出了一種疊代提示優化技術來提高預測基因關系的準确性。

圍繞生物資訊學研究者使用ChatGPT改善工作流程、提高工作效率的新思路,雷峰網舉辦的「大語言模型與提示學習在科技研發中的應用與潛力」線上圓桌論壇,彙集了密蘇裡大學電子工程和計算機科學系的校董講座教授許東、西弗吉尼亞大學微生物學、免疫學和細胞生物學系助理教授胡鋼清、矽谷基金TSVC聯合創始人夏淳、LifeMine 首席資料官于利華等行業專家。他們的見解覆寫了從基礎理論研究到産業應用實踐,為我們提供了一個全面而深入的視角,以洞察這一領域的最新發展和未來趨勢。

許東教授強調了大語言模型在機器學習曆史上的發展的四個階段,即從特征工程、構架工程、再到目标工程,最後到提示工程。他還讨論了大模型在多模态研究、效率提升和新架構探索方面的應用,提出了大模型在資料安全和隐私保護方面的挑戰,強調了大模型在教育領域的潛力,以及它如何幫助學生和研究人員更有效地學習和研究。

作為最早研究ChatGPT應用的學者之一,胡鋼清教授讨論了大模型在科研方面特别是在生物資訊學和醫學資訊學領域的應用,分享了大模型在跨領域應用中的潛力,如在醫學案例中模拟多個專家角色的能力,強調了大模型在了解和生成準确回答方面的能力,以及如何通過優化提示語來提高其性能。

夏淳老師從投資角度分析了大模型的商業價值,包括在提高效率和創造新商業機會方面的潛力,讨論了大模型在金融科技領域的應用,特别是在客服和資料分析方面的潛力,提出了大模型可能對社會和職場産生的廣泛影響,包括新的工作機會和對教育的變革。

于利華老師分享了大模型在生物制藥領域特别是在藥物發現和單細胞資料分析方面的應用,讨論了大模型如何幫助科學家和研究人員更有效地進行研究和發現,強調了大模型在資料安全和隐私保護方面的重要性,以及如何通過技術手段來解決這些挑戰。

以下為本次圓桌對話全文,限于篇幅,AI科技評論進行了不改原意的編輯:

01 背景資訊與嘉賓介紹

許東:大家好,歡迎參加這個關于大語言模型與提示學習在科技研發中的應用潛力的論壇。首先感謝雷峰網、GAIR Live和AI科技評論提供的平台。我是許東,來自密蘇裡大學電子工程和計算機系,主要研究方向是生物資訊學和人工智能。今天我們有四位嘉賓,兩位來自學術界,兩位來自業界。我和胡鋼清教授都是做學術的,我們都是北大畢業的。胡老師目前在西弗吉尼亞大學微生物免疫學和細胞生物學系擔任助理教授,他是最早研究ChatGPT應用的學者之一,ChatGPT在生信科研方面的第一篇論文就是他們組發的。我們的兩位業界嘉賓都畢業于清華,首先是夏淳老師,他是矽谷基金TSVC的聯合創始人。TSVC在美國非常有名,投資了許多像Zoom這樣的公司,成功培育了9家獨角獸公司。另一位是餘利華老師,她是LifeMine的首席資料官,曾在多家生物制藥公司擔任高管,對大模型和機器學習非常關注。我們很高興今天能邀請到四位嘉賓一起讨論這個主題。我先抛磚引玉,簡單介紹一下。首先,大模型是機器學習曆史上一脈相承的發展。機器學習可以分為四個階段:早期的機器學習,我們稱之為特征工程,主要通過人工方式提取特征,如SVM或LightGBM等方法。第二階段是構架工程,主要是經典的神經網絡,如卷積神經網絡,可以直接使用原始特征進行機器學習。第三階段是目标工程,有大量預訓練好的模型,如Bert等,人們用這些模型适應各種應用。第四階段是提示工程,它建立在大模型之上,通過各種提示來操作大模型。大模型本身像一個黑箱,可以使用Zero-shot技術,即使不提供引導,它也能進行預測,或者提供少量例子,這些例子遠不足以構成大規模訓練樣本。如果用工業上的概念來比較,大模型就像電路一樣,經曆了電子管、半導體、內建電路的發展,功能越來越強大;雖然我們隻使用其中一小部分,但同樣的晶片可以在多個地方應用。大模型至少有三個特點:它可以被提示,适用于各種下遊任務,并且具有所謂的智能湧現,能夠像人類一樣進行推理。目前,大模型的研究非常活躍,包括多模态研究,如GPT-4o和谷歌的Gemini,它們可以使用多種語言、圖像、視訊等作為輸入。另一方面,人們正在探讨如何使大模型更快速、更高效。目前,大模型主要基于Transformer架構,其效率與字長呈平方關系,字長較長時效率較低。現在有新的架構探索,如Mamba,它能夠更快地處理,盡量使計算量與線性相關,可以處理多達100萬個位元組。最後,大語言模型本身就是一個作業系統,你可以在上面做很多事情。還有所謂的AI代理,我稍後會講到。大模型可以使用各種輸入,然後産生各種輸出。大模型本身可以被視為一個黑箱,雖然黑箱早年時候常用來批評深度學習,但它實際上有很多優點。我們使用的手機就是一個黑箱,我們不知道裡面的電子元件如何布局,我們隻是與它的界面交流。大模型也是如此。這種交流就是所謂的提示工程,提示分為硬提示和軟提示,硬提示如ChatGPT指定的對話,是單向的,不能修正;軟提示則是可以學習的參數向量。提示學習大模型相比優化的微調模型有許多優勢,尤其是微調模型可能會忘記之前的内容,這被稱為災難性遺忘。提示學習在這方面表現更好。是以,有了提示學習,你不再需要大量的資料、大型模型或強大的計算力,隻需相對較小的資料、模型和算力,就可以進行各種應用。例如這是胡鋼清老師制作的一張圖,可以看到大模型的應用範圍非常廣泛,從基因到教育、程式設計、圖像了解、制藥等領域都可以通過大模型來實作。我們使用的語言模型與一般人使用的有所不同。一般人更多地将其視為聊天工具,而科研應用則更多地依賴于模型作為知識圖譜和推理器。例如,我們使用大模型來挖掘基因關系和生物路徑等。

兩萬字實錄:大語言模型、提示學習與未來科技研發的交彙點

我們的工作發表在《International Journal of Artificial Intelligence and Robotics Research》上,我想推薦這個雜志,它鼓勵發表跨學科的内容,這些内容非常前沿且交叉。是以,我們首先選擇在這裡發表。我們的研究利用了ChatGPT的推理能力,即如何優化提示語。我們發現ChatGPT可以自我優化。例如,在尋找基因關系時,我們首先設計一些提示語,然後在大資料上運作以檢視結果。接着,我們更換提示語并再次運作,将每個提示語及其結果輸入GPT中,讓它進行優化。通過不斷疊代,最終我們得到了非常有效的提示語。例如,我們将“生物心理學家”改為專門研究基因互相作用的分子生物學家,這種簡單的修改就能顯著提高知識挖掘的效率。我們之前隻提到“激活”和“抑制”,他們添加了括号,如“基因1 activates 基因2”,雖然在我們看來這似乎多餘,但這樣的小改動确實讓ChatGPT明白了我們的目的。這主要的作用是讓它了解我們的意圖,我們也使用了更複雜的方法來優化提示語。我第一次聽說這種方法是聽别人講述大語言模型的黑客如何挖掘不應該挖掘的資訊。他們使用了一種技術,即在提示語前加上一段亂碼的ASCII代碼,但大語言模型可以做Embedding,黑客利用這些來注入提示語,挖掘不應該挖掘的資訊。當我聽到這個方法時,我立刻想到,既然這種方法可以用來做壞事,那麼它也應該可以用來做好事。是以,我們使用這種方法進行優化,以提高知識挖掘的效率。這種方法确實非常有效。大語言模型還可以了解圖像,例如GPT-4v,你可以給它圖像,它能了解其中的基因關系。比如這是胡鋼清老師的一個工作,他們通過給GPT一些例子來訓練它識别黑色素瘤圖像,然後它就能判斷給定的圖像是來自正常人還是黑色素瘤患者。大語言模型還可以做很多事情,比如蛋白質結構預測,這是通過将蛋白質轉化為大模型可以了解的語言來實作的。蛋白質就像字元串,與語言類似,是以可以用語言的方法來處理。大模型還可以用于單細胞資料分析,這也是一種語言。單細胞資料就是測量每個細胞中數萬個基因的表達量,你可以想象每個細胞有數萬個基因,就像一句話,如果有100萬個細胞,那就是100萬句話,大模型可以有效地分析這些資料。此外,大模型還可以用于材料設計,例如矽谷一家初創公司Automat Solutions,我給他們公司做顧問,他們的工作就是從大模型開始,自動搜尋需求,比如電池配方,然後找到相關文章,進行資料采集,甚至設計電池配方。

兩萬字實錄:大語言模型、提示學習與未來科技研發的交彙點

材料科學也可以采用類似的方法。目前,人工智能領域最受關注的是人工智能代理(AI Agents)。如果問2024年人工智能技術中哪個最領先,那就是AI Agents。AI Agents的概念是模拟人類如何處理複雜任務。例如,進行資料分析時,人類需要使用多種工具并參考大量檔案。AI Agent模拟人類執行這些任務的過程,可以自動進行,并根據需求和上下文智能地适應各種任務和模式。目前,有兩個著名的架構,一個是LangChain,另一個是CrewAI。我們使用這些方法在生物資訊學領域取得了顯著效果。我已經做了一個簡單的概述,現在我們可以開始正式讨論。首先,我請幾位嘉賓簡要介紹自己以及為什麼對這個話題感興趣。胡老師,你先開始。胡鋼清:謝謝許東老師的系統回顧和介紹。我是胡鋼清,西弗吉尼亞大學免疫微生物和細胞生物學系的助理教授。從去年年初開始,我一直在關注并實踐如何将GPT應用于生物資訊學和醫學資訊學的創新應用。這是我目前非常關注的領域,也是我一直在做的工作,謝謝。夏淳:謝謝許東老師和雷峰網提供這個交流機會。我是夏淳,來自TSVC,這是一家矽谷的美元基金。我們從2010年成立,目标是投資并培育獨角獸公司。我們在AI領域投資非常早,2011年就開始了,那時還沒有大模型。現在,我們認為AI是一個重要的大趨勢,就像當年的網際網路一樣。我們希望抓住這個機會,盡可能多地了解和學習。今天主要是來學習的。于利華:謝謝許教授和雷峰網。我是于利華,目前擔任一家生物技術公司的首席資料官。我從事生物資訊學工作20多年,一直在制藥和生物技術公司工作。我的主要動力是發現新藥來幫助病人。作為首席資料官,我的職業驅動力是如何利用資料和技術提高制藥行業的效率,因為這是一個漫長、複雜且成本高昂的行業。我認為,與工程領域相比,這個行業有很多技術和資料可以帶來巨大變化。20多年的職業生涯中,我見證了每項新技術對行業的巨大影響。AI當然也不例外,我在清華讀碩士時就接觸了早期的AI,包括感覺器,這是卷積神經網絡的前身。從那時到現在,AI已經開始産生實際影響。像ChatGPT這樣的大語言模型,如許東老師所介紹的,有廣泛的應用。從我的角度來看,如何最大限度地發揮其應用潛力,提高我們工作的效率,是我關注的重點。我和夏老師一樣,都是來向許東老師和胡教授學習的。

02 大模型和提示學習:技術、應用方法與優劣勢

許東:好的,我們已經讨論了一些大模型和實際應用的方法。胡老師,你能進一步介紹其他方法嗎?胡鋼清:許老師在您的介紹中已經很好地總結了提示學習的一些方法,例如角色提示,這是GPT早期需要指定角色的方法,而現在的GPT可能已經能夠自我識别角色。還有Chain of Thoughts和Tree of Thoughts,以及一些常用的提示政策。當然,目前大家做得比較多的是上下文提示學習。使用者會提供一段描述,AI會根據這個描述在特定的知識庫中挖掘相應的上下文,然後将這些上下文與使用者的提示結合在一起。大語言模型對這些資訊進行綜合分析,使其回應更加貼合使用者提出的問題。許東:您說得對,特别是在retrieval-augmented generation(RAG)模式中,這種方法确實非常有用,因為它可以根據問題提取資料資訊,并與大模型結合進行處理。現在,提示工程已經成為一個高端職業領域。很多人,甚至大學生,隻要熟練掌握這些技術,就能獲得20萬美元這樣很高的年薪,因為目前這類人才非常緊缺。提示學習的技術有幾十種,我有時也會好奇地觀看相關視訊,了解各種奇特的技術。這個領域值得深入挖掘,因為應用越來越廣泛。夏老師、于老師,你們有什麼補充或想法嗎?于利華:我對應用場景更感興趣,是以對你們兩位沒有什麼補充。夏淳:我一直在關注技術的變化,因為技術發展非常快。我們之前投資了一些項目,但OpenAI的出現讓我們的投資受到了影響。是以,跟蹤技術發展非常重要,它不僅影響科研,還涉及各行各業,為我們帶來了許多新的投資機會。許東:确實,機會和挑戰并存。通用的大模型如ChatGPT能夠完成許多專業任務,這讓很多人發現自己的工作已經被AI取代,而且做得更好。技術确實是日新月異,我每個月都能看到不同的新技術。胡鋼清:不僅如此,GPT本身學習了很多東西,因為現在有多種大語言模型。對于我們感興趣的新領域,以前領域間的壁壘很大,但有了GPT之後,這些壁壘變得更小。它使我們更容易進入一個全新的領域,比如我以前沒做過的圖像處理或診斷。現在我們可以更快地适應,不需要像以前那樣花多年時間慢慢積累。這樣,我們也能更快地了解新興領域的發展。許東:對,是以我們自然地轉入下一個話題,讨論大模型和提示學習的優劣勢。胡老師,您先談談。胡鋼清:我先簡單談談。首先,傳統的機器學習需要海量資料,通過深度學習或卷積神經網絡,可以将精度提高到非常高的水準,比如圖像診斷,甚至超過醫生的診斷水準。有許多産品例如在放射學(Radiology)上實際上已經做到了這一點。第二,傳統的深度學習方法其精度非常高,但在醫學領域,病人通常希望得到解釋。例如,如果告訴病人他們患有癌症,他們可能會問為什麼。這是傳統AI在解釋方面需要突破的瓶頸。而GPT由于學習了大量資訊,如果将其應用于新場景,并且提示語設計得巧妙,它可能隻需要少量示例就能了解問題并給出滿意的結果。這說明大語言模型在提示學習的基礎上,對資料量的需求較低,這使得它能夠解決一些罕見疾病的診斷問題,因為這些疾病的訓練資料對于傳統的深度學習或者其他AI方法來說是不夠的,但GPT具有一定的可能性實作突破。第二點是GPT的可解釋性,因為它能夠像人一樣進行對話,提供預測背後的解釋。雖然這些解釋不一定都正确,但可以作為第二意見的基礎,醫生可以據此進行交流和糾正。我提出這兩點:資料量需求低和可解釋性,是以GPT和傳統的深度學習具有互補性。許東:您說得非常好,我想補充一下關于提示學習的内容。我們最近在一系列工作中使用了提示學習方法,包括單細胞資料分析、蛋白質分析和醫學圖像處理。提示學習的一個顯著優勢是它可以使用很少的資料來解決之前無法解決的問題。例如,在醫學圖像分析中,可能隻需要10個或8個圖像就足以做出判斷。在蛋白質分析中,某些特殊問題的資料非常難以獲得,比如信号肽,可能隻有不到10個樣本,過去這是不可能進行分析的,但現在可以使用提示學習來利用大模型解決這些問題。但我們發現這種模式也有局限性,資料的代表性非常重要。如果樣本數量有限且分布有偏差,那麼結果可能會出現問題,而且很難驗證其準确性。許東:沒有任何一種方法能夠完全取代之前的方法,是以在技術領域有一個所謂的“沒有免費午餐”的定理,意味着在某方面有優勢的同時,可能會在其他方面有所犧牲。到目前為止,機器學習和深度學習仍然如此。于利華:作為工程師訓練出身的,我多年來一直與生物學家合作,尤其是在生物資訊學領域。很長一段時間,我認為生物學缺乏工程領域那種簡潔統一的數學語言,而是依賴于大量的知識積累。這使得該領域的高品質和可重複性一直比較困難。但我認為大模型的出現,無論是大語言模型還是多模态模型,都有可能成為生物學的數學語言。我們很難想象生物學有一個簡單的數學表達,但大模型可以将蛋白質、基因和其他資訊整合在一起,為我們提供一個統一的架構來了解生物學問題,這對工作有很大的幫助,可能是生物學領域的一個飛躍。從這個角度來看,大模型的應用場景非常廣泛。胡鋼清 :同一個問題的回答,它每一次都可能會不一樣,這是因為它是一個機率問題,它給出正确結果的可能性有多大。例如,我設計了一套提示語,得到正确結果的機率可能是0.9,但模型更新後可能變成0.8或0.95。這種不一緻性和不穩定性是需要注意的。許東老師你以前跟我提到一個Ensemble Learning。許東:這個中文叫內建學習,實體翻譯叫系綜,即結合多個模型來整合推理,确實能夠提高穩定性。但我想補充的是,生物學中的發現,這種自由性實際上有助于建立新的假設。例如,大模型有時會産生幻覺,這在計算中被稱為假陽性,是常見的現象。但有人提出,如果完全消除這種幻覺,模型就沒有創造性了。是以,要讓它有創造性,就得允許它犯錯誤,允許它有天馬行空的想法。這兩者并不是要完全消除,而是要找到最佳平衡。于利華:這跟人一樣,需要創造力,有時需要突破已知的邊界,去天馬行空。許東:于老師剛才提到的另一點我覺得很好,就是大模型能夠進行跨界假設。大語言模型做了一件過去人類曆史上沒有過的事情,就是universal embedding,即将不同領域的知識投影到同一個空間裡,在這個空間裡知識之間的關系變得非常明顯,不像在真實世界中那麼複雜。這是通過學習過程達到的,然後能有效做很多事情。是以我認為這是大模型非常厲害的地方,它在某種程度上能夠做到一點通吃。夏淳:我也有同感。我覺得最令人興奮的是,大語言模型就像一個人讀了1000個不同領域的PhD,然後自己内部融會貫通。我比較感興趣的是,有沒有這樣的項目能夠駕馭這件事,引導它綜合不同學科,産生一些特别有意思的新學科或新發現。尤其在生成方面,無論是在科研上還是其他領域,都會跟過去完全不同。我舉一個例子,我們在研發,同時有一個專家在做生産制造的可行性分析,還有一個财務專家在進行财務分析,甚至在金融方面考慮對股市的影響。這些本來是完全不同領域的工作,大語言模型卻能同時進行,這是非常令人興奮的。于利華:夏老師這點講得非常好。我們生信領域相當于早期跨學科的努力,能夠把計算和生物結合起來。我自己在制藥領域帶團隊,一直很關注如何在學術界訓練我們需要的人才。我發現最有效的人才是那些能夠觸類旁通的人。是以我覺得夏老師這點講得非常好,就是最有效的人才實際上是能夠把跨學科的東西結合得最好的。大語言模型已經具備這個能力,我們如何挖掘這個能力是一個關鍵問題。夏淳:對,當然我們也希望許教授、胡教授能夠研究,比如通過Agent,讓它能夠自主地在這方面拓展。一方面我們通過提示詞引導它,激發它跨學科的能力,把一個問題拓展得很寬泛。當然,我相信AI本身也可以進行這樣的操作。這樣一來,我們就離AGI(人工通用智能)更近了,或者說更厲害的AGI可能就會出現。胡鋼清:回應夏老師剛才提到的,GPT這個大語言模型是跨領域的。最近我和許老師開發了一個挖掘GPT潛能的工作。我們發現了一個非常有意思的現象:在同一個對話中,GPT能夠扮演多個角色。我們把它應用到一個醫學案例中,比如一個病人來到診所,描述了他的症狀,最後問了一個簡單的問題:病人缺少哪種維生素?這實際上是考美國醫學職業執照的題目,是一個非常具有挑戰性的問題。我們發現,要回答這個問題,需要綜合皮膚科、消化科和營養師三方面的知識。我們讓GPT模拟三個專家的讨論,然後給出答案。我們發現,如果我們讓GPT隻模仿其中一個專家,它回答正确的可能性大約是50%。但如果讓它同時模仿這三個專家進行讨論,然後給出答案,它回答正确的可能性就提高到了80%。許東:補充一下,大語言模型實際上正在朝兩個方向發展。一個是剛才提到的1000個博士的方向,即向廣度發展。現在還有另一種模型是向深度發展,有人稱之為小語言模型,它非常專業。例如,可能有一個專門針對某個領域的模型,它的訓練資料都是教科書級别的,而不是像現在的大語言模型那樣使用網上的各種資料。這種模型可以非常深入地發展。我最近聽朋友講回國吃飯時,飯館根據客人讨論的方向提供服務。如果有一個更好的語言模型,可能就能做得更好。雖然現有的方式很好,但模型寫的宋詞可能稍顯俗氣。如果模型訓練得更深入,就可能接近蘇轼等大家的水準。是以,另一種模式是小而深的模式。夏淳:這個話題特别值得探讨,因為從投資和創業的角度來看,這樣的機會更多。我們投過一些模型做得很小的項目,比如7B這種小一點的,它做得很專,比如成為最專業的Security專家,比過去的Security product都要厲害的新一代産品。我們也投過一個叫Aizip的公司,它專注于做小模型,甚至微小模型,這種模型可能7B都嫌大,它會做到小到多少個Megabyte就可以放得下,這樣它的影響就是首先它能做得很便宜,可以用在成本很低的單片機上,讓很多裝置具有AI能力,應用範圍就非常廣泛,尤其是在物聯網領域能幹很多事。此外,它的能耗非常小,這對于現在運作大模型時能源消耗很大的問題來說,是一個很大的優勢。是以,大模型有大模型的優勢,小模型有小模型的優勢,綜合在一起,可能通過Agent将它們串聯起來,我個人覺得這可能比AGI的概念更加令人興奮。

03 實際應用:案例、資料安全與隐私保護

許東:非常好。接下來的話題是各行各業的實際應用案例。夏老師已經給出了一個很好的例子,看看大家是否有更多有趣或有啟發性的例子,無論是在生物醫學還是其他領域,比如工程方面的應用,能否進一步分享?夏淳:我先來分享一個。我覺得特别有意思的是許教授參與指導的Automat Solutions的案例,這是我們較早投資的AI項目之一,應用于電池電解液材料研發。從我們的分析來看,它在研發效率上提高了100倍,主要是因為它處理的是配方問題,化學配方的搜尋空間非常大。如果使用傳統的實驗方法,可能需要很長時間才能找到合适的配方。是以,我們當時請教了許教授,是如何利用AI手段,包括強化學習等,處理小資料集的問題,并預測和生成新的配方。夏淳:另一個重要的點是,它必須是一個閉環系統,需要有高通量的實驗室自動化能力。有了實驗室機器人和自動化系統,形成了閉環系統後,我們發現這樣的研發效率比人工高出100倍,這是非常令人興奮的。夏淳:我們還投資了一個類似的項目,是關于氫能源催化劑的合成,可以用AI來合成新的配方,替代稀有金屬。許東:夏老師提到的這些例子非常好。我也很喜歡automat這個公司,他們使用AI的方式非常成功。我參與其中的最大體會是,更多的商機可能在于深入的落地應用,而不是通用模型。通用模型雖然重要,但這個領域的競争太激烈了。許東:我們經常聽說有數百個模型在競争,但最終能存活的并不多,因為就像晶片一樣,不需要很多人來做,一個模型就可以滿足需求。但各行各業都有很多機會,我認為automat的例子表明,要讓AI或大模型成功落地,需要三方面的人才:一方面是電池本身(專業領域)的專家,另一方面是高通量技術的專家,第三方面是人工智能的專家。隻有三者結合起來,才能做得好。而AI本身在科研上,需要這些技術和領域知識的結合,比如生物技術和人工智能的結合,我覺得隻有這樣才能走得更深。胡鋼清:我同意許老師和夏老師的觀點。在生物資訊學的應用中,早期最擁擠的兩個賽道是文本挖掘和藥物發現。文本挖掘的能力非常強,可以挖掘基因間的關系,比如許東老師的工作。在藥物發現方面,也有很多應用,比如食物、藥物和疾病的關聯,藥物間的互相作用,或優化小分子和藥物。這些都是早期做得比較多的領域,現在仍然在做,而且越來越深入。許東:這些都是很好的例子。接下來我們讨論下一個話題,即大模型和提示學習中的資料安全和隐私保護問題。可能很多人已經注意到,如果你上傳的資料,比如公司保密資料或病人隐私資料,被大模型用來學習,這不僅是大語言公司(如OpenAI)可能知道這些資料,其他人也可能挖掘出來。大約一年多前,三星公司的高管使用ChatGPT提問時上傳了公司的一些資料,這些資料可能被挖掘出來,即使與公司無關,但通過特定的提示語可以挖掘出這些資料。這就面臨了很多資料安全和隐私保護的問題。胡老師在這方面做了一些工作,胡老師能否分享一下。胡鋼清:我做的工作相對淺顯,但我認為資料安全實際上有兩個方面。第一方面是使用者資料,使用者擔心資料上傳後,大語言模型界面已經明确告知不會用資料訓練。我們假設它不會用于訓練,但你不知道資料上傳後是否會被挖掘出來。從開發者的角度來看,比如我們基于大語言模型加上自己的知識庫,這是我們投入巨大努力獲得的,我們不希望别人知道。但大語言模型很多是基于提示語的,提示語是一個非常強大的工具,如果使用得當,可能挖掘出這些知識庫。是以對于開發者來說,他們也非常關心資料安全問題。這就像防毒軟體和反病毒檔案一樣,總是一個疊代過程。對于大語言模型,我也做一個類比,它也有殺毒和反殺毒的問題。夏淳:我也介紹一下,我們最近看到的一些有趣的項目,我們最近看到一個專注于安全的項目。他們非常關注我們今天讨論的提示詞問題,因為現在他們專門研究如何使用提示詞進行攻擊。除了挖掘出你原來的學習資料,它還可能在一定程度上破壞你原來的訓練模型,産生惡意結果。是以這些事情已經有人在研究了,作為攻防,也要設法防範。據他們講,現在多多少少還是修修補補,還是有一些辦法在一定程度上控制,至少能夠報警。但這個市場實際上非常動态,因為模型本身一個月一個樣,變化很快,原來的一些安全漏洞可能過一段時間就不存在了,或者又出現了新的。使用者使用的情況也是千差萬别,因為比如他們使用了RAG,添加了很多内容,實際上又帶來了很多新的安全風險。這些邊界變得非常模糊,是以可以看到它是一個非常動态和動蕩的市場,基本上是這麼個情況。許東:對,這與過去的網絡安全非常相似,是一個不斷攻防的過程。在網絡安全領域,有所謂的紅隊和藍隊,不斷進行網上的競争。大模型的引入也是如此,現在利用大模型進行惡意操作的人也越來越多。例如,最簡單的情況,可以注入觀點或影響投票等,這些都是可能的。這雖然與科研關系不大,但科研中最關注的是知識産權可能會丢失。例如,使用ChatGPT時,資料可能會被用于學習,而其他人也可能挖掘這些資料。現在ChatGPT提供了本地版,可以在内網中使用,這樣所有資料都不會外洩。這當然是一種相對保險的方式,至少不會丢失資料。但一般的應用程式确實還面臨着隐私等問題。例如,現在醫院不太願意使用ChatGPT,因為病人的資料上傳到ChatGPT後,無法保證隐私安全。這些可能都是需要進一步研究的問題。于老師,您有什麼補充嗎?于利華:我沒有補充,隻有一個問題。我不知道我們的讨論是否有點像早期雲計算剛出現時的情況。以前大家都有自己的伺服器和存儲,依靠IT部門的安防能力。當大家開始進入雲計算時,很多人擔心這不安全,資料不在防火牆後面。但後來,随着雲計算成為主流,安全責任轉移到了雲服務公司,由他們來保證我們的安全。是以我也認為,大語言模型可能也是這樣,幾乎不可能不使用大語言模型。那麼對于安全和隐私的保護,是否會在更高層次上不斷提高,而不僅僅是依靠個人不傳輸敏感資料。雲服務公司可能會開始提供一定級别的安防能力。夏淳:我相信這一定是一個發展路徑。另外,現在一些小模型也出現了,邊緣計算用的硬體也越來越便宜,可以運作一些不太大的模型,是以完全可以在本地使用私有模型,這也在一定程度上緩解了安全問題。許東:對,我也說兩句。我認為大公司,如OpenAI,其實做了很多工作。例如,早年用于挖掘知識的提示語,現在不太好用了,因為OpenAI已經攔截了很多這種攻擊,是以它有一定的安全性。當然,正如我剛才所說,黑客使用的這些技術有時确實是創意性很強,例如,他們可能通過亂碼來擾動模型,使其吐出有用的東西。這些東西确實非常神奇,我不知道他們是怎麼想到的,但從某種意義上說,這有點創新。但一旦這種創新被發現,就會有防禦手段,是以會不斷疊代。胡鋼清:我想說,大語言模型的攻防可能與過去網絡防毒軟體開發的情況有所不同。如果你要編寫黑客代碼,首先需要知道如何程式設計,甚至需要了解彙編語言。但在大語言模型中,提示語可能降低了門檻。反過來說,做大語言模型的防範或資料安全可能比傳統的防毒軟體更具挑戰性。有時就像許老師說的,用一段亂碼,可能就不知道怎麼想到的。或者一個非常詭異的句子,就能夠從你的背景挖掘出你辛苦建構的提示語,确實有這樣的例子。許東:理論上講,大模型的參數特别多,意味着它的容量特别大,是以你訓練的資料幾乎都能夠原封不動地挖掘出來。這與過去的機器學習模型不同,訓練完成後,你無法還原訓練資料。而大模型很可能會還原大部分資料,是以訓練的資料就面臨這個問題,是以相對來說比較嚴峻,比傳統的機器學習更具挑戰性。

04大模型的商業價值與社會職場影響

許東:我們接下來讨論下一個問題,關于商業方面的問題,主要是想聽聽夏老師和于老師的看法。首先,關于大模型在商業方面的應用,無論是科研還是商業價值創造,我們聽到了不同的說法。一種說法是,像AI Agent這樣的大模型在全球500強公司已經廣泛應用,大大提高了效率。當然,也有人認為AI看起來炫目,但實際上創造的價值并不多,更多是表面光鮮。我想聽聽夏老師和于老師對這個問題的看法。夏淳:我對這個問題很感興趣,我也一直在思考我們有什麼好的投資機會。是以首先,我認為現在還沒有達到大家預期,是因為存在很大的AI泡沫,有些過度炒作。炒作的特點是大家都在過度承諾,總覺得智能已經發展到不得了,甚至要毀滅人類,這太誇張了。我認為這些都是無稽之談。是以很多預期超出了現實,或者說與現實不比對,隻能說我們現在的實踐還沒有做好,但将來一定會非常有用。我們認真思考過,它會創造什麼樣的商業價值,是什麼樣的路徑。在這條路徑上,我們等待它就可以了,看它如何變現。第一波,我們看技術發展的曆史,第一波幾乎都是提高生産力,先是做工具的。很明顯,我們現在使用ChatGPT也是為了幫助寫稿子、糾正英文的錯别字和文法錯誤,這是很直接的利用。第二波,我認為是現在正在做的,我們看到很多公司正在做的就是Copilot。現在還沒有能力完全替代人,但在垂直領域裡可以訓練一個特别精準、高品質的模型,然後做成Copilot。當然,我們已經看到寫代碼的例子,能做的還有很多。我們也可以了解,這種Copilot可以用于所謂的嵌入式智能,與機器人結合在一起,那也是蠻神奇的,但它并不是智能到可以完全取代人。這是一類,我們認為這是第二階段的事情。第三階段是Agent已經用得比較好,那麼實際上它已經達到相當多的智能,不僅僅是一個模型在起作用,可能是多個模型通過Agent組織得比較好,這樣針對一類問題的自動化和智能化程度就比較高。比如現在發展比較快的,大家做得比較用心的,就是售後服務、客服,即CRM領域。這個領域資金多,從業人員多,發展就會比較快。你自己可能也有體驗,比如與保險公司或醫院打交道,就會發現這方面的智能提升得特别快,因為它把很多能力都聚合在一起。我們也看到一些我們投資的機器人項目,比如在農業方面的應用,它也是把綜合的智能能力放在一起。從商業價值來講,它真的就價值很大,很容易賺錢,因為它在很大程度上開始替代人力,解決勞動力短缺問題,尤其是那些不太好招人的工作。但有一點要注意,往往那些體力活、藍領工作,其實難度比我們想象的要大很多,反而是白領工作,包括科研、PhD等,可能更容易被AI替代。我們預測,接下來的第四階段或第五階段,就是它從工具逐漸演化,這是一個演化過程,最終演化成一種新的生态。因為有那麼多的智能體,它們能做的事情很多,這些事情超出了我們今天的想象。至于它們會做出什麼,比如在科研上會有什麼成果,我們現在無法預知,我們隻能通過曆史來回答。我喜歡引用印刷術的曆史,比如在西方,古騰堡發明了印刷機,他首先用來印刷聖經,這個技術的發展促進了新教的興起。一開始,印刷機作為效率工具,替代了教堂裡抄寫聖經的神父,使得聖經能夠大規模印刷。但我們談論的最終範式,即範式發展最終形成新的生态,是沒有人預料到的,比如報業、媒體和新聞行業。一開始,人們沒有想到這些,但我們沒有預料到的是,比如報業,我們去過赫斯特城堡,看到他的财富,他通過報紙行業積累了巨大的财富和影響力。這些事情對社會的影響是深遠的。我們今天可能看不到,但可以推測和推演,這些恰恰是最激動人心的。包括我們今天讨論的科技,一旦AI在科研中發揮作用,未來的科研會是什麼樣子,有很大的想象空間。我們也預期這樣的生态的産生,它将對科研圈子、文化産生颠覆性的影響。于利華:我想接着夏老師的話說,首先,我認為現在的大語言模型和AI實際上有點像基礎設施,比如電、網際網路、雲計算。雖然它們最初可能隻有有限的應用,但因為它們是基礎設施,我們無法完全想象在它們之上能建構出什麼。對于科研的影響,現在還為時尚早,但我可以分享一些我們的親身體會。在生物資訊學領域,我覺得現在的AI和大語言模型有點像深度測序剛出現時,大多數人還在使用微陣列技術進行基因表達分析。當時,人們不确定是否應該進行深度測序,因為它既昂貴又缺乏分析人才。但顯然在幾年後,這不再是問題,深度測序的速度、精度和人才的普及使得它成為非常基礎的技術,并對生物醫學和制藥領域産生了巨大影響。是以我認為,大語言模型在我們的領域落地更像是在深度測序的早期,有人開始使用,有人猶豫不決,有人甚至認為它可能不是真正需要的技術,但我認為它的影響一定會越來越大。具體來說,我們自己的例子,因為我的團隊是資料科學家,我們都知道,一般資料科學家很大的一部分的工作是清洗和對齊資料,資料對齊後才可以做分析。那麼我認為,有了像Copilot這樣的工具,包括直接使用ChatGPT,很多基礎工作可以用很少的努力完成。那些有洞察力的人,知道如何使用、解釋、了解并将其轉化為知識和下一步行動的工作将更有價值。我認為這将對行業産生很大影響,絕對會極大提高效率。誰用得好,哪個組織能夠真正将其結合到内部工作中,我認為将會産生很大的價值。許東:你們說得都非常好,我覺得兩點很重要。首先,最終的影響可能是我們無法想象的,因為AI仍處于爆發期,還沒有看到它逐漸變冷,而是在持續發展。是以它最終的影響可能是我們現在無法想象的。第二點是,影響的過程可能是曲折的,而不是直線的。過去的技術發展也是如此,比如雲計算。我知道最早的雲計算概念實際上是Oracle提出的,他們認為你不需要在筆記本上安裝任何東西,一切都可以在雲端完成。但當時這個概念差點讓公司破産,因為當時的基礎設施不比對,而且這個想法可能太超前了。是以我認為AI的長期影響絕對是巨大的。但這個過程可能是曲折的,在這個過程中,可能很多公司或個人不僅沒有受益,反而成了先烈。現在一些上市的AI公司,尤其是生物領域的,有些都快破産了。這是一個曲折的過程,但我認為最終會有巨大的正面影響。我們可以讨論下一個話題,即大模型對職場的沖擊。我們聽到了一些說法,比如程式設計人員的沖擊,原來可能需要100個人編寫程式,現在可能20個人加上AI就足夠了。這在程式設計領域非常明顯,包括現在計算機專業的學生找工作也比往年難多了。大模型可能也會沖擊其他領域,比如剛才提到的簡單資料分析師,如果隻是做資料清洗或簡單的資料工作,包括統計工作,這些人可能都會受到一定的沖擊。那麼在職場上,比如做大資料的人,如何适應這種情況,或者如何轉型和應對?不知道大家有什麼想法。于利華:我對我的團隊的指導一直是,一定要把自己的價值建立在從資料中挖掘出知識和洞察,并将其轉化為行動,而不僅僅是程式設計或計算。這是至少從比較簡單的層面上的指導。但如果從整個行業或不同行業來看,那些隻走量不走心的工作将會越來越少。夏淳:于老師這麼講我覺得很精準,走量不走心。因為走量的事情,AI做得比人好太多。于利華:還不出錯。夏淳:未來對人的技能要求将會不同。我們也讨論過教育的影響,大學甚至需要重新定義,很多老師可能不再需要,用AI做老師可能比現在的老師教得還要好。這些問題都很有趣。我們還在探讨它會産生一種新的生态或新的範式,整個世界都會改變。這種變化将帶來更多的機會,尤其是對年輕人來說,他們需要敏銳地捕捉到這些變化。一旦變化發生,職場上就會出現很多新的職位。夏淳:作為投資者,我們密切關注這一領域,看看有什麼新的東西出現。因為很多東西在影響巨大後,它的市場體量就擺在那了,可能市值達到數十億甚至數百億美元。這些都是我們關注的機會。當然,要确切地說會出現什麼東西是很難的,除非我們能穿越時空。我們很難畫出未來的路徑,例如我們經曆過網際網路的發展,回到1993年在UIUC使用Mosaic,那時世界上隻有三個網站,當時我們很難想象未來的網際網路會發展成什麼樣子,包括現在的社交媒體等。是以,我們隻能緊跟潮流,捕捉每一個變化中的機會。許東:你舉的例子非常好,我當時就在那棟樓裡。Beckman Institute五樓就是做這個的,當時他們做了第一個浏覽器MOSAIC,剛做好就馬上給我們樓裡的人用,是以我是全世界最早接觸這個浏覽器的幾十個人之一。我當時就覺得這個東西很好,但沒有想到它會有這麼大的影響。我當時想,這個東西很好,我們以後做科研,大家傳資料或者展示科研成果會很友善,但沒有想到它會帶來整個行業的天翻地覆的變化,包括現在的社交媒體等,完全沒有想到。是以我認為現在可能也是這種情況,雖然已經有很多應用了,但可能還有很多我們沒有想到的應用。夏淳:基本上我認為局面就是這樣,我們經曆了幾輪曆史重複。現在我們隻是看到了冰山一角,隻是一些工具層面的東西。我個人認為,更感興趣的是社會層面的變革,這将更有意思。因為AI太智能了,很多事情都能計算得非常清楚,包括戰争,現在都不需要真人參與,全是機器在操作。這種格局的變化對社會的影響是巨大的。于利華:另一個社會變革的角度是,大模型或AI能創造出什麼樣的嶄新工作機會。當解放出這麼多白領工作時,可能會對社會生态産生巨大變化,這些變化可能與大模型無關,但卻是全新的領域。夏淳:對于職場的影響,可能我們聽衆中有很多年輕人在考慮這樣的問題。于老師也提到,不要隻把自己定位在工具人上,而應該更多地走心。我比較主張更多地關注文科,因為未來能夠駕馭AI的,可能更多是具有良好文科基礎的人。當然,我指的文科是非常深入的,比如社會學、人類學,最好能深入學習哲學。今天看哲學似乎沒什麼用,但未來可能你會用哲學與AI進行交流。于利華:是以夏老師您的意思是,未來的大學或研究所學生教育将回歸最初大學教育的目的,即博雅教育,而不是職業訓練?夏淳 :對,是這樣。因為職業訓練可能有點像科幻電影《黑客帝國》裡的場景,你可以通過下載下傳來掌握技能,這不是難題。于利華:對,當年大學或學院的建立目的,是為了訓練社會領袖,進行博雅教育,而不是職業訓練。夏淳:對于老師這麼描述非常好,我認為人類社會的發展可能會朝這個方向走。我們經曆了工業革命的幾輪變化,從機械到電氣,再到電子,再到網際網路和AI。這個過程非常清晰。我有一個堅定的觀點,真正的進步是技術進步,技術是實實在在的,它帶來了過去沒有的東西,然後直接影響社會。有趣的是,作為個體,我們如何定位自己?胡鋼清:我想補充一點,聽衆中可能有些計算機或理工科的學生,可能會問,既然AI程式設計這麼好,我還要不要學程式設計?我認為學程式設計仍然非常重要,有兩個原因。第一,程式設計訓練思維,如何思考,這有助于你更好地了解大語言模型背後的思維。第二,如果我們完全依賴機器來程式設計,那麼最優秀的那些程式可能都是由懂程式設計的人編寫的。我的實驗室有一個例子,我讓我的一個研究所學生幫我實作一個疊代算法,他已經有程式設計基礎了。我告訴他算法,給了他一個調試時間。上午說完,中午他就給我結果了。我問他怎麼這麼快,他告訴我他是用GPT寫了一個架構,然後在此基礎上修改的。如果這個學生不懂程式設計,可能需要一兩周才能拿出結果,但現在他半天就完成了。是以,程式設計一方面可以訓練思維,另一方面可以更好地與大語言模型AI協作。夏淳:在胡教授的基礎上,我再發揮一下。可能胡教授的意思是,如果你隻是泛泛地學一點程式設計,會幾種語言,想靠這個混飯吃,以後可能就不好混了。是以你需要精通,需要深入了解。我們都是學這個的,知道需要學習一些課程,比如編譯原理,甚至它背後的數學原理,以及程式設計語言的曆史和設計思想。掌握到一定程度後,你會感覺自己開始向大師級方向發展。在這種情況下,你使用AI工具的層次就比較高了,至少你可以和AI對話。否則,AI做出的東西你都看不明白。許東:是的,從教育學角度來看,AI确實對一些職業産生了很大沖擊,但同時也産生了許多新的行業機會。從教育角度來說,我們如何培養人去把握這些機會,或者一些聽衆,比如學生,如何準備自己,能在這種浪潮中成為成功者。這與以前不一樣,比如我們要培養交叉學科人才,比如生物資訊學領域,需要學計算機、統計、機器學習、生物學等。但有了大模型後,你不一定非要每個領域都學幾門課,因為大模型本身就能教你很多東西。是以,現在的人才培養可能與過去不同,不一定非要一樣的模式。過去需要在所有學科上打好基礎,但現在更多的是你能如何思考問題,就像于老師講的,不一定要走量,要走心,真正能夠善于發現問題、思考問題和解決問題的能力。在大模型時代,這可能與過去的教育方式有所不同。是以,我在想這些事情,當然也沒有很好的答案,看看大家有什麼進一步的想法。夏淳:我剛才已經說了,多學一些文科的東西。因為文科東西應該說是大模型的短闆。你不要以為大模型現在能夠寫詩、畫畫,跟人還是不一樣的。人有很多靈感型的東西,這些是無法用語言表達的,大模型無法學習,因為它需要一個token stream,需要一個語言過程。是以,文科内容給我們留下了巨大的空間。于利華:還有,從科學人才訓練的角度來看,現在的培養比較注重特定技能,比如生物資訊學、要學統計或程式設計。如果這些技能在大語言模型上可以快速達到基礎水準,那麼人才培養可能更應該回歸到如何訓練科學素養,如何訓練科學方法論,如何提出問題,和如何應用技術解決問題。許東:對,這一點,甚至大模型可能能幫助這件事。比如哈佛的一門課叫CS 50,這門課是教程式設計的,全球有幾百萬人在學,我兒子參加了他們助教Copilot的開發。因為ChatGPT,你問它程式設計問題,它馬上就告訴你答案,相當于作弊。但他們現在訓練這個模型是不直接告訴你答案,而是啟發你,就像真正的助教一樣,循循善誘。是以我覺得,大模型在教育上可能不是說給人答案,而是幫助人思考,這方面可能有很大的潛力。胡鋼清:許老師你說的那個東西好像上個禮拜被Nature推薦了。我前兩天看到《自然》雜志的一篇新聞觀點文章,讨論了大語言模型在校園中的應用。許多學校正在考慮或已經将大語言模型引入課堂。其中提到了許老師剛才說的那個工具,大概有一兩段被特别強調。如果要考慮哪些專業可能受益,我有兩個建議。一個是動手操作的專業,比如手術需要手感,而GPT沒有手感。第二個是與人打交道的專業,目前我還沒有看到GPT能替代這些領域的可能。05Q&A

許東:現在有20分鐘時間來回答一些問題,大家可以進一步提問,我們來依次讨論這些問題。第一個問題是關于大模型的應用,尤其是科技領域的應用,似乎主要是中國和美國在使用。日本人、德國人、法國人和俄羅斯人的大模型應用有哪些?德語被認為是世界上最精确的語言,用德語來應用大模型是否會更好?胡鋼清:大語言模型的使用可能并不廣泛,即使是在學校裡,使用大語言模型的學生也不一定很多。可能是因為他們沒有接觸到,或者不知道如何使用,或者對這個有排斥。有一個現象叫做AI羞恥,就是人們可能不願意使用AI。至于德語是否是最精确的語言,以及用德語的大模型是否效果更好,這取決于訓練集。如果英語的訓練集更全面,而德語的訓練集有限,那麼德語模型的效果也不一定更好。許東:我同意胡鋼清的說法。大模型的應用确實主要是中國和美國在做,其他國家也在關注這方面的重要性。例如日本,他們從其他國家引進了一些大模型,是以還在追趕中。我相信這些國家最終會使用得更多,但他們對這種模型的貢獻可能不會特别多。加拿大是一個例外,除了中國和美國之外,加拿大在這方面非常活躍,因為加拿大有一些大牛,比如Joshua Bengio等人,他們在大模型方面做得非常好。許東:德國、法國在生物資訊學領域也有一些非常好的應用,比如蛋白質方面的模型。但總體來說可能不是特别活躍。至于語言問題,德語确實更嚴格,早期科學德語似乎是必學的。但在大語言模型時代,資料為王,語料是第一位的,德語的語料絕對比不上英語。是以我認為德語的大模型并沒有太大優勢。第二個問題是,如果大模型的推理引擎遇到大模型了解不了的問題,如何幫助大模型了解我們的問題?胡鋼清:如果大模型了解不了,可能是因為我們沒有把問題講清楚。是以可以嘗試換一種方式陳述問題,有很多方法。比如許老師在幻燈片裡提到的,可以先問一些相關問題,不要一開始就問主要問題。可以先分解問題,或者加上一些上下文,這樣大模型可能更好地了解。當然,如果大模型有短闆,有些問題可能确實解決不了。許東:對,剛才提到的提示工程,這種技巧有幾十種。如果大家有興趣,可以找到很多視訊和課程,有的課程長達十幾個小時、幾十個小時,專門講述這些技巧。當然,另外一點,剛才胡老師講的,我們需要分段地、通過訓練來引入,這與直接使用一個技巧不同,可能需要進行很多機器學習訓練,才能讓模型了解我們。許東:說到ChatGPT,在這方面它本身就很強。在所有模型中,ChatGPT在了解問題方面遠遠超出其他模型。我們不說答案本身如何,如果了解問題是一個輕量級的标志,那麼ChatGPT的情商在所有大模型中是最高的,這是毫無疑問的。看看大家有什麼補充。于利華:補充兩點,一是許老師的這篇文章裡的Meta-prompting,這是一個很好的學習案例,展示了如何将問題提得非常具體、精确,以促使大模型給出更好的答案。二是許老師用了情商這個詞,我在與ChatGPT互動時,感覺可以将其視為一個知識豐富但專業經驗未必很強的合作夥伴。與這樣的合作夥伴合作時,類似我們與任何人合作都是一個不斷調整自己如何與對方溝通交流的過程,也類似布置任務,以獲得最符合要求的結果。是以,可以将大模型視為這樣一個合作夥伴,知識豐富但可能專業經驗不足,通過調整與它的互動,也就是Meta-prompting的過程,使其不斷提供更符合要求的結果。許東:确實如此,因為我每天都使用ChatGPT處理各種事務,發現與它的交流其實與人交流很相似。比如你對他客氣,多鼓勵他一點,不要覺得他是機器就可以冷面對待。你就像對待一個人一樣,比如請他做什麼,然後他做得非常好,你還鼓勵他,感謝他,然後再提問,你會發現效果确實好很多。這就是ChatGPT,它在模拟人的行為,包括禮儀等。于利華:我看到您的Meta-prompting時,感覺就像我招了一個剛畢業的人來工作,還沒有經驗。Meta-prompting就像我給他布置工作時,越具體越好,這樣新手上手就會越快地提供符合要求的工作。但如果一個人跟我工作了5年、10年,也許我隻需要一句話,他就能提供我想要的結果。這是一個過程,你把它當作一個經驗豐富、有技能,但與你還沒有很深合作關系的夥伴,不斷細化與它的交流。胡鋼清:對,我同意許老師的觀點。我個人經驗是,與GPT打交道時,我把它當作一個學生,這個學生能力非常強,不太容易惹你生氣,會讨你歡心。他要做什麼事情,一定要給他指導,放任是不行的。指導後,他的工作效率會非常高。我把它當作一個勤奮好學、知錯就改,會用各種方法哄你開心的學生。許東:對,下一個問題。實驗生物學家想轉行到生物資訊學,大語言模型的出現是提高了還是降低了學習轉行的門檻?另外,有沒有調查報告,有多少生物資訊學家開始使用GPT或類似引擎?大家有什麼想法。于利華:我覺得門檻肯定降低了,但另一個問題是你是否還需要轉型。因為生物資訊是一個非常有力的工具,以前如果你是一個實驗生物學家,但缺乏資料分析能力,不會程式設計,那你就是瘸了一條腿,需要找一個生物資訊學家作為合作夥伴。現在這種情況下,你還需不需要轉型?我覺得這可能是更重要的問題。你可以很容易地獲得一些技能,為什麼還要轉型?許東:我非常同意這個觀點。進入這個領域的門檻确實降低了,但生物資訊這個行業的職業門檻會越來越高。也就是說,能吃這碗飯的人,以後的要求會越來越高,而不是像過去那樣。過去可能隻需要跑幾個pipeline就可以吃這碗飯,但現在有了大模型,不需要這麼多人做了,是以這個行業的整體要求也在提高。是以不能刻舟求劍。我也同意,除非你有很大的決心轉到這個行業。許東:确實,我們這個行業還是挺好的,但如果隻是想做一些簡單的分析,那現在普通的生物學家也能做,那你不做實驗,那就可能不行。是以我非常同意這個說法。另外,關于有沒有報告說多少生物資訊學家開始使用GPT,我不太清楚這種報告,但我知道的是,我知道的做生物資訊的人大部分都在使用這個東西,不用的人可能非常少。胡鋼清:對,我認識的基本上都在用。當然,對于生物資訊學家有沒有專門的調查問卷,或者已經發表出來,或者已經可以公開看到,我不确定。但是有一些調查問卷是針對普通學生的,從那些調查問卷上看,即使是普通學生使用的人也比較多。許東:對,下一個問題,就是GPT在其他領域,例如金融科技目前有什麼好的應用?大語言模型賦能金融科技最核心的方向和思路是什麼?夏老師你可能最有發言權了。夏淳:我們看到了一些第一波的應用,比如知識庫類型的,主要是工具型的服務,尤其是客服,金融銀行的客服總是第一波上的,因為它能迅速替代人工,回答更精準。包括沒有各種稀奇古怪的口音,這是上得最快的。再往後,它怎麼能夠進入金融交易環節,現在感覺還遠一些,但有人正在考慮。我也在想,一定程度上,它是否會改變投資圈,甚至金融圈的人。如果真的要換,社會也會變得很不一樣,但這個過程我相信會發展。比如有了Agent後,個人的财務Agent怎麼幫助理财,這些都會有新的變化。于利華:夏老師,您怎麼看?比如分析師,他們很多工作是收集資訊,整理成報告。夏淳:分析師屬于第一波被影響的,現在比較慘。一些專業其實挺初級的,這些首先是被取代的,尤其對分析師,我覺得特别精準,現在用GPT出的報告比人工做得好。許東:下一個問題,各位老師能不能介紹一下在用大語言模型加快藥物研發上的好應用和實踐?于老師你可能有發言權。于利華:如果大語言模型,我們把它用得更廣一些,比如蛋白大語言模型,我覺得像設計抗體、蛋白藥物,David Baker大家都很熟悉。還沒有到臨床,但我覺得這是遲早的事情,因為蛋白質序列就是一個語言。包括很多初創公司在做,我覺得蛋白大語言模型設計抗體、蛋白藥物可能是一個有前景的領域。當然,ChatGPT也開始應用,我知道的一些制藥公司,他們也确實把它應用到不同方面,是在各個方向、各個階段都在嘗試運用它。在研發階段,比如有很多工作是跟文本打交道,跟論文打交道,我們也面臨像剛才講的automate這樣,你怎麼知道哪個是你的好的靶點?需要大量閱讀文獻,是以我覺得大語言模型在整理文獻、綜合發現方面,實際上是把我們的效率有了巨大提高。胡鋼清:我給學生們一個建議,我們時常擔心會不會被替換掉。我上次在學校做一個報告時,有老師問,醫學生會不會被替代掉。我說我不擔心他們會不會替代掉,我先考慮一下我自己會不會被替代掉。但建議是,無論你走到哪個領域,會用AI和不會用AI的差别很大,是以會用AI的可能會替換掉不會用AI的。于利華:還有一點,我覺得長期來講,人的職業生涯就是一個不斷學習的過程。我們做生信的,當年在學校學的和現在做的差得非常大。是以我覺得是一個不斷學習的過程。許東:好的,所有問題都回答了,也到時間了,是以我們可以結束了。再次感謝雷峰網、GAIR Live和科技評論提供的平台,也感謝各位嘉賓,也感謝聽衆參加我們的讨論。謝謝大家。

兩萬字實錄:大語言模型、提示學習與未來科技研發的交彙點

租售GPU算力租:4090/A800/H800/H100售:現貨H100/H800

特别适合企業級應用掃碼了解詳情☝

兩萬字實錄:大語言模型、提示學習與未來科技研發的交彙點
兩萬字實錄:大語言模型、提示學習與未來科技研發的交彙點

繼續閱讀