天天看點

對話第四範式戴文淵:通往AGI的路線,是把所有軟體改造一遍

作者:36氪

文 | 蘇建勳

如果你抱着“圍觀炫技”的念頭觀看人工智能公司「第四範式」最近的釋出會,或許不會感受到獵奇般的興奮。事實上,在創始人戴文淵的籌劃裡,他就沒打算讓聊天、畫圖、寫小說、寫代碼這類To C式的噱頭成為第四範式頭頂上的标簽——盡管多數AI公司都對此樂此不疲。

對話第四範式戴文淵:通往AGI的路線,是把所有軟體改造一遍

“式說”大模型的寫代碼示例;圖檔來自第四範式

4月26日,第四範式首次展示其大模型産品「式說3.0」,在半個小時的斷網環境下用畫飛機、寫代碼秀了下模型肌肉後,戴文淵抛出了他認為的“更重要的事”:

“今天更重要的,是想跟大家分享我們要做的事情:用生成式AI重構企業軟體,我們稱之為AIGS。”戴文淵談到。

AIGS(AI-Generated Software),戴文淵将其定為第四範式的核心戰略,也是這位曾經的ACM世界冠軍、百度最年輕的T10科學家、江湖人稱“戴神”的AI獨角獸公司CEO,為2023年的這波AI浪潮,交上的第一張答卷。

“這次的變化很難估計是多少萬億的市場,大家都有機會。”談及熱潮洶湧的AI領域,戴文淵對36氪表示,而他眼中屬于第四範式的機會,來自于中國軟體市場的特殊生态。

一個直覺的感性認知是,國内B端軟體在體驗上乏善可陳,“我們公司的報帳系統也挺難用”,戴文淵坦承。在他的理想中,相比在系統菜單欄逐個點選的報帳動作,如果能給軟體安上生成式AI的心髒——用Chat的方式說“我要報帳”,把票拍給系統、識别出餐票、詢問用餐對象,得到回複後完成報帳——這種體驗顯然比現在的報帳系統要強得多。

不論是内部OA、ERP、CRM,還是外部業務管理軟體,上述可以被AI優化的場景不勝枚舉。

比如物流,區域經理想知道某個快遞員上周有沒有偷懶;比如工廠,工廠中的房間主任想知道流水線有沒有違規操作——在過去,他們要從密密麻麻的Excel表格、監控視訊等資料庫中找尋蛛絲馬迹,但現在,隻需要在“式說”的對話框中提問:

上周朝陽區有哪些快遞員送件量在2000以下?

近三天工廠裡有沒有出現過違規操作?

如同搜尋引擎的一個問答瞬間,“式說”就能依據企業的快遞員當班/發件資料、工廠流水線視訊監控記錄……找到問題的答案。

“企業都有這些資料,但你不能要求一個區域經理會操作資料庫,如果用更加自然的互動方式,其實可以很好地幫助企業管好團隊。”戴文淵對36氪表示。

對話第四範式戴文淵:通往AGI的路線,是把所有軟體改造一遍

“式說”在裝配集裝箱的應用示例;圖檔來自第四範式

不過,隻有使用者體驗還不夠。第四範式敢于提出AIGS的另一原因,是AI對于軟體開發效率的極大提升。

由于人力成本不高,國内To B軟體有着“定制化”的夢魇,軟體商們被一個個菜單式的需求所困,靠髒活累活掙着“人/天”費用,稍有項目失控,就會面臨企業盈虧的失衡。

而生成式AI的革新,正是打破原有菜單式的軟體互動,轉而将重點放在算力、資料端的更新,面向使用者的,僅是一個幹淨簡潔的對話框。

“轉變為AIGS的商業模式後,開發功能點就不用很長時間,隻要你的軟體還在使用,就能持續不斷獲得算力的收入,對軟體公司來說,是一個特别大的商業模式革新。”戴文淵對36氪說道。

如何落地AIGS?戴文淵用了“修圖”的場景,将其路徑總結為三個階段:

第一階段,Copilot(企業AI助手)調動不同的資訊、資料、應用,作為助手完成使用者的指令。相當于在所有企業級軟體系統裡,配備一個指揮官。指揮官聽使用者的指揮,比如“把照片亮度調亮20%”。

第二階段,Copilot+基于企業規則的“知識庫”,AI能夠參照規則做複雜工作,進一步豐富「對話框」的能力。比如AI查詢了“人像美化”知識庫後,能執行把照片修好看的步驟。

第三階段,Copilot+COT(思維鍊)。軟體系統的使用行為最終會被大模型學會,形成AI針對這個領域的思維鍊,意味着“把照片處理得更好看”這種複雜指令,AI能自動按照步驟完成。

總結來說,在第四範式的“式說3.0”大模型産品中,COT代表思維推理能力,讓機器從“圖檔調亮20%”的單點步驟,進化至“把圖P好看”;而Copilot則把人的指令翻譯成要調用背景的哪個API,兩者相結合,才能賦予企業軟體新的互動形式。

在談到第四範式帶來的軟體革命時,一位國産工業CAD廠商代表難掩興奮:“第一次看到的時候還是蠻震撼的”。

他分享了幾個場景:将“式說”模型嵌入内部工具後,可以通過多模态的形式迅速從幾十萬的零件庫中搜尋到類似零件,還能在工藝設計環節,讓機器給出幾個零部件之間的裝配組合。這一切都是完成在一個“對話框”裡。

對話第四範式戴文淵:通往AGI的路線,是把所有軟體改造一遍

“式說”在零部件的應用示例;圖檔來自第四範式

是侵襲,也是革命,新的生産力替代舊的,向來是商業社會中的殘酷法則。

當36氪抛出這樣一個問題:“有沒有可能某家軟體公司通過生成式AI,成長為一家比Salesforce更厲害的公司?”幾乎沒有猶豫,戴文淵當即給出了肯定回複。

“未來另一條AGI(通用人工智能)的路線,是把現在所有軟體改造一遍。”戴文淵對36氪說。

以下是36氪等媒體專訪第四範式創始人戴文淵的采訪實錄,經編輯後釋出:

一、談軟體變革:提升體驗+開發效率,To B 軟體亟待革命

Q:去年底您看到ChatGPT推出後,有什麼感受?

戴文淵:實話實說,我們也沒能預見ChatGPT這種現象級的東西,在那個時間點能出來。

當時可以預見的是,GPT-3出來後,GPT路線的生成式終将有天會爆發,但是從去年底到這段時間的爆發,确實是早于我們的預期。

Q:ChatGPT爆發的時候,第四範式在這方面的積累有哪些?

戴文淵:對于業内來說,不需要等到爆發,最早谷歌BERT出來,大模型就沒有疑問了,等到GPT3就更加明确。

2018年,我們組建了大概一百多人的研究團隊,可以想象成第四範式的達摩院(當然沒有達摩院投入那麼大),要保持對新技術的敏銳和提前投入。

(如果在)去年9、10月份談生成式AI,大家覺得這不鬼扯?現在最大的變化,是我們看到的這些方向都可以變成産品,變成商業化的路線往市場推進,這是ChatGPT最大的幫助——把整個市場的信心從0以下調到1了。

Q:客戶都是有迫切的需求,哪怕還不知道需求是什麼。

戴文淵:這有點像當時的AlphaGo,市場早期其實也不知道AlphaGo是什麼。但就想知道對我有沒有用。

這次GPT的發展速度比AlphaGo要快得多。從不知道ChatGPT是什麼,到需要ChatGPT幫我做點事,也就持續了一個多月,這次的爆發速度比AlphaGo所帶來的AI熱潮與機會要大得多。

Q:第四範式很快推出了産品“式說”,這款産品疊代過程中有沒有一些有意思的故事?

戴文淵:到了今年3月底,我們和客戶的認知都在往前,當中很重要的是(意識到)企業内部軟體的問題。

如果你看企業内部的軟體,或者對比toC端和toB端的軟體——toC端軟體的使用者體驗在過去十幾年已被打磨到較高水準(比如抖音);但是toB端,想象一下企業内的報帳系統、HR系統、流程OA系統……體驗還是很差。

我們公司的報帳系統也挺難用,(理想中)如果用Chat的方式說“我要報帳”,你把票拍給系統,系統識别票的内容,識别出來是餐票,問你用餐的對象,得到回複後完成報帳。這種體驗顯然比現在的報帳系統要強得多。

這是其一,使用者體驗的提升。

其二,是開發疊代周期的提升。原先菜單式的開發,每次更新要以月計。而現在新的互動模式下,ChatGPT每天都在提升,但你感受不到它的界面發生變化,這是資料層面的更新,這種新型軟體開發形态的疊代周期也在不斷提升。

是以我們在3月底,大概發第二個版本的時候,就強調多模态和Copilot能力,首先你要去改造軟體,不能隻有自然語言;第二,要支援用“對話”去調用軟體的某一個功能,才能實作軟體的改造。

很重要的一點,軟體不完全是一個個功能。比如Photoshop,才菜單欄裡把圖檔亮度調到5%,這是功能;對應到Chat方式,我說“把照片P好看”,就不是功能了,Photoshop裡沒這樣的功能。但Photoshop現在能不能一鍵美顔?還不行。因為需要我們定義一鍵美顔執行的步驟是什麼。

如果你要實作一個功能,要通過滑鼠點菜單三下才能實作,體驗就不會比語音互動更好;是以用新型的互動模式替代老的,會給toB端的軟體體驗帶來很大提升。

Q:是以您希望用AI的能力重構軟體?

戴文淵:絕大多數軟體是菜單式的,你調取一個功能,在菜單裡點一個下拉菜單,再點幾下進入到某一個功能。

現在當我們有更強的自然語言後,可以通過更好的互動方式實作功能調用。本質上,我們要幹兩件事,第一是把軟體轉換成新型的互動;第二個是在新型互動上,通過不斷學習軟體的使用過程,讓軟體解決越來越複雜的任務。

Q:看起來,AIGS更像是一個優化數字化轉型的工具。

戴文淵:這是現在非常容易量化的點。原來IT部門開發一個功能,無論是自己開發,還是請外包,可能需要十個人開發半年。現在用新型的開發方式,一兩個人開發一兩天就搞定了。不說最後效果怎樣,整個開發效率是提升了。

我們一直在這個産業鍊裡,過去和這些軟體公司互為生态。軟體公司需要第四範式提供決策類模型,第四範式也需要把決策類模型裝到應用軟體裡。這樣的關系裡,我們能夠看到生态的作用、問題和挑戰。

幾年前GPT3出來之後,我們基本上有了一個判斷:未來是能夠改變軟體産業的,當軟體産業被改變後,整個行業的業務價值、商業模式都會得到飛躍。

Q:這也是您做AIGS的初衷?

戴文淵:我覺得未來另一條AGI(通用人工智能)的路線,是把現在所有軟體改造一遍,改造完以後,就覆寫了所有領域。

很難想象,通過一個大模型解決所有領域的問題,這個模型量太誇張了,OpenAI的CEO也在講,他們也要轉變技術路線。如果實作AGI是必須通過一個模型無限地擴大,最後是走不通的,至少在目前的計算架構下走不通。

Q:“所有軟體改造一遍”,您預計這個過程會持續多久?這是在原有基礎上可以修繕的,還是一個徹底颠覆的過程?

戴文淵:起碼要五年,軟體的改變不可能一步到位,使用習慣也不可能一天内從一個菜單直接跨到對話框,需要一個循序漸進的過程。

單個軟體可能一到三年可以完成轉變,但整個行業起碼要五年,改變完以後,會是一個完全的、跨時代的更新。

Q:現在“式說”有哪些代表性的場景和案例?

戴文淵:我們真正target的是企業銷售管理軟體、财務管理、采購軟體、研發的軟體,以及像制造企業的CAD軟體等。

比如CAD軟體,我們能實作新型的互動,可以找到相似的零件,把兩個零件做裝配;比如門店管理,看哪些人上班遲到了,哪些人沒有按照規則操作。很多店長不會用傳統門店管理軟體,還是用最原始的方式管,用更好的互動形态,其實能很好地賦能基層員工。

還有快遞,比如倉庫經理想知道轄區内快遞員最近一個月運了多少單,投遞冠軍是誰,誰偷懶。企業都有這些資料,但你不能要求一個區域經理會操作資料庫,如果用更加自然的互動方式,其實可以很好地幫助企業管理好團隊。

我隻是舉了一些例子,這個适用面是非常廣的,本質上每個企業裡都有各種各樣的管理軟體,它們都能用更好的形态去實作。

二、談趨勢:算力不可能無限擴張;生成式AI短期内toB機會更大

Q:您剛剛談到我們跟軟體公司互為生态,裡面有很多問題跟挑戰,具體是什麼呢?

戴文淵:最大的問題是中國軟體市場的問題,如果從投資者的視角來看,通常認為中國的軟體市場很小,甚至“不太值錢”,但實際上不是這樣,中國的軟體市場是一個巨大的市場,隻不過标準化軟體市場比較小。

為什麼會這樣?因為中國有人口紅利。美國沒有人口紅利,企業隻能買标準化軟體,定制化軟體是買不起的。但在中國,企業買得起定制化軟體,是以标準化軟體市場就小了。

中國的軟體市場其實比海外大得多,但是極度分散。問題大家都能看到,就是高度的定制化,有大量人力成本。企業都挺辛苦的。要不斷做非常精細的、非标的項目管理。一旦管不好,企業就會從盈利變成虧損,導緻這個市場最大的企業也隻占千分之幾的市場佔有率。

GPT技術出來以後能改變的,就是原先大量的定制功能點開發、菜單重新排布和流程改變上,用對話式的方式就都替代了,一下子從一個很差的商業模式變成一個很好的商業模式。

同時對于客戶來說,過去雖然說可以定制,但體驗也不好,很多軟體最後功能多到上千個後,其實這些功能都找不到了。

用新的互動方式,客戶體驗也得到提升,是以從各個方面來說,這次的技術革命是各方都獲益的一個局面。

Q:融入AI後,軟體有了更好的商業模式,核心還是成本跟定制化的改變?

戴文淵:對。原來軟體公司的商業模式是什麼?派20個人做了半年,開發完就結束了,如果沒有新的功能點,也沒有後續的收入。

轉變為新的商業模式後,開發功能點不需要很長時間,主要的成本消耗在算力,而不是在人力。隻要你的軟體還在被使用,你就能持續不斷獲得算力的收入,對軟體公司來說,是一個特别大的商業模式革新。

Q:算力的問題,咱們怎麼解決?

戴文淵:此時此刻能上牌桌的(AI公司),都有一定的算力門檻,但我們作為中國公司,永遠需要考慮的問題,是有沒有國産替代方案。

對于中國晶片來說,現在需要一個調整。從追求極緻的計算,調整為追求三者(顯存、帶寬)的平衡,肯定要給他們點時間。

從算力差距來看,對于GPU來說,差兩倍其實還好。假設我用了比你差2倍的GPU,我能跑1000億參數,你能跑1000多億參數,兩者其實沒有特别本質的差別。1000多億肯定比1000億好,但你是感受不到明顯差異的,當然,1萬億參數和1000億參數還是有本質差別。我覺得還是要給國産晶片更多信心。

Q:您覺得算力和資料誰更重要?

戴文淵:資料最重要。但這個要辯證來看,資料充分到一定程度後,再多就沒那麼重要了。

比方說《紅樓夢》看過一百遍了,再多看兩遍也還好。未來在AGI決勝的,其實是一個個領域裡的資料。比方說你在Photoshop這個軟體積累足夠多了,這個領域裡你就無敵了。

Q:您怎麼看待算力擴張和大模型能力的關系?

戴文淵:OpenAI的模型能力,一方面是依靠英偉達度算力的提升;另外一方面是微軟的投資,你花了100倍的錢,算力提升很多,數量級就上去了。

但到了那個(算力)的數量級後,你還能再花10倍的錢嗎?這個算力還能再提升100倍嗎?當你想再往上提升一個數量級的時候,這個問題就要面對了。

如果算力已經無法再提升數量級,我們怎麼通過一個模型的無限擴大實作AGI?還是通過N個模型一起去覆寫?确實如果你有足夠多的模型,也能覆寫一個完整的AGI。

Q:我們怎麼讓這個模型成本更可控一些?

戴文淵:成本可控是一個比較現實的問題。在不同領域是需要不同尺寸的模型,不是所有領域都支援一個萬億級參數的(模型)。

過去認為10億(1B)參數以上都叫大模型,但不同的場景盈利能力不一樣,能夠負擔的模型尺寸也不一樣。我們說成本可控,是得看這個場景能負擔多大的模型,以及我們能不能裁剪到它能夠負擔的大小,最後其實要達到某種折中。

Q:第四範式一直在提“AI for everyone”,這個理念是不是到今天能夠真正實作了?

戴文淵:通用大模型的出現讓AI覆寫面擴大了,原先我們需要找到适合AI的場景,比如說搜尋、資訊推薦。為什麼需要找呢?原先AI隻能幹單點的事,沒有到那麼通用。除了這些點以外的地方,都不是AI覆寫的,是軟體覆寫的。

Q:我們能看到AI帶來的生産力變化是非線性的增長,跟網際網路或者晶片的疊代方式有很大差別,這也是現在那麼多人選擇創業的原因,您怎麼看這個現象?

戴文淵:是的。這次的變化很難估計是多少萬億的市場,大家都是有機會的。

Q:從大模型來看,現在有toC和toB兩種路徑,您覺得短期内哪個更有機會?

戴文淵:我認為短期内toB更有機會。抛開監管層面的問題,更容易被改進的是原來水準較低的,現有的toC軟體體驗比toB好得多,後者就更容易被替代。

Q:您覺得底層模型研發更賺錢,還是上層應用開發更賺錢?

戴文淵:最後其實都賺錢,英特爾也賺錢,微軟也賺錢。

Q:是不是可能會出現一種情況,某家軟體公司通過生成式AI,成長為一家比Salesforce更厲害的公司,是有這種可能性的?

戴文淵:這是一定的。

繼續閱讀