7月30日上午,在美國丹佛舉行的SIGGRAPH圖形大會上,英偉達創始人兼首席執行官黃仁勳分别與美國《連線》雜志資深撰稿人勞倫·古德、元宇宙公司Meta創始人兼首席執行官馬克·紮克伯格坐在一起,進行了兩場爐邊談話,暢想生成式人工智能的發展未來。
對話上半場,黃仁勳和紮克伯格圍繞生成式AI、開源技術等内容展開對話,并強調了開源大模型在推動AI發展中的重要性。對話下半場,他們圍AR/VR計算平台和機器人浪潮等展開了讨論,指出下一波AI浪潮是機器人,而AR眼鏡未來或替代智能手機。爐邊談話接近尾聲時,黃仁勳和紮克伯格再次互送外套,一度引起熱議。
生成式AI将進入應用新浪潮
在談話開始前,黃仁勳已經在大會上展示了英偉達的一系列最新産品,并宣布“英偉達本周将開始發送Blackwell樣品,這是公司今年首發的新款晶片架構”。根據英偉達介紹,Blackwell GPU在訓練性能上相較前代Hopper H100 GPU提升了四倍,推理性能提升最高可達30倍,而能源效率更是提高了25倍,未來将大力推進大模型行業的疊代演進。
此外,紮克伯格一開場首先宣布推出一款名為AI Studio的新工具,基于公司最新大模型Llama 3.1建構,允許使用者建立、共享和設計個性化的AI聊天機器人,同時讓Instagram 創作者使用AI角色“作為自己的延伸”,以處理簡單的自動回複。
在對話中,紮克伯格表示,社交媒體的資訊變得越來越多,如何幫助使用者篩選内容成為了一大問題,而生成式AI能夠幫助改進社交媒體的推薦系統。他相信在未來,每家企業都能有一個屬于自己的AI助手(AI Agent),能夠獨立完成所需時間較長的複雜任務。
“AI 将不僅用于内容推薦系統,還将用于即時内容生成和從現有内容中整合新内容,這将徹底改變 Instagram 和 Facebook 等平台的資訊流和推薦系統。”紮克伯格稱。
紮克伯格分享了Meta在生成式AI方面的進展,并指出基礎模型的發展正在加速。“即便基礎模型方面的進展現在停滞不前,業界也至少需要五年時間來進行産品創新,以探索如何最高效地利用迄今為止所建構的一切。但實際上,基礎模型以及基礎研究的進展正在加速。
在贊賞Meta在AI領域的探索同時,黃仁勳也表示,“我認為很少有人意識到,推薦系統是世界上設計出的最大計算系統之一。”然而,作為聊天機器人的AI目前還停留在“一問一答”的階段,未來AI或許能為使用者生成決策樹式的思考,這讓我超級興奮。”
在生成式AI生态中,AI Studio是Meta推進AI聊天機器人疊代完善的重要一步,而其背後Llama 3.1大模型至關重要。此前,黃仁勳表示,生成式AI正在每一個領域中進行根本性轉變,而Llama 3.1開源模型标志着全球企業采用生成式AI的關鍵時刻已經到來,Llama 3.1将掀起各個企業與行業建立先進生成式AI應用的浪潮。
開源大模型将赢得勝利
随着大模型發展進一步演進,開源大模型正在迸發出更大的潛力。
就在上周,Meta正式釋出Llama 3.1系列模型,共包含8B、70B和405B三個尺寸。超大杯Llama 3.1 405B被稱為全球目前最強大的開源模型,且實力與GPT等主流閉源大模型旗鼓相當。盡管這些模型的“開放性”存在争議,但它們已成為相關領域相對容易達到的AI性能标準。
黃仁勳在談話過程中多次對紮克伯格的開源做法表示稱贊,并稱Llama的出現激活了每一家公司和每一個行業,正在幫助更多開發者和公司獲得AI模型技術。
他還稱,開源政策讓更多人受益,英偉達在Llama的啟發下也為使用者建立了全新 NVIDIA NIM和AI Foundry服務,供開發者為生成式 AI 應用建立更小的自定義 Llama 3.1 模型。使企業能夠在更多基礎設施(如PC)上運作由 Llama 驅動的 AI 應用。
實際上,自Meta開發大模型以來,便一直是英偉達的重要客戶。黃仁勳在對談中透露,“Meta擁有的英偉達GPU數量可能已達到60萬個”。此外,今年1月,紮克伯格宣布,Meta計劃在年底前向英偉達購買35萬個H100 GPU晶片。
談及Llama大模型為何開源,紮克伯格表示,“開源是為了給開發者搭建一個更為實惠和便捷的技術平台,在便于開發者修改代碼創造屬于自己的應用的同時,還能節省不少開發成本。同時,開源也有利于建構更具多樣性的生态系統。”
他提到,“堅持開源和閉源兩種技術路線的開發者都有自己的理由,無優劣之分。但總體上,對于整個行業正在建構的計算平台而言,開源很有價值。在一個開放的作業系統中,我們能夠與不同的軟體及硬體公司合作,創造出更多的應用。”
紮克伯格堅信并樂觀認為,在下一階段競争中,開源會為Meta赢得勝利。
不過,對于競争對手蘋果的封閉系統的影響,紮克伯格一度爆粗口,并稱“閉源平台有些自私”。他還表示,“在建立Meta 一段時間後,我未來 10 年或 15 年要做的一件事就是,隻想確定我們能夠建構社交體驗的基礎技術。這不僅需要建構一個AI軟體,還需要一個圍繞它的生态系統。開源不僅使我們正在建構的東西成為最好,而且對生态系統很有幫助。”
下一波AI浪潮是機器人
至于AI技術的終端應用,在與勞倫·古德和紮克伯格的對話中,黃仁勳均強調了下一波AI浪潮将是“實體AI”,即讓AI更好地了解實體世界。
黃仁勳表示,第一波AI浪潮是加速計算,不僅能降低能耗,也能為企業客戶提供服務,并且有望讓每個組織都有機會建立自己的AI。“下一波浪潮是實體人工智能。其需要三台電腦,一台用來建立人工智能,另一台向機器人發送指令,第三台電腦處理事務。”
換句話說,黃仁勳認為,下一波AI浪潮是人形機器人。正如實體人工智能視訊示範中所說,“我們正在進入人工智能驅動的人形機器人時代。”
在大會上,英偉達詳細介紹了如何加速人形機器人的開發,并公布部分新産品,包括機器人仿真和學習的NIM微服務和架構、用于運作多階段機器人工作負載的OSMO編排服務,支援AI和仿真的遠端操作工作流,以及一款AI驅動的客戶服務Agent。
其中,MimicGen NIM微服務可根據蘋果Vision Pro等空間計算裝置記錄的遠端操作資料,生成合成運動資料。Robocasa NIM微服務可在OpenUSD中生成機器人任務和仿真就緒環境。而遠端操作工作流允許開發者使用少量人類示範資料來訓練機器人等。
此外,英偉達還宣布,将為全球領先的機器人制造商、AI模型開發者和軟體制造商提供一套服務、模型以及計算平台,以開發、訓練和建構下一代人形機器人。首批加入英偉達人形機器人開發者計劃的有1x、波士頓動力公司、位元組跳動ByteDance Research、FieldAl、Figure、傅利葉、銀河通用、逐際動力等數十家企業。
黃仁勳表示,“計算機視覺是目前研究重點,英偉達正在利用視訊訓練人工智能模型,這樣就能使其更好地了解世界模型。未來,機器人也将會更好地在實體世界中運作。”
與此同時,紮克伯格認為,虛拟世界将成為推動未來AI與機器人技術新浪潮的潛力源泉。 “其中,智能眼鏡會成為下一代計算平台的移動版,混合現實頭戴裝置則更像是你的工作站或遊戲主機。”這些裝置的發展将使人們能夠以更加自然和直覺的方式與虛拟世界互動,進而推動AI和機器人技術的進步。
AR眼鏡或替代智能手機
在AI、顯示燈技術發展推動下,虛拟現實(VR)/混合現實(MR)正在迎來新興發展階段。
黃仁勳表示,智能能眼鏡和混合現實頭戴裝置有巨大的市場潛力,适用于不同的應用場景。其中,不需要持續佩戴的AI裝置将會受到歡迎。
當他詢問智能眼鏡未來的趨勢時,紮克伯格坦言,自己以前一直認為全息AR眼鏡會在AI時代到來之前出現,但直到現在都未能被大規模生産。不過,“智能眼鏡将會是未來計算機發展的一個重要形态,下一代計算平台将是智能眼鏡和虛拟現實(VR)/混合現實(MR)頭顯的結合。其中,智能眼鏡用于移動用途,VR/MR頭顯用于計算密集型的工作站任務。”
他還稱,“我們離擁有全息眼鏡還有一段時間。不過,我認為在一副時尚的、更厚架構的眼鏡中實作這一點并不遙遠。”未來的一場視訊對話中,顯示的或許不再僅是對話者圖像,兩個人可以互動、打牌、面對面開會,這聽起來非常瘋狂,但仍是正在努力的方向。”
此前,Meta已經與雷朋合作推出兩代智能眼鏡,其中第二代Ray-Ban Meta取得了大超預期的銷量。今年以來,據傳Meta首款AR 眼鏡将于 2024 年亮相。
紮克伯格表示,“我們一直在建構認為是理想全息AR眼鏡所需的技術,未來将産生一系列不同價位,采用不同技術水準的智能眼鏡産品,其中300美元價位的智能眼鏡将成為最受歡迎款式,有望迎來數千萬或數億消費者。”同時,他也看好通過眼鏡将AI與現實世界結合,并提到Meta與眼鏡制造商Luxotic的合作,認為這可以用來幫助變革教育、娛樂和工作模式等。
“五年前自我曾認為AR的發展會快過AI,但現在來看,AI的快速發展已經反轉了這個事實,并對虛拟現實的發展形成了重要推動作用。”紮克伯格說,未來AR眼鏡或替代智能手機。
從英偉達和Meta的發展路徑來看,某種程度上都未曾預見AI發展态勢,但如今均憑借圍繞AI的布局實作新接階段的快速發展,尤其是英偉達已經高歌猛進至全球市值三強。
在圍爐對話最後,黃仁勳感歎道,從移動時代到虛拟現實再到AI,自己和紮克伯格同為技術變革的見證者和親曆者,深知這一路走來的不易。“在技術變革過程中,我們兩個被踢掉過很多次,但都堅持了下來,這就是想要成為創新先鋒需要做的。”