從資料到晶片，開發AI越來越昂貴，隻有科技巨頭能“玩得起”？

第一财經

2024-06-02 19:07釋出于上海第一财經官方賬号

更多的訓練資料、更大的模型、更多的晶片和資料中心，這些推動人工智能（AI）進步的“基礎設施”，正推高科技公司的成本。

5月，OpenAI與美國新聞集團（News Corp）簽訂了一項五年内金額超過2.5億美元的内容授權協定，允許前者使用後者的新聞出版物内容來回答使用者查詢并訓練AI。此前，圖檔提供商Shutterstock與蘋果、Meta、谷歌、亞馬遜等大型科技公司簽訂了2500萬至5000萬美元的交易，提供其龐大的圖檔和視訊庫用于AI訓練。

全球經濟分析公司BCA Research美國股票首席政策師唐克爾（Irene Tunkel）對第一财經記者表示，科技公司在AI領域開展了大量工作，但除非銷售的是AI相關的“工具和裝置”或雲存儲，否則科技公司更多仍做的是AI資本支出，而不是靠AI掙錢。

然而，大量的資本開支需求無疑會将無力承擔相應成本的公司甩在後面，有能力在這場遊戲中競争的玩家仍将是我們熟知的科技巨頭。

“基礎設施”很貴，資本支出很高

唐克爾介紹，在生成式AI的生态系統中，提供晶片和計算機硬體、雲平台和服務、資料庫、網絡和分析等産品和服務的屬于生成式AI的“基礎設施公司”，幫助模型的順利開發和部署。例如，OpenAI的研究員貝特克（James Betker）曾表示，訓練模型的資料是越來越複雜、強大的AI系統的關鍵。

但資料該從哪來？據報道，生成式AI模型主要通過從公共網頁中擷取的圖像、文本、音頻、視訊和其他資料（其中一些是有版權的）進行訓練。例如，OpenAI在未經某視訊社交網站或創作者許可的情況下，轉錄了超過一百萬小時的相關視訊，以供其旗艦模型GPT-4使用。元公司（Meta）也一直在使用旗下公司照片牆（Instagram）上的圖檔和視訊來訓練其模型，并隻允許歐盟公民退出這一機制。

随着法律訴訟的增多，AI公司開始選擇付費。例如，線上社群Reddit稱，該公司已認證向谷歌和OpenAI等組織許可資料賺取了數億美元。據報道，AI訓練資料市場預計将在十年内從現在的約25億美元增長到接近300億美元。

模型訓練也并不便宜。OpenAI首席執行官奧爾特曼（Sam Altman）表示，訓練GPT-4的成本超過1億美元。AI初創公司Anthropic首席執行官阿莫代（Dario Amodei）也稱，目前市場上的人工智能模型的訓練成本約為1億美元。他說：“現在正在訓練的模型，以及将在今年晚些時候或明年年初推出的模型，成本接近10億美元。我認為在2025年和2026年，我們的成本将接近50億美元或100億美元。”

晶片支出更是一個大項目。據報道，英偉達的H100圖形晶片售價約為30000美元。元公司首席執行官紮克伯格（Mark Zuckerberg）此前曾表示，公司計劃在今年年底前購買35萬塊H100晶片，以支援其人工智能研究工作。此外，亞馬遜公司的雲計算部門以每小時約6美元的價格向客戶租用英特爾公司制造的大型主力處理器叢集。

在雲服務中心方面，每一座資料中心的成本都以億來計算。例如，微軟公司與阿聯酋AI公司G42宣布，雙方将合作投資10億美元在肯亞建設一個資料中心，投資40億歐元在法國建設AI資料中心和雲基礎設施。過去兩年裡，亞馬遜也已承諾斥資1480億美元在全球建設和營運資料中心，以應對AI應用和其他數字服務需求的激增。

總的來看，微軟在4月表示，最近一個季度的資本支出為140億美元，比去年同期增長了79%，由于AI基礎設施投資，這些成本“大幅增加”。谷歌母公司Alphabet也表示，上一季度支出為120億美元，比去年同期增長91%，并預計今年下半年的支出将“達到或超過”這一水準。與此同時，Meta也上調了對今年投資的預期，目前認為資本支出将達到350億至400億美元，在這一區間的上限将增長42%。

反壟斷部門怎麼看

美國艾倫人工智能研究所（AI2）進階應用研究科學家凱爾·洛（Kyle Lo）認為，高額的訓練成本将把小公司排除在“開發或研究AI模型”之外。

凱爾·洛表示，對大規模、高品質訓練資料集的日益重視，将把AI開發集中在少數擁有數十億美元預算、能負擔得起擷取這些資料集的公司。合成資料或基礎架構方面的重大創新可能會打破現狀，但在近些年似乎都不會出現。

“總的來說，管理對AI開發潛在有用内容的實體有動力鎖定他們的材料。”凱爾·洛說，“随着資料通路的關閉，我們基本上在為一些早期資料擷取者開綠燈，并且撤掉梯子，其他人無法獲得資料以趕上來。”

目前，歐美英的反壟斷機構也已經盯上了科技巨頭在AI領域的地位。

例如，英國競争與市場管理局（CMA）在今年4月釋出的報告中稱，AI基礎模型市場中主要參與者的合作關系可能通過其價值鍊加劇壟斷。5月，美國司法部（DOJ）也宣布加強對AI領域競争情況的關注。近日，美國司法部反壟斷部門主管坎特（Jonathan Kanter）表示，過去40年的反壟斷政策未能有效保護公衆利益，導緻了少數公司對市場和資訊流的控制。他強調，内容創作者和開發者在目前市場環境中面臨的高額費用，在大公司增加對内容創作和分發的控制時尤其如此。

當涉及大科技公司收購AI初創公司時，富而德律師事務所中國反壟斷業務部主管杜甯（Ninette Dodoo）對第一财經記者表示：“歐盟和美國的監管機構正越來越具有幹預傾向，同時他們具備的執法工具也有能力對所有并購案件發起法律挑戰。”

金杜律師事務所合夥人吳涵律師告訴第一财經，中、美、歐在AI數字治理領域的監管在一定程度上均具有共性，比如都重點關注AI系統的透明度披露、訓練資料治理、知識産權保護、内容安全與倫理等。

(本文來自第一财經)

檢視原圖 144K