首批大模型通過備案，更激進的投入開始了

當 “限速” 被放開，是時候看看誰快誰慢了。

文 | 賀乾明

編輯丨程曼祺

8 月 30 日晚上，百度公關團隊加班加點準備宣傳材料，目标是在時鐘跨過 0 點後，第一時間對外釋出大模型應用文心一言全面開放的消息，最終在 0:02 釋出成功。

同一時刻，百度也提前部署了大量算力支援文心一言等大模型應用，以應對這次全面放開後可能激增的用量。

緊接着，31 日淩晨 1 點 44 分，大模型創業公司智譜 AI 宣布大模型應用 “智譜清言” 正式上線；3 點 09 分，百川智能稱通過 “生成式人工智能備案”，開放公衆服務。

更多消息在今天清晨傳播開來：位元組跳動、商湯、MiniMax、中科院、上海人工智能實驗室等公司和機構也宣布其大模型已認證備案，将開始正式對外提供服務。

《晚點 LatePost》了解到，科大訊飛、華為、騰訊和阿裡巴巴開發的大模型也在首批通過備案之列。阿裡的通義千問也即将對外開放服務。

“對我們來說，今天這個節點比 3 月 16 日釋出大模型還重要。” 一位百度人士說。他和不少同僚都記得百度釋出大模型到現在已過去 167 天。

随着第一批大模型應用通過備案上線，中國人工智能大模型市場進入全新競争階段，科技公司和機構基于大模型研發的産品，可以向所有使用者提供服務，而之前隻能開展人數受限的測試。

“大模型的進化高度依賴使用者回報，更多人使用後，會有更多資料回報用于改進大模型。” 百度科技與社會研究中心主任餘歡說，百度正在嘗試提高大模型的疊代速度。“原本計劃年底釋出新版本模型，現在我們正在加速，盡可能提前釋出。”

百川智能創始人王小川告訴《晚點 LatePost》，百川智能将在今年第四季度釋出千億參數模型，在明年一季度推出 “超級應用”。據了解，半個月前釋出新版大模型的科大訊飛，也會在通過備案後，加快大模型應用的推廣速度。

新環境使大模型競争變成了一場綜合能力試煉：緻勝因素将不再隻是一家公司訓練大模型的技術實力，還有它洞察市場需求、開發與之比對的應用和做好營運的能力。

圍繞新使用者和客戶的拉新、增長與産品的更激進投入即将開啟。當 “限速” 被放開，是時候看看誰快誰慢了。

政策落地，一批大模型将公開上線

《生成式人工智能服務管理暫行辦法》正式實施的 8 月 15 日，是中國大模型公司通過備案的關鍵節點。一名大模型從業者說，這之後，有關部門開始召集一些大模型公司開會，進行備案教育訓練并下發備案材料模闆。

據了解，備案過程中，監管部門關注資料安全、資料來源問題，比如資料是否侵犯知識産權或侵犯隐私；監管部門同時建議，各公司大模型在完成聊天任務時，“拒答率不能過高”。

在大模型備案工作開始前後，本輪通過備案的大型科技公司，都或多或少釋放了大模型進展：

7 月底，騰訊開始在多個業務線測試混元大模型，預計将在下月宣布新進展。兩個月前，騰訊 CEO 馬化騰說，不急于早早把半成品拿出來。
8 月初，位元組跳動公開測試大模型應用 “豆包”，底層模型就是本次通過備案的 “雲雀” 模型。
8 月 4 日，華為宣布将盤古大模型內建到鴻蒙系統中，将通過手機中的語音助手提供生成郵件、自動操控手機軟體等功能。
8 月 15 日，科大訊飛釋出訊飛星火大模型 2.0 版本，增加生成、了解圖像和代碼的能力，并與華為聯合推出星火一體機，為政企客戶本地部署大模型提供解決方案。
幾天前，百度群發短信，提醒文心一言内測使用者獲得 “百度搜尋 AI 夥伴” 内測資格，可以通過百度 App 和百度搜尋引擎使用類似 New Bing 的功能。

首批通過大模型備案的創業公司中，智譜 AI、百川智能和 MiniMax 近期也在快速疊代自己的大模型。6 月，智譜 AI 更新推出 ChatGLM2 系列，新增 3 個不同參數規格的模型，最多可以處理 3.2 萬個 token（token 與文字處理量成正比）。

今年 4 月成立的百川智能在過去 4 個月裡快速推出 3 個模型，兩個開源、一個閉源，最高參數達到 530 億。創立于 2021 年底的 MiniMax 7 月完成自有模型 ABAB 的一次大版本更新，并以周為機關提升性能。

創業公司背後亦有大公司身影。美團于今年參與智譜 AI 的 B-2 輪融資。騰訊也已于今年 6 月投資了 MiniMax。智譜 AI 和 MiniMax 都已成為估值超 10 億美元的獨角獸。

目前通過備案的大模型公司，多數已經宣布面向社會公衆開放。不過通過備案本身可能不會成為一種大模型競争的長期優勢。

參與了備案的多位行業人士的觀點是，接下來陸續會有更多的大模型公司通過備案，“不會隻有第一批，也會有第二批、第三批”。

推廣不再受限，大模型商業化加速

大模型應用 “通過生成式人工智能備案” 後，最直接變化是，産品可直接面向社會公衆提供服務。

這之前，大部分公司推廣大模型應用時相對克制，它們面向個人使用者的産品皆是内測、邀測形态，一般使用者無法直接注冊、使用，各公司也不會主動投放廣告推廣大模型産品，這抑制了産品擴散。

政策落地則會推動公司投入資源推廣大模型，最終加速大模型的商業化。目前大模型行業主要有四種變現模式：

開發大模型對話應用，按月 / 年向使用者收費。比如 OpenAI 的 ChatGPT Plus 服務等。
出售大模型 API 接口，向公司或開發者按照調用次數收費，比如 MiniMax 與金山辦公 WPS 的合作。
直接賣大模型開發服務，向傳統企業輸出大模型行業解決方案掙錢，比如百度、騰訊、訊飛、華為大力推廣的行業大模型方案。
擁有大模型的公司，還可以用大模型改造現有業務，提高産品的競争力獲得更多商業回報。如 Google、百度等公司正在用大模型優化搜尋産品；釘釘把大模型融入到産品功能中；阿裡曾表示要用大模型改造電商業務等。

大模型陸續通過備案後，最明顯的市場變化之一是，直接面向個人消費者的産品會變得更多、更活躍。

據悉，MiniMax 接下來會推出面向公衆的産品，但暫未披露細節。

王小川稱，明年一季度，百川計劃推出第一款面向個人的 “超級應用”。他在 8 月上旬的媒體溝通會上說，百川智能 “未來不隻有一款超級應用，（更多産品）正在研發的路上”。

大規模的産品推廣，同時能為面向企業客戶的業務引流。一位百度人士說，百度暫時不會在面向公衆的文心一言産品上收費，但這是一個展示技術能力的好方法，“有助于吸引企業使用者”。

企業級市場是本次大模型獲得備案前，整個行業已在着力推進的方向。騰訊、科大訊飛、華為此前在不同場合提到，它們已面向十多個行業釋出了數十個、甚至上百個大模型解決方案。MiniMax 也宣布，其面向企業客戶的開放平台已接入超百家付費客戶。

大模型本身的技術競賽還在繼續。一位百度人士稱，公司正全力加速研發新版本的大模型，希望能提前釋出。百川智能方面稱，将按之前的研發計劃，陸續釋出 Baichuan2 的 70 億參數和 130 億參數版本，年底計劃推出千億參數大模型。科大訊飛計劃在 10 月 24 日推出中文超過、英文能力與 ChatGPT 相當的大模型，在明年上半年對标 GPT-4。

大模型發展進入新階段

截至現在，中國已有上百個參數超過 10 億的大模型。政策落地、大模型商業化加速的另一面是，參與者們将面臨更激烈、綜合的競争。當 “限速” 被放開，才能試出領先者的極限，而跑得慢的人，則可能面臨淘汰。

從大模型發展更快、監管後置的海外市場看，大模型的競争力主要展現在三個方面：

計算基礎設施。當大模型應用獲得大量使用者後，會消耗大量算力。OpenAI 一度暫停了付費使用者注冊，并嚴格限制使用者調用 GPT-4 的次數，核心原因就是算力跟不上使用者增長速度。
專有資料。市場上多數的預訓練大模型，都是用一樣的架構、公開資料集和類似的方法訓練的。大模型擁有差異化能力的關鍵在于用什麼樣的資料去微調它。這些資料的數量多少和品質差别，将直接決定一個大模型的能力。
商業應用。基于大模型做應用不難，但想要基于百億甚至千億參數模型做應用，需要大量 GPU 做推理計算。一位行業人士判斷，參數上千億的大模型，訓練與推理成本大概是 1:9。這意味着必須找到商業價值足夠大、足夠賺錢的場景，才能讓大模型應用變得劃算。在更龐大的應用場景中，大模型供應商也能得到更多使用者的回報，不斷改進模型。

大模型的競争會在某些層面會有利于資金雄厚、本身就已聚集海量使用者的大公司，比如百度、騰訊、華為、阿裡巴巴、科大訊飛和位元組跳動等。

不過一位基于其它公司大模型，開發生成式寫作應用的創業者告訴《晚點 LatePost》，他并不是很擔心備案後，大公司在應用層加大投入，擠壓中小公司。“熱潮之前已退去不少，很多應用都進入深了度內建 AI 的過程，也就是 AI 本身不是賣點，關鍵還是看對使用者需求與場景的把握。” 在這一競争點上，他認為大小公司都有機會，代表性的産品包括 Notion 和釘釘等。

還有許多創業公司也正在與使用者體量較大的公司建立合作關系，提升實力。比如 MiniMax、智譜 AI 都接入了金山辦公的 WPS。

據了解，美團投資智譜 AI 前，已花費上千萬元購買了其大模型授權，計劃在此基礎上探索相關應用。

所有大模型公司接下來面臨的重大考驗是：怎麼找到真正賺錢、可持續的大模型商業模式。

“我們不能隻是推動人工智能，卻沒有支撐它的商業模式。” 雲資料庫公司 Snowflake CEO 弗蘭克·斯魯特曼（Frank Slootman）在八月的财務電話會議上說。他說，“許多公司高管将他們進入大模型的嘗試描述為實驗性的、探索性的，他們還在試圖弄清楚這是多大的挑戰。”

到目前為止，從大模型浪潮中賺到錢的幾乎都是 “買鏟子” 的公司。比如英偉達。剛過去的第二财務季度，英偉達 GPU 相關業務營收同比增長 171% 到 103 億美元，公司淨利潤同比增長八倍到 62 億美元。

這輪政策落地，也可能會讓網際網路廣告平台先賺一筆錢。一名北京大模型從業者說，他們正在等待備案完成，之後将在短視訊、搜尋平台重新啟動産品投放。在此前一段時間各産品主要以測試形态存在時，這家公司認為大規模投入經濟上不劃算。這之前，它們一度每月的産品廣告投流費用達百萬元級别。

“現在還沒有到出現超級應用的程度。” 一位大模型從業者認為可能還需要兩到三年時間，目前隻是有了一些迹象，“等到技術能力更強，應用效果夠好，成本足夠低，真正的超級應用才可能出現。”

朱麗琨對此文亦有貢獻。

題圖來源：烈火戰車 Chariots of Fire