天天看點

亞馬遜向 Anthropic 注資 40 億美元,代表什麼?

作者:第一賽馬網
亞馬遜向 Anthropic 注資 40 億美元,代表什麼?

Anthropic 與 OpenAI 的較量,本質是“先發展技術”還是“先治理技術”的理念分歧。作者 | 西西編輯 | 陳彩娴

9 月 25 日,昨日,亞馬遜官宣其向 AI 初創公司 Anthropic 注資 40 億美元的消息,引起了海内外人工智能圈的關注。至此,繼微軟、谷歌、Meta 等科技巨頭進軍大模型企業後,亞馬遜也跑步進場。

谷歌自研,Meta 開源,微軟與 OpenAI 聯手——雖然未經設計,但這三巨頭的三條路線實際上分别代表了目前大模型賽道的三種不同模式。亞馬遜注資 Anthropic(其 Claude 正與 ChatGPT 展開如火如荼的競争),選擇的正是微軟與 OpenAI 聯手的模式。

相比 2019 年微軟向 OpenAI 初投 10 億美元,亞馬遜對 Anthropic 的首次出手就相當重磅:40 億美元,約 280 億人民币。

值得注意的是,相較目前同領域内大多作風激進的技術團隊來說,Anthropic 是一家較為保守的初創企業:自創立以來,Anthropic 的研究方向就是 AI 治理,,提高 AI 模型的安全性。也是以,即使在 ChatGPT 出來後其迅速推出性能與之媲美的 Claude,Anthropic 在技術上的創新也始終被認為首先是為 AI 安全服務、而後才是技術的突破。

亞馬遜注資 Anthropic 被評為與微軟、OpenAI 同台競技,但兩者的差異影響其實更大,因為它們将很大程度上引導目前 AI 行業走向兩條路:先發展技術,還是先治理技術?

1

Anthropic 二三事

2019 年,劍橋大學釋出的權威 AI 全景報告《State of AI Report 2019》中曾預測,在不久的将來,至少會出現一家主流 AI 公司會對 AI 的治理與管理模式作出實質性的調整。

2021 年,Anthropic 成立,以公益型企業的模式運作。這驗證了劍橋大學的報告預測;但更引人注意的是,Anthropic 創始成員的上一任東家是 OpenAI。彼時,OpenAI 已憑借 2020 年釋出的語言大模型 GPT-3 享譽全球,成為無數 AI 研究員的神往之地。

Anthropic 的創始人 Daniela Amodei 與 Dario Amodei 是兩兄妹。

在加入 OpenAI 之前,Daniela Amodei 曾就職于 Stripe 其創始人是 OpenAI 早期的一位投資人)、美國國會,加入 OpenAI 後升至安全與政策方向的 VP。

Dario Amodei 的博士畢業于普林斯頓大學,2014 年曾加入百度美國研究院就職,在百度前首席科學家吳恩達的手下工作,工作一年後加入谷歌擔任進階研究科學家。2016 年 7 月,Dario Amodei 加入 OpenAI,升至研究 VP,在 OpenAI 期間曾發表多篇關于 AI 可解釋性與安全性的研究工作,被認為是深度學習領域最前沿的研究員之一。

不久前《時代》周刊評選出百大 AI 人物,Daniela Amode 與 Dario Amodei 也入選其中。

亞馬遜向 Anthropic 注資 40 億美元,代表什麼?

圖注:Dario Amodei

在 OpenAI 就職期間,Dario 與一幹同僚對 OpenAI 處理技術倫理與安全的方式持有懷疑,不認可 OpenAI 在 AI 安全治理上的工作,後決定離職,在 2021 年創立了 Anthropic。除了 Dario 兄妹,Anthropic 的創始團隊成員還包括 Jared Kaplan、Sam McCandlish、Tom Brown 等等曾核心參與研發 GPT-2 與 GPT-3 的前 OpenAI 員工。

自成立起,Anthropic 的願景就是成為一家聚焦于 AI 安全研究的公司,希望開發出可控、可解釋的人工智能系統。在 AI 安全上,Anthropic 别開生面,首創了“憲法 AI”的概念體系,強調在人工智能系統中實作價值觀對齊。

Anthropic 成立後,在 A 輪就獲得了包括 Skype 聯合創始人 Jaan Tallinn、前谷歌 CEO Eric Schmidt 在内的投資人青睐,融資金額達 1.24 億美元。由于 Anthropic 是一家公益型企業,是以當時該消息就在圈内引起了轟動,被知名權威媒體 TechCrunch 稱為“有 1.24 億美元可燒”。

2021 年 4 月,Anthropic 又獲得 5.8 億美元的融資,由加密貨币交易所FTX首席執行官Sam Bankman-Fried領投……在 AI 行情急劇下滑的 2022 年,Anthropic 成為吸金新秀,ChatGPT 火起來更愈加突出,被不少行業人士認為是目前唯一一家能與 OpenAI 抗衡的創業公司。

2021 年,Anthropic 團隊發表了多篇研究 Transformer 機制的文章,如“A Mathematical Framework for Transformer Circuits”、“In-context Learning and Induction Heads”等,希望研究 Transformer 的簡化版本并全面解釋 Transformer 模型的功能。他們所研究的簡化版 Tranformer 是先學習基本語言模式,再獲得語言處理的通用能力。

這些研究結果為深入了解 Transformer 提供了一條新的途徑。

能力出衆而有經驗的研發團隊,充足的資源與資金能力,比大模型風潮提前兩年的布局——這三大要素使 Anthropic 成為領域新星,與微軟/OpenAI、谷歌/DeepMind 被列為目前全球 AI 領域排名前三的公司。更重要的是,Anthropic 也是這當中唯一一家沒有與大廠深度綁定的創業公司。

2023 年 3 月,Anthropic 融資額超過 13 億美元,估值 41 億美元;僅 6 個月後,Anthropic 直接吸引亞馬遜投資 40 億美元。此前,Anthropic 推出的對話機器人 Claude 在海外與 ChatGPT 展開競争,在技術圈的認可度很高。Anthropic 與 OpenAI 是目前極少數還在堅持閉源的團隊。

據 TechCrunch 報道,Anthropic 向亞馬遜做出“長期”承諾,通過 Amazon Bedrock 為全球 AWS 客戶提供對下一代基礎模型的通路。此外,Anthropic 還将為 AWS 客戶提供早期通路模型定制和微調功能的獨特功能。

但除了亞馬遜,Anthropic 也與谷歌雲、Zoom 等企業展開了相似合作。盡管接受了亞馬遜的大額注資,但 Anthropic 仍堅持其創立之初的願景,追求 AI 安全的終極目标。

2

這一波的“AI 安全”不一樣

與上一波 AI 倫理不同的是,大模型興起後,“AI Safety”(AI 安全)這一方向吸引了更多行業大佬的關注與讨論,比如圖靈獎獲得者、深度學習三巨頭之一的 Yoshua Bengio。

接近 Yoshua Bengio 的人士告訴 AI 科技評論,Bengio 計劃從明年開始就不再帶學生,全心投入 AI 安全的研究中。

Yoshua Bengio 在 2014 年提出的注意力機制後來成為谷歌 Transformer 的核心,而大模型的興起是基于 Transformer。盡管大模型的成果發展如火如荼,但作為注意力機制的提出者,Bengio 對大模型的安全問題卻十分擔憂。今年 7 月,Bengio 出席美國國會參與人工智能的讨論,提出“應制定全球人工智能規則”。

OpenAI 的首席執行官 Sam Altman 此前宣稱 2030 年前将實作 AGI。對于 Sam Altman 的論斷,一部分人為技術的突飛猛進狂歡,另一部分人則認為,在 AI 的風險與安全還沒控制好之前,就任由 AI 肆意發展,是一種不負責任的表現。Anthropic、Yoshua Bengio 就屬于後者。

上一波 AI 商業化落地過程中,盡管 AI 倫理與安全的問題也曾被提上議程,但并不是研究的核心。而在這一波大模型中,與算法創新、算力充足同等引人關注的是算法的安全性。

當模型的能力還不夠強時,安全可控是一個附加命題;但在 ChatGPT 爆火後,随着大模型能力的日新月異,安全可控就成為了一個必要命題。深度學習算法的偏見、歧視、隐私洩露、文化政治、誘導(如“大模型越獄”)等等問題也變得極其嚴峻。

此前 UIUC 李博團隊的一項研究工作發現:盡管GPT-4在标準基準測試中通常比GPT-3.5更可信,但在越獄系統或使用者提示的情況下更容易受到攻擊,背後原因可能就是因為GPT-4更加準确地遵循(誤導的)指令。(更多資訊請閱讀 AI 科技評論往期報道:UIUC 李博:GPT-4 比你想象的更「傲慢」)

如前所述,OpenAI 的大模型沒有開源,外界是無法擷取其具體大模型的。在這種情況下,外界研究人員對大模型的安全評測隻能進行“黑盒測試”。據 AI 科技評論與行業人士交流,黑盒測試比白盒測試難,“因為不知道内部資料,是以就隻能通過模型的通路來估摸模型内部的機制,然後再基于猜想去針對性地設計應對方法”。

無論從社會層面或技術層面,大模型的安全隐患都是一個不容小觑的話題。也正是以,ChatGPT 初興起時,國内的 To C 大模型産品一時受阻。而盡管 9 月初第一批 8 家大模型通過備案,各家廠商對大模型的安全問題也不敢掉以輕心。

在大模型産品上,影響安全性的因素不隻有技術起步晚,使用者量也是直接影響因素:使用者量越大,模型的相關輿情問題越多,風控壓力越大。

是以,目前國内的大模型公司在基礎設施一塊,實則面臨三座大山:算力,資料标注,以及風控。而風控主要包括網絡安全與内容稽核。

相形之下,Anthropic 的創始團隊從 OpenAI 出來,并且參加過 GPT-3 的核心研發工作,目前也許是除了微軟與 OpenAI 之外,最了解 OpenAI 與 GPT 系列大模型的公司。

Anthropic 成為吸金能手的背後,或許正映射了 AI 行業的一大重要趨勢:AI 時代,能兼并技術創新與技術治理的企業,才是市場的寵兒,未來的赢家。

又一家 AI 公司即将赴港上市,徘徊在 IPO 門外的企業有哪些苦楚,已上市的 AI 企業又将如何續寫新篇章,我們即将推出觀察文章《2023年,上一代 AI 公司奔赴流血上市難》,歡迎添加作者微信Sunpx33,如果你有想說的話,可以和我來聊聊。

未經「AI科技評論」授權,嚴禁以任何方式在網頁、論壇、社群進行轉載!

公衆号轉載請先在「AI科技評論」背景留言取得授權,轉載時需标注來源并插入本公衆号名片。

繼續閱讀