天天看點

日本正以舉國之力押注主權AI

作者:創業邦
日本正以舉國之力押注主權AI

作者丨臨風

編輯丨海腰

圖源丨SakanaAI官網

6月14日,由谷歌知名研究者David Ha和AI開創性論文作者之一Llion Jones建立的SakanaAI宣布完成Khosla Ventures、Lux Capital、NEA聯合領投的1.27億美元。這家公司成立于2023年7月,近半年融資2輪,上輪資方還包括NTT(日本電信巨頭)及索尼等。

日本正以舉國之力押注主權AI

據《朝日新聞》,SakanaAI在新一輪融資後估值約為1800億日元(11.42億美元),不到一年,成為日本增長速度最快的AI獨角獸。

“每個國家都需要占有自己的智力生産,這就是為什麼會有‘主權人工智能’這個概念。它編撰了你的文化、社會智慧、常識、曆史,是以你必須拿到這些資料、完善這些資料,并擁有自己的國家情報,你不能容許其他人這麼做。”

黃仁勳在2月的World Government Summit提到了主權AI。再小的國家如果要專注一項人工智能,那麼第一件事是建立“基礎設施”,将自己的文化、語言編入自己的大語言模型中。

日本正以舉國之力押注主權AI

來源:YouTube,WGS2024視訊截圖

這個道理對All in AI的日本而言是字字箴言,2023年他們舉全國之力搶跑AI賽道,各大名企訓練AI模型,巨額押注“夢之隊”SakanaAI,旨在超越中美。不僅是日本,新加坡、印度、阿聯酋等國也在大力投資主權AI。

日本正以舉國之力押注主權AI

不到1年,估值11億美元

SakanaAI被稱作“東京AI夢之隊”,有着頂尖行業人才和新穎的創業理念。更為重要的是,他們是一家100%在日本注冊的公司。

SakanaAI的名字取自日文“魚”的意思,他們的logo是一簇魚群,他們旨在開發基于自然原理的人工智能,即許多小元素共同作用以産生大結果。

日本正以舉國之力押注主權AI

圖源:JAFCO

3月,SakanaAI宣布釋出EvoLLM-JP(大語言模型)、EvoVLM-JP(視覺語言模型)和EvoSDXL-JP(圖像生成模型)這3種日語模型,後2者在Huggingface上可以線上試跑。從熱度來看,3類模型下載下傳次數均未超1000次。

日本正以舉國之力押注主權AI

來源:HuggingFace

從實效來看,模型的生成能力還帶提升。作者使用其EvoSDXL-JP示範模型以日文“大和撫子”跑圖後發現,生成圖像仍存在物種、性别上的錯誤,及眼睛和腿腳顯示的誤差。在食物生成方面,模型生成效果好一些,更具美術效果。

日本正以舉國之力押注主權AI

圖1題詞:大和撫子,圖二題詞:浮世繪風格的美味食物。注:生成時輸入語言為日語。圖源:EvoSDXL-JP測試模型生成效果

但模型生圖速度很快,約為5s/張,符合其推理僅需4步,速度比現有日本模型快10倍的說法,生圖風格貼近題詞“日本浮世繪”。

短短幾月達到成效,SakanaAI團隊遊刃有餘。6月,他們開始研究起新問題:“我們是否也可以使用LLM來提出更好的算法來訓練LLM本身”,如果可以,這是最少人工幹預的情況下優化新算法的辦法。他們将與牛津大學和劍橋大學合作這個項目。

日本正以舉國之力押注主權AI

來源:SakanaAI Blog

SakanaAI能吸引到多種學界資源并不意外,它于2023年7月在東京成立,創始人是David Ha、Llion Jones和後期加入的Ren Ito,這三人都是業界知名人士。

日本正以舉國之力押注主權AI

左David Ha,右Llion Jones,來源:Lux Capital

David Ha是東京大學多學科博士,曾在高盛工作8年,成為Google Brain日本分中心的研究負責人,也是Google在職6年的研究科學家。他釋出了多篇關于神經網絡、深度學習、圖像生成、項目示範和論文,并在ACM、ICCV、ICLR、AAAI等頂會/頂刊發表。早在2018年他就有一篇與日本古典文學深度學習相關的論文發表于NeurIPS。

David曾擔任 Stability AI的研究主管,但不到1年确認離職,同時期Stability AI高層變動,其時任COO Ren Ito也同時離職,目前兩人都在SakanaAI工作。他透露在日本創業的部分原因,一是日本尚未開發出有競争力的大模型。二是在矽谷創業難以實作差異化。

SakanaAI的COO Ren Ito畢業于東大,是紐約大學的法學碩士及法學院進階研究員、斯坦福的文學碩士。他最先是在政界任職外交官,曾是日本外務省首席副主任,後在商界也有成就,助日本二手平台Mercari策劃IPO,後前往Stability工作。

在Stability,他接觸到了人工智能模型生成的西方凝視和文化偏見,Ren Ito認為每種文化、每個民族、每個國家都應該建立自己的基礎模型。在日本營運SakanaAI,也算是Ren Ito得償所願。

日本正以舉國之力押注主權AI

來源:領英,Ren Ito

另一位Llion Jones是“Transformer 八子”的其中之一,他畢業于伯明翰大學,在YouTube、Google工作過,直到去年才開始創立公司。他是人工智能界有開創性貢獻的論文《Attention Is All You Need》的第五作者(每名作者同等重要),該文介紹的Transformer深度學習架構,成為ChatGPT等産品開發的基礎。在頂尖AI人才不過百餘人的當下,Llion Jones坐鎮SakanaAI顯得意義非凡。

據IT Media,SakanaAI在1月融資後公布過一份創始成員名單,其中的Google含量極高,10個人裡5個來自Google的主要AI研究機構,有3名來自Stability。

David在訪談中表示,今年2月他們在網上釋出招聘資訊的4天内收到300分申請,有70%來自英國、美國、澳洲等非日本地區。

日本正以舉國之力押注主權AI

圖源:IT Media

團隊陣容華麗,是以他們成立的第7個月就拿到了3000萬美元的融資,估值達到2億美元。SakanaAI在2024年1月獲得一輪資金,除了矽谷VC Lux Capital和Khosla Ventures外,還有日本的NTT集團、KDDI、索尼集團及JAFCO集團,還包括谷歌首席人工智能官Jeff Dean、Hugging Face創始人Clem DeLang、Scale AI創始人 Alex Wang的個人投資。

那時,他們的模型還在研發階段,甚至還是一個概念。

Ren Ito介紹,他們在開發一條生成式AI的創新之路,用“自然啟發智能”的理念來實作低成本、強性能。“想象一個蜜蜂群,工蜂離開蜂巢尋找資源,他們可以互相交流優質資源的位置,優化資源利用。”

團隊給出的專業解釋是,他們的算法可以通過在組合、測試和丢棄資料時模仿自然選擇,幫助自動建立處理語言或圖像的AI模型,減少人工輸入量。他們跟OpenAI花數十億美元的訓練方法形成鮮明對比,David設想的是,“我們希望用更少的計算将時間縮短到幾天或幾周,同時獲得相似的性能水準。”

官網稱,他們使用“進化模型合并”來開發兼具性能名額和穩健性的大模型。

第一個好處便是節省算力。Medium使用者Bragi分析, “模型合并”即通過結合多個小模型的知識和能力來建立高性能模型,計算成本僅是小部分。最終生成的統一模型可以達到或超過幾個大模型的性能。

日本正以舉國之力押注主權AI

圖源:Medium

另外,這個過程類似于多個開源模型融合,類似自然進化繁衍出下一代優秀模型,無需人工幹預,且能青出于藍勝于藍。

進化模型合并有效地自動化模型建構,不僅适用于語言生成,也适用于圖像生成。如他們的EvoSDXL-JP的建構,由日語專用圖像生成模型合并英語基本圖像生成模型得到相容日語的圖像生成模型(對應表中模型6),再将其與更快的生圖模型合并,由此得到支援日語的高速圖像生成模型EvoSDXL-JP(對應表中模型7)。

日本正以舉國之力押注主權AI

來源:SakanaAI Blog

SakanaAI極速開發、降本增效的方法論與日本渴望的速度契合。在其釋出3個大模型後,又一筆新的融資快速啟動。即使在3月,Sakana AI初期的合并模型效果不佳,日本政府和商界選擇持續投入。

在4月時,SakanaAI是日本工業部“生成式AI加速器挑戰賽”七家獲得贈款的實驗室之一,并赢得了日本政府提供的超級計算機使用權資助,并與NTT和索尼等巨頭公司合作,建設日本人工智能的生态系統。此外,SakanaAI還瞄準了政府機構工作及國防工業的分包合同。

“(日本)公司應該至少該擁有自己的基礎模型,即使這個模型的性能并不是特别好,”David開玩笑說道,“他們需要擁有屬于自己的傳真機。”

據Crunchbase,Sakana AI在6月完成由Lux Capital、NEA、Khosla Ventures聯合領投200億日元(約1.43億美元)融資,投後估值約11.5億美元。也正是因為這筆融資,Sakana AI沒有明确的核心産品,卻成為新興獨角獸。

SakanaAI是日本打造本土大模型的晉級之路上選擇的“明星戰隊”,在其舉國之力發展AI時備受矚目,獲得滿滿的期待和誠意。

日本正以舉國之力押注主權AI

主權AI預計“收入”100億美元

不僅僅是日本,世界各國都在對主權AI做出投資。

中美創企和巨頭在大模型上“卷生卷死”。中國研發的大模型數量全球第二,“你領跑,我緊追”的态勢已經不用多說,國家是人工智能發展的有力支撐。

有外媒報道稱,一些國家自認為在移動網際網路和雲計算革命中落後的國家,在此次AI浪潮中要設法保全本土文化與國家安全。

現任新美國安全中心的Pablo Chavez表示:“一些國家政府對生成式AI革命将如何影響經濟感到萬分焦慮”。

這份焦慮正擊中了各國政府的痛點,而唯有行動能戰勝焦慮。

亞洲範圍内,今年4月,南韓、日本政府紛紛出台政策投資AI領域。南韓的投入金額不少,約為9.4萬億韓元(69.4億美元),支援其成為半導體供應大國的目标。韓企巨頭們早早就研發了大模型,除了上述Naver的Hyper CLOVA,還有LG的Exaone,KT的Mi:DEUM(韓企開發的首個LLM)等,南韓大型電商、雲服務企業與AI晶片公司合作共同參與政府項目。

新加坡是主權AI的投資大戶,也是英偉達的大買家。英偉達2023年第三季度業績指出,約15%(27億美元)收入來自新加坡,這與其本身具有多個資料中心和雲服務提供商有關。據Crunchbase資料,東南亞AI、機器學習、資料等相關業務公司約1354家,其中有866家都位于新加坡。

政策方面,新加坡在去年12月出台政策NAIS2.0,要在未來投資超10億美元用于AI計算、人才和行業發展。而且,新加坡計劃要率先建一個基于東南亞語言訓練的LLM。

眼光轉向電力基礎設施相對落後的印度。據資料,印度AI大模型領域的公司還不到10家,獨角獸Krutrim的自研模型僅允許400多個字元輸入。印度政府在3月直接準許了國家級“IndiaAI”項目,投入1030億盧比(12.4億美元)旨在實作“讓AI為印度服務”的目标,受主權AI的概念推動,希望建立一個全面的生态系統。

中東土豪選擇砸錢搞先進科技。阿聯酋成立AI和先進技術委員會(AIATC),今年3月AIATC宣布成立投資公司MGX,由穆巴達拉和G42共同合夥部署前沿技術,投資集中在人工智能基礎設施、半導體和人工智能應用3個領域,據稱資産規模在未來幾年超1000億美元。

沙特公共投資基金(PIF)計劃在AI領域投資400億美元,希望支援一系列初創、晶片企業和龐大的資料中心,甚至是沙特自己創辦人工智能公司。

肯亞在5月和G42簽了一份協定,在該國斥資10億美元建一個資料中心,以肯亞的地熱能(供電)用斯瓦西裡語和英語訓練一個AI模型。

不缺AI人才的加拿大在4月投入了24億加元(約17.7億美元),20億提算力建基礎設施,剩下的資金賦能初創和研發。一攬子發展AI的計劃推出,確定加拿大人工智能優勢地位。

另一邊,歐洲的人工智能也在暗暗較勁。線性資本投資者黃松延在訪談中表示,歐洲是很多原創性技術的發源地,AI和機器學習領域的不少大牛藏在歐洲各個角落不為人知。如法國版OpenAI Mistral就在巴黎造出Mistral Large,推理任務不遜色GPT-4。

今年4月,歐盟委員會宣布将在人工智能領域投資6500多萬歐元,其中有5000萬用于擴充大模型能力。法國、德國和意大利都在發力,法國總統馬克龍呼籲歐洲建立政府和社會資本合作買晶片,到2030年或2035年将歐洲全球GPU部署份額從3%提升到20%。

總的來看,各國政府、企業投資本地語言的模型、算力和資料中心,以免發展先進AI技術受制于他國。模型較弱的國家在造地基,而已有強力模型的國家則在構築“護城河”鞏固地位。

這其中,賺錢的人将主權AI的概念變成了産品的USP。近半年,黃仁勳既參加了阿聯酋的WGS,又在去年9月會見了印度總理莫迪,12月與日本首相和新加坡總理會面,推動政府或政府關聯機關、計算機基礎設施電信公司投資AI。

實際上,主權AI從商人黃仁勳口中說出時,便帶有盈利性質。早在2019年,英偉達就有一項“AI Nations”計劃幫助各國建立主權AI,包括生态系統支援和勞動力發展。各國政府砸錢建立資料中心,用專門的計算機晶片改造舊資料中心,這類晶片大多來自英偉達。

據《華爾街日報》,英偉達在5月表示,主權AI戰略預計将在今年帶來近100億美元的收入,去年還是一片空白。英偉達公布的季度收入是260億美元,其中近一半來自使用其晶片的大型雲計算公司。

CFRA的分析師Angelo Zino得出結論:“(英偉達)面向雲計算的銷售額顯然無法持續攀升,但它能通過其他方式從AI熱潮中獲利。創造更高收入,主權AI正是一個新的收入增長點。”

繼續閱讀