天天看點

AI不适合開源?MongoDB副總裁:開源代碼對人工智能不适用

AI不适合開源?MongoDB副總裁:開源代碼對人工智能不适用

新智元報道  

編輯:Aeneas 如願 拉燕 

【新智元導讀】在沒有人可以複制的規模下運作的開源代碼有什麼意義?

是時候聊聊AI開源的問題了。

顯然,這是搞開發的人不得不面對的問題。基本從2006年開始,開不開源就已經成為了頭等問題之一。

Matt Asay在MongoDB負責市場營銷這一塊。在此之前,他曾是亞馬遜網絡服務的負責人和Adobe的開發者生态系統負責人。

而在加入Adobe之前,Asay在開源公司擔任過一系列職務。MongoDB的業務發展、營銷和社群副總裁、實時分析公司Nodeable(後來被Appcelerator收購)的業務發展副總裁、移動HTML5初創公司Strobe(後來被Facebook收購)的業務發展副總裁和臨時CEO,以及Ubuntu Linux公司Canonical的COO和内容管理初創公司Alfresco的美洲區負責人。

最終,Asay成為了開放源碼倡議(OSI)的榮譽董事,并獲得了斯坦福大學的法學博士學位。

AI不适合開源?MongoDB副總裁:開源代碼對人工智能不适用

之前,Matt Asay曾指責谷歌和雅虎兩家公司在開源代碼上有所保留,然後他被罵了。

現在想來,是有道理的。

Tim O'Reilly表示,在開源的雲時代,開發者分享代碼的動機,是讓别人跑自己的程式,進而提供一份源代碼。而這件事的必要性已經慢慢消失了。

AI不适合開源?MongoDB副總裁:開源代碼對人工智能不适用

Reilly繼續指出,不僅沒必要,而且就最大的App來看,這也不再可能了。

在過去的十年裡,這種分享的不可能推翻了原先開源的定義。如今,新的定義正在影響我們思考人工智能的方式。

正像Mike Loukides指出的那樣,在AI方面的合作從未像現在這麼重要,也從未像現在這麼困難。

AI不适合開源?MongoDB副總裁:開源代碼對人工智能不适用

就像2006年的雲計算一樣,在人工智能領域做最有趣的工作的公司可能會努力用傳統的方式開源。

但即便他們開源的方式是傳統的,也并不意味着他們不能用更有意義的方式開放。

開放基礎設施

Loukides認為:「雖然現在很多公司都說自己在搞AI,但真正推動這個行業向前發展的隻有三家公司——Meta、OpenAI和谷歌。」

他們仨有着一個共同點:都擁有可以大規模運作大型模型的能力。這種能力背後,需要強大的基礎設施和技術手段,而這往往是很多個人和企業不具備的。

的确,你可以從Meta那裡下載下傳OPT-175B的源代碼,但你手頭的硬體卻無法對其進行訓練。甚至是對于大學或其他的研究機構來說,OPT-175B都過于龐大了。

AI不适合開源?MongoDB副總裁:開源代碼對人工智能不适用

另一方面,即便是有足夠計算資源的谷歌和OpenAI,也無法輕易複刻OPT-175B。

原因也很簡單:OPT-175B與Meta自己的基礎設施(包括定制硬體)聯系過于緊密,很難被移植到其他地方。

也就是說,Meta并沒有想要隐瞞有關OPT-175B的什麼,而是建造一個差不多基礎設施真的很難。即便是對于那些有資金和技術的人來說,最終搞出來的也會是個不大一樣的版本。

而這正是雅虎的Jeremy Zawodny和谷歌的Chris DiBona在2006年的OSCON上提出的觀點。

但話又說回來,如果你不了解機器内部的科學原理,就很難去相信一個AI。

是以,我們需要去尋找某種方法,進而讓基礎設施能被開放使用。

Loukides認為,應該向外部研究人員和早期使用者提供免費通路。不過,并不是說給他們一個可以通路Meta,谷歌或OpenAI的資料中心的萬能鑰匙,而是通過一個公共API。

這可能并不是大多數人所期待的「開源」,但其實還是可以接受的。

換一種方式看待開源

現在,Matt Asay曾經對谷歌和雅虎指責如今沒什麼意義了。

自從2006年以來,谷歌在滿足戰略需要的前提下,打包并開源了關鍵基礎設施。

在Matt Asay看來,TensorFlow 是開源的入口,Kubernetes是開源的出口。這些開源的機器學習行業标準有望提升Google Cloud的工作負載,或者確定谷歌雲之間的可移植性,進而為Google Cloud赢得更多的工作負載。

想出這些的人很聰明,但是在Pollyanna 的意義上,它并不是開源的。

不是隻有谷歌這樣。它隻是在開源上做得比其他公司好。開源本質上是自私的,公司和個人總是會開放有利于自己或客戶的代碼。

一直如此,而且永遠如此。

Loukides認為應該有意義地開放AI(盡管三大AI巨頭與其他公司之間存在差異),但他指的開源并不是我們一般意義上了解的開源。為什麼呢?

原因在于,雖然傳統的開源很不錯,但無論是對于軟體的建立者和消費者,它都從未成功解決DiBona和Zawodny于2006年在OSCON上提出的雲開源難題。

現在已經過去了十幾年了,我們依然沒有離答案更近一步。

話又說回來,我們确實近了一點。

Matt Asay認為,我們需要以一種新的方式來看待開源。

AI不适合開源?MongoDB副總裁:開源代碼對人工智能不适用

他與Loukides的想法很接近:關鍵在于為研究人員提供足夠的通路權限,使他們能夠重制一個特定的AI模型是如何成功或失敗的。

「他們并不需要完全通路所有的代碼和基礎設施來運作這些模型」。正如他所言,隻有在開發人員可以在筆記本電腦上運作開源程式、進行衍生創作的前提下,完全通路該代碼才是有意義的。

AI不适合開源?MongoDB副總裁:開源代碼對人工智能不适用

鑒于如今谷歌或微軟運作代碼的規模和獨特的複雜性,這已經毫無意義了——我們不可能完全通路大規模的雲代碼。

我們需要明白:開源并不是用于觀察開源世界的一個鏡頭。而且考慮到我們如今所處的雲時代,開源也用得越來越少。

無論是作為公司還是作為個人,我們的目标應該是以有利于客戶和第三方開發人員的方式開放對軟體的通路,讓軟體更易了解,而不是試圖将幾十年前的開源概念改造成雲。它不适用于開源,就像它不适用于AI一樣。

是時候換個思路了。

參考資料:

https://www.infoworld.com/article/3667433/open-source-isnt-working-for-ai.html

AI不适合開源?MongoDB副總裁:開源代碼對人工智能不适用
AI不适合開源?MongoDB副總裁:開源代碼對人工智能不适用