天天看點

36氪專訪|對話Nolibox:從AI生成藝術到AIGC,開源生态下的核心競争力在于産品了解

作者:36氪

2022下半年,AI生成藝術或許已經成為了科技領域最性感的技術風口。

此前,36氪整理了截止到今年9月底的全球AI Art行業圖譜。而在不到一個月的時間裡,行業繼續高歌猛進:

上線不到兩個月的頭部廠商stability.ai(Stable Diffusion背後的公司)得到了10億美元估值,以此迅速跻身全球獨角獸陣營,徹底打響了AI Art的名号。

此外,在良好的開源生态下,國内也在一直不斷湧現在算法風格、商業方向、産品特點等方面各有不同的AI Art廠商。成立于2020年的智能設計服務商「Nolibox 計算美學」,近期也完成了自己旗下AI Art平台産品「畫宇宙 」的開發,并在Product Hunt(全球最大産品發現社群)和國内上線。

去年,36氪曾報道了「Nolibox」的Pre-A輪融資新聞。作為國内最早在AI生成設計(差別于Canva等模闆設計的智能設計)領域深度布局的初創企業之一,「Nolibox」的核心團隊一直在持續探索AI與創造力的深度融合,并以AIGC作為核心進行了産品化的布局。

那麼,對于從業者來說,如今AI生成藝術久居不下的熱度,是否隻是C端使用者的“好奇心泡沫”?為了诠釋AI Art在國内市場的另一種可能,36氪采訪了「Nolibox」創始人兼CEO徐作彪、CTO何宇健。

36氪:從什麼時候開始布局AI生成藝術的?

徐作彪:我們其實一直做的都是AI和設計創意的融合,是以技術層的探索也是圍繞着相關的落地方向深入展開的。無論是之前披露過的智能海報、動态渲染和素材語義了解,還是現在比較火的AI Art,其實從廣義上來講都是智能設計創意的一部分。也是以,我們去把包括AI Art 在内的AIGC技術納入我們産品體系裡時,不會是以一種純粹的AI Art的形态來做,而是會考慮目前我們已有的技術體系和整體戰略,用自然而然的方式去接入AIGC技術,并以一種「生産力工具」的形态展現出來。

36氪:如何看待Stable Diffusion的大熱?

徐作彪:SD(Stable Diffusion)出來之前我們也看過很多類似的技術,但他們或多或少都有些缺點,導緻它們離真正的生産力工具都還差點意思。SD的火爆很大程度上來自于它解決了很多技術問題,同時以開源的方式縮短了行業技術進步所需要的時間。那麼在技術相對公平的前提下,我們所做的事情就是把之前的積累和沉澱快速放入了這個領域,以便未來更好地朝着生産力工具發展。

何宇健:其實從最底層的算法模型和技術原理上來看,目前每一家文本生成圖像的廠商做的可能都差不多,都算是Diffusion模型的各種變體。SD所開源的模型也是基于其中一類Diffusion模型的工程化實作。SD模型的優點在于,它采用的Latent Diffusion模型會先把圖檔進行某種“壓縮”、并轉換成某種潛在的表達後,再做後續計算,是以運算量降低了,運算速度也就得到了提升。至于其他的主流Diffusion模型,以Disco Diffusion為例,雖然他們的效果甚至可能會更好一些,但速度就會比較慢。

36氪:Nolibox Creator的産品核心功能有哪些?

徐作彪:從産品形态來說,我們主打的是「無限畫闆」和「生産力工具」的概念。作為一個畫闆,它可以讓使用者在同一個互動界面上看到自己曆史生成過的所有作品,也可以像Figma一樣,在畫布内對這些作品進行自由編輯。作為生産力工具來說,我們除了內建、優化了SD模型以外,也內建了各種各樣的技術,而不是簡單的給一段文本,生成,然後就結束了。使用者可以先用文本生成很多張圖,然後選中其中覺得比較好的圖,再用超分辨率把它變成一張高清的圖,進行後續的自由編輯和創造。這樣的話,其實可以給予使用者一個更加自由的創作環境,而不是一次性的創作。

36氪專訪|對話Nolibox:從AI生成藝術到AIGC,開源生态下的核心競争力在于産品了解

Nolibox - 畫宇宙

36氪專訪|對話Nolibox:從AI生成藝術到AIGC,開源生态下的核心競争力在于産品了解

Nolibox - 畫宇宙

36氪:這樣一個基于AI生成的平台化産品未來可能會是什麼樣子?

徐作彪:要說的話,AI Art,或者說文本生成圖像,其實隻是AIGC下的一個子領域,而我們的平台産品未來是可以內建其他AIGC技術的。比如像自然語言生成技術,使用者需要一段什麼文案,可以在我們的平台上生成,然後我們再幫它考慮這個文案應該配上什麼樣的圖。是以從最終願景來看,我們想做的是AIGC的“超級大平台”,這上面有各種各樣的AIGC技術,有些可能是我們的,有些則可能屬于一些合作的技術提供方。比如我們最近也在談一些合作,尋找一些專門研究算法的團隊進行深度合作,目的就是讓使用者在我們的平台上享受到幾乎所有全球新興的AIGC技術能力,并且和無限畫闆這樣的生産工具形式進行可定制化的融合。這樣的産品形态會是我們比較重要的戰略方向和核心壁壘之一。

36氪:從技術層面來說呢?

何宇健:技術方面,我們目前的工作方向主要是優化和支援使用者本地私有化部署。首先就是把它的硬體需求降到最低,為每個人都能實作私有化部署打下一定的基礎。比如如果隻是使用基礎功能的話,GPU顯存最低可能隻需要4G。我自己做測試的結果是,大概四五年前買的一台NVIDIA 1080的電腦,這樣的一張顯示卡上其實已經能夠跑我們所有的算法了。

36氪:會考慮開源嗎?

徐作彪:開源一直是我們想走的路。從價值形态上來說,我們還是比較堅持“取之于開源,用之于開源”的理念。目前來說,我們的後端算法已經完全開源了,而且隻要使用者有一定的代碼能力,就能夠進行私有化部署,也就是說可以永久免費地用我們的産品。希望大家能夠更多地參與進來,樂在其中。

36氪:基于國内創業者裡會有一些急功近利、善于“套殼”的人,像這種非基礎技術層的開源會對企業自身的發展和市場競争造成一定損害嗎?

何宇健:我們目前開源的是後端算法技術,而我們的前端産品并沒有開源出來。我們确實也擔心把産品開源出來,别人就直接拿去賣了。在開源這件事上,我們的目的是先把技術疊代好,在占據了使用者心智、不再怕被别人抄了以後,可能也會考慮把前端也開源出來,因為到那個時候再去做各種維權也會友善和理直氣壯很多。但總體來說,其實在開源對市場競争的利和弊裡,利益都幾乎是面向所有人的,而弊端基本隻是對開源方自己的。

徐作彪:被套殼這種事其實避免不了,有些産品确實會直接套殼上線,讓使用者做任務看廣告,做一些病毒式的現金流。除非我們在開源的時候就寫進去一個很強的協定,但這樣可能又會違背開源的精神。不過從自身出發,我們還是想做一個比較長線的事情。開源帶來的套殼行為可能可以從短期壓榨技術的剩餘價值,在這波浪潮下獲得比較不錯的盈利,但理論上來說,如果沒有對這種行業内耗有一個清晰的認知,它可能也隻是一兩個月的熱度。目前AIGC的從業者想的事情都是如何把短期的浪潮變成長期穩定的商業模式,其中我們想做的就是一個生産力工具。

36氪:目前AI Art還是在C端的嘗試比較多,如何看待未來在ToB領域的商業化方向?

徐作彪:我們看好AIGC在B端的商業化,我們本身想要做一個平台,可塑性比較強,是以我們也去想了很多種模式和場景。

  1. 面向一些特定領域,充分發揮AIGC的優勢,服務好一類群體。舉個實際的生産力的例子,我們現在的産品功能是可以生成四方連續無限循環的大型桌面的,這件事如果交給設計師或者畫師,非常厲害的設計師大概一周能畫幾個特别驚豔的稿出來,還要請别人去細化,因為需要考慮很多正負形的關系和上下左右細節的連接配接,比較麻煩。但如果是AI的話可以做到幾秒鐘出一張圖,至少從這個場景來說已經能夠代替大量的繁瑣的的創意環節,這樣就可以讓創意工作者可以更加聚焦在創意本身了。
  2. 與IP的持有方(創作者或者機構)進行原創類合作,幫助他們走向大衆。比如說,通過訓練他們之前的作品跑出一些精品風格和模型,使用者基于這些風格和模型所生成的作品可以進行正版商業授權。在這個過程中,收入大部分都會給到IP持有方,平台隻會從中進行小比例的抽成。
  3. 靈活的SaaS模式。首先,企業可以在其本地部署我們的開源算法,基于其算力免費使用我們的産品;如果企業希望使用我們的算力,我們會為其提供算力充值和訂閱模式;如果企業需要我們提供軟體的定制化開發,我們也可以快速響應,進而更好的滿足企業的特殊需求。
  4. 與技術提供方合作。我們對API進行內建化和産品化,也支援對技術提供方進行品牌露出。之是以采用如此open的方式,是因為我們希望讓大部分人都能用起來,讓大家享受到AIGC帶來的創作樂趣和創作成就,這是第一步,後面的很多商業化的事情也會順勢而來。

36氪:C端社群營運方面有什麼成果?

徐作彪:近期我們在小紅書、微信、B站、知乎這些管道都做了一些營運的初步發力。其實我們的心态會更加開放,比如不太提倡使用者直接把産出的圖直接拿去售賣,因為按理說産出的作品版權應該遵守CC0協定(CC0,非營利性組織Creative Commons推出的放棄版權并将作品投入到公共領域中的版權數字授權許可)。我們希望使用者更加專注于創作的樂趣,是以會緻力于與平台合作舉辦一些重量級的活動,或者線下的空間關聯。社群成果來說,我們小紅書和微信社群裡的交流和回報還是挺好的。目前我們更想把資深使用者營運起來,而不是隻追求使用者量。

何宇健:另外,我們的開源社群裡已經有一些來自海外的開發者,他們會自發地給我們提很多很有用的建議。比如,其中一位海外開發者就給相關的代碼做了個 demo,在這個 demo 的基礎上,我們快速地做出了一種沒有硬體需求的、更易于上手的本地化部署方案。此外,另一位海外開發者甚至自發地提出要幫我們搭建一個 Discord 社群,并願意幫我們宣傳。是以我們會覺得,如果能夠把更多對AI Art有信念、有熱情的人聚集起來,那麼整個産品和技術的疊代都會更快更好。

36氪:目前Nolibox Creator已經在ProductHunt上線了,如何看待AI Art出海的機會?海外的使用者習慣比起國内會有什麼不同?

徐作彪:我們在海外和國内的營運政策有一個很大的差別。其實在海外目前我們還沒有特别的去營運。海外這一部分目前我們主要是想把開源社群營運起來,希望能以此實作一個健康的開源模式,大家一起來協同完善開源算法。但國内使用者的話還是要經過注冊來體驗,國内市場對于我們來說更大的意義是驗證一些商業化的東西,是以推廣的時候我們也會在國内開放更多的功能。

36氪:定價政策方面是如何考慮的?

徐作彪:在定價方面我們的想法是,大部分使用者在大部分時候都是能免費使用的,可能會在一些特殊情況下收費。我們目前有三種特殊情況,第一種是在微信小程式或者移動端使用,我們會給使用者一定的免費生成次數,然後再按生成次數收費。第二種是在電腦端,如果使用者不想排隊、也不想做本地化部署,我們會提供一個付費的專屬伺服器叢集給他們。第三種收費情況是我們和一些技術提供方合作,有些算法如果可能是需要收費的,比如說我們的收費模式裡有一個算法資源包,相當于是專門和技術提供方合作的資源包,這裡的定價主要由技術提供方來決定。

36氪:随着微軟和DALLE-2合作,很多國内科技巨頭也開始積極布局AI Art,和他們之間的合作與競争關系會是怎樣的?

徐作彪:其實我們和國内科技巨頭的合作已經有了相對不錯的進展。這種合作會是相輔相成的,因為我們的戰略核心之一在于——我們不是要去壟斷這個技術,畢竟技術已經是開源的了,我們想做的是提供一款産品,能夠去內建并且産品化各種各樣的優異的技術,是以會在産品體驗上下狠工夫。各種技術之間不會是互相競争,而是相輔相成的。是以我們非常願意和科技巨頭進行深度合作,相當于他們提供技術和定價政策,我們負責産品化。

另外,如果科技巨頭不想讓自己的技術隻是在我們的産品裡作為一小部分,希望自己能做出來一個好的産品,其實也是可以的。因為可能國内科技巨頭的AI研發部會比較專注于技術,而我們會更專注于産品,彼此是非常珠聯璧合的。同時,因為我們的産品做得很元件化,幫他們定制産品的速度也會非常快。說到微軟和DALLE-2的合作,其實還是做了個專門面向設計的軟體出來,而我們的産品是基于雲原生的,這可能也會是我們的優勢之一。

36氪:最後一個問題,AI Art對人類的創造力來說意味着什麼?

徐作彪:我覺得作為人類來看的話,最重要的是可以讓AI去幫自己畫出靈光一現的創意,讓想象力快速呈現在眼前。以及在創意工作中,替代自己做一些重複的、輔助的、甚至高強度的工作環節。第二,它也可以讓人類去思考,人類的藝術到底有哪些東西是AI沒法學會的,也就是探索人和AI創造力的邊界到底在什麼地方。第三,在漫長的發展過程中,AI生成應該更加偏向人文關懷,為人所用,讓人類更加聚焦于自己擅長的創意方向,比如你在寫文章的時候,每個字都不是你發明的,但這些字的排列組合是你的創意。同理,在AI Art層面,創意的構思與組織才是核心。

何宇健:我從技術視角也補充一下。其實我們知道,AI生成隻能重制大部分主流風格和模式。比如我們給它100萬張圖,它可能從中總結了很多規律,而這些規律都是一些主流規律,它其實隻能重制這些東西。那麼如果思考人類的藝術裡到底有哪些是AI沒有學會的這個問題,是不是就能得到一些結論,比如AI沒學到的東西,是不是正好就是我們人類藝術的精髓?AI現在隻能模仿主流,但是不同的藝術家想表達的理念、體驗和設計手法都是各有差别的。關于這個問題的思考,有可能讓人類的藝術更進一步。

繼續閱讀