AI的下個進化和爆點

文 | 李智勇

産品視角看技術一般不看原理就看效果。

每天會我花點時間觀察AI的最新進展。方法是有API的主要方法就是建立測試集各種測，視訊這類的我主要就看非官方出品的到底做成什麼樣了，是不是具有普遍性。

看多了上面這些視訊後，我是兩點感想：

第一，視訊生成這事真的要到爆的時候了。

第二，GPT5這檻大機率是能過去的，雖然是不是OpenAI先過不好說。

在這個新機會點徹底爆開和現在之間其實是AI的小低潮。

為什麼說視訊生成要爆呢？

模型方的官方視訊因為有利害牽涉，最多可以看看苗頭，不太能信。

是以得換個視角，如果一般使用者以一定頻次和量級持續往出爆精彩視訊，那就差不多到臨界點了。你看當年MJ火起來之前也是這樣，持續各種圖檔被爆出來。因為社交網絡上持續爆視訊這事必須滿足倆條件：

第一個是品質得讓人驚訝。超出原有認知。

第二個得相對容易和便宜，很多人都能做了。

前一個是時機，後一個是基礎。缺一個也不行。現在那有誰沒事爆圖檔的，即使圖檔比過去做的還驚豔，也沒人看啊。

現在看這倆條件基本滿足了，隻差一點點。一旦這個滿足了，就變成AI的下個大衆型機會點。

為什麼說是大衆機會呢？

AIGV（Video）這是我杜撰的一個詞，但确實應該區分生成文本、圖檔和視訊。因為他們影響量級就不可能一樣。國内的頭部主播收入和過去部落客收入就不在一個數量級上，甚至都不是十倍百倍的差異。假如抖音上市等于多少個小紅書和知乎呢？

現在這個視訊生态面臨洗牌，一波人要上機關槍了，另一波人還是大刀長矛，是以這影響恐怕比過去文章生成大的多。他會推進視訊平台往不可測的方向發展。

視訊平台外的部分我們反倒是能看的清楚一些，甚至發展路線過去都操練過一遍了。

先是新版李一舟會出一波。這時候的内容生成面臨雙重專業性，一部分是視訊生成的模型，一部分則是視訊本身的某些技巧。

也還是會有套殼的工具，Heygen這種不完全産生視訊的工具都每年2000萬美金，這裡的新工具應該價值更大。

然後大量AI生成的内容會進入各個平台。各個平台估計會有點糾結，但最終還是會像現在這樣，基本還是允許，最多加個标注。

再往後會往縱深發展，不停留在宣傳片這個層次，而是向短劇（段子、動畫等）發展。這時候會再炸一下，因為和上一波的進展就重疊了。之前AI碰撞局上，周玮分享過他寫短篇小說的Agent，聽過後你就知道這類産品再結合上視訊生成能力，特别的契合。這類産品的價值空間一下子就會上來很多。

再之後估計就是長劇和直播。其中直播稍微複雜點，因為要和經常說的動捕做結合，做到特别逼真恐怕還要花點時間。

最後肯定是電影。扔本小說，AI改出劇本，AI生成電影，這是什麼感覺？

先縱後橫的AI

之前文章中提到過幾次，AI和網際網路最大的不一樣是先縱後橫，像打深井，現在這裡深井又多了一口。

文圖是一口井，視訊是一口井，并且更深更大。

更有意思的是這是個大衆機會，大廠好像也不能基于這個做什麼壟斷産品。

每個人差不多是平等的，它輔助你的創意實作，培養一批工具和教工具的人。

先縱後橫會導緻這這麼一個狀态：它不會一下子炸的那麼厲害，比如一下子就出個微信，但會持續炸。

這時候面對它的基本方法論根本不是高瞻遠矚，而是要回到現場，需要AI碰撞局這類把案例聚集起來的，讓大家能鮮活感受AI應用現場的手段。

再簡單了說就是實事求是，得知道情況是什麼，别人幹成什麼樣了，然後形成自己判斷，自己不了解的就當不存在，至少不能用來做事。

這和網際網路非常不一樣。那個是一波大浪沖到底過去就過去了。

徹底成熟了什麼樣？

我之前發了這麼個視訊，沒想到自己讀者群（進讀者群大家發私信吧）裡還有幾個這方面專家，又多聊了幾句我就發現這是個成熟産業。

上面的生成視訊技術一成熟再加上視訊裡的這套技術，有可能催生這種産品：

一個人有一個自己的分身，這個分身就是視訊裡那種産品，然後生成腳本、生成内容、釋出是全自動的，你對着說它就能釋出内容。剪映什麼的就不要了。這市場應該還很大，真有願意幹的可以試試。

這東西就每人多一個手機，但這手機能自己動起來，生成内容釋出内容，和直播架子、話筒什麼的其實差不多，需要的量還很大。有人估計用去做水軍，但那是做水軍違法，就和有人用手機打詐騙電話，但不能說是電話的問題類似，無人機不也用來扔炸彈麼。

GPT5最終肯定會來

看着視訊的進展，我就比較确定GPT5肯定會來。

現在GPT5是個符号，也說不清到底是什麼，隐喻就是AI能再進展一步。倒不一定是OpenAI的下個版本，它辨別着通用智能是否還能再跳一級，智能的通用性每跳一級，其影響和單純生成視訊肯定不一樣。

為什麼說GPT5一定會來呢？

比如說了解實體世界有自己世界模型這事，在生成文字和圖檔的時候理不了解實體世界是不關鍵的。但生成視訊的時候如果不了解實體世界，細微的地方是做不好的。

解讀為什麼可以看論文，但看結果就是AI對實體世界的了解在深入，它在形成屬于它自己的世界模型。

假如有一天AIGV（Video）能夠生成現實世界的各種電視劇，也能夠生成各種精彩的奇幻電影，那它的世界模型就必然同時覆寫現實空間和虛拟世界（比如漫威宇宙）。

從這個角度看視訊生成和GPT5差不多是同步的。

是不是OpenAI反倒是不好說，OpenAI宮鬥了一場後看着有點抓瞎，總是很随性的發産品，然後Sam Altman不解決公司迫在眉睫的問題，沒事去發表涉政言論，這怎麼看也路子不對。但這是另外的故事了。

小結

想到AI的終極可能會想到無處安放的自己，并恐慌，但看過程其實它也在創造一個個大衆型機會。在這個時間點，這類充滿活性，還給一般人機會的領域沒想的那麼多了。還是應該多擁抱和碰撞。如果說之前階層固化的程度是1，那AI之後的世界裡可能是100(在我預測的不好的結局裡），是以在不良脈絡裡這可能是最後的機會。