Meta推出Movie Gen 旗下迄今最先進的視訊生成AI模型

2024-10-04 22:25:00

Meta 今天釋出了 MovieGen 系列媒體基礎AI模型，該模型可根據文本提示生成帶聲音的逼真視訊。 MovieGen 系列包括兩個主要模型： MovieGen Video 和 MovieGen Audio。

MovieGen Video 是一個具有 300 億個參數的變換器模型，可根據單個文本提示生成高品質、高清晰度的圖像和視訊，生成的視訊可長達 16 秒，每秒 16 幀。

MovieGen Audio 是一個 130 億參數的變壓器模型，可以接收視訊輸入和可選的文本提示，并生成與輸入視訊同步的長達 45 秒的高保真音頻。這種新的音頻模型可以生成環境音效、器樂背景音樂和 Foley 音效。 Meta 聲稱它在音頻品質、視訊與音頻對齊和文本與音頻對齊方面都能提供最先進的效果。

這些模型不僅僅用于建立全新的視訊。它們可用于使用簡單的文本提示編輯現有視訊。 MovieGen 還允許使用者進行本地化編輯，如添加、删除或替換元素，以及進行背景或樣式更改等全局更改。例如，如果您有一段某人扔球的視訊，并配有簡單的文字提示，您可以将視訊改為某人扔西瓜，同時保留原始内容的其餘部分。

MovieGen 模型将允許使用者建立個性化視訊。通過使用人物圖像和文字提示，這些模型可以生成保留人物特征和動作的個性化視訊。 Meta 聲稱，這些模型在視訊中的人物保護和自然運動方面提供了最先進的成果。

Meta 聲稱，與其他視訊生成模型（包括 OpenAI Sora 和 Runway Gen-3）相比，這些模型能生成更好的視訊。 Meta 目前正與創意專業人士合作，在公開釋出之前進一步改進該模型。

了解更多/Meta

Meta推出Movie Gen 旗下迄今最先進的視訊生成AI模型

繼續閱讀

視訊|李豫貴到團省委開展青年工作調研

終端AI分級标準落地，手機大模型“戰火”燒到了智能體

J Clin Invest丨楊偉莉/李世華/李曉江團隊利用猴模型揭示帕金森疾病新病理機制

大模型訓練遭投毒損失千萬美元？Anthropic發現LLM代碼庫暗藏bug

全市近千名青少年齊聚中海博，在航海、航空、建築三大模型競賽中一展身手

DeepMind聯合MIT開發Fluid，讓自回歸模型實作文生圖的大規模擴充

近日菲律賓一中國人被同胞清空彈夾監控視訊曝光!

AI周報 | 位元組跳動大模型訓練被“投毒”；微軟将終止中國個人Azure OpenAI服務

Tesla澄清Optimus并非背後有人操控釋出最新展示視訊

會聲會影視訊封面圖怎麼設定

為了流量不擇手段！販賣悲傷、制造同情......短視訊的擺拍套路有多深？

小商販有暴力傾向，城管态度始終很好，原視訊我看了，咱有一說一

位元組跳動回應大模型訓練被實習生攻擊：已被辭退，不影響線上業務

籃球場女孩被男子踹飛倒地後續：警方介入，視訊曝光，評論區淪陷

以軍新視訊指辛瓦爾曾帶妻兒隧道避難，紙巾留下DNA洩露行蹤

微視訊｜金磚力量