Meta推出Movie Gen 旗下迄今最先进的视频生成AI模型

2024-10-04 22:25:00

Meta 今天发布了 MovieGen 系列媒体基础AI模型，该模型可根据文本提示生成带声音的逼真视频。 MovieGen 系列包括两个主要模型： MovieGen Video 和 MovieGen Audio。

MovieGen Video 是一个具有 300 亿个参数的变换器模型，可根据单个文本提示生成高质量、高清晰度的图像和视频，生成的视频可长达 16 秒，每秒 16 帧。

MovieGen Audio 是一个 130 亿参数的变压器模型，可以接收视频输入和可选的文本提示，并生成与输入视频同步的长达 45 秒的高保真音频。这种新的音频模型可以生成环境音效、器乐背景音乐和 Foley 音效。 Meta 声称它在音频质量、视频与音频对齐和文本与音频对齐方面都能提供最先进的效果。

这些模型不仅仅用于创建全新的视频。它们可用于使用简单的文本提示编辑现有视频。 MovieGen 还允许用户进行本地化编辑，如添加、删除或替换元素，以及进行背景或样式更改等全局更改。例如，如果您有一段某人扔球的视频，并配有简单的文字提示，您可以将视频改为某人扔西瓜，同时保留原始内容的其余部分。

MovieGen 模型将允许用户创建个性化视频。通过使用人物图像和文字提示，这些模型可以生成保留人物特征和动作的个性化视频。 Meta 声称，这些模型在视频中的人物保护和自然运动方面提供了最先进的成果。

Meta 声称，与其他视频生成模型（包括 OpenAI Sora 和 Runway Gen-3）相比，这些模型能生成更好的视频。 Meta 目前正与创意专业人士合作，在公开发布之前进一步改进该模型。

了解更多/Meta

Meta推出Movie Gen 旗下迄今最先进的视频生成AI模型

继续阅读

视频|李豫贵到团省委开展青年工作调研

终端AI分级标准落地，手机大模型“战火”烧到了智能体

J Clin Invest丨杨伟莉/李世华/李晓江团队利用猴模型揭示帕金森疾病新病理机制

大模型训练遭投毒损失千万美元？Anthropic发现LLM代码库暗藏bug

全市近千名青少年齐聚中海博，在航海、航空、建筑三大模型竞赛中一展身手

DeepMind联合MIT开发Fluid，让自回归模型实现文生图的大规模扩展

近日菲律宾一中国人被同胞清空弹夹监控视频曝光!

AI周报 | 字节跳动大模型训练被“投毒”；微软将终止中国个人Azure OpenAI服务

Tesla澄清Optimus并非背后有人操控发布最新展示视频

会声会影视频封面图怎么设置

为了流量不择手段！贩卖悲伤、制造同情......短视频的摆拍套路有多深？

小商贩有暴力倾向，城管态度始终很好，原视频我看了，咱有一说一

字节跳动回应大模型训练被实习生攻击：已被辞退，不影响线上业务

篮球场女孩被男子踹飞倒地后续：警方介入，视频曝光，评论区沦陷

以军新视频指辛瓦尔曾带妻儿隧道避难，纸巾留下DNA泄露行踪

微视频｜金砖力量