刚刚!美团开源AI长视频模型LongCat-Video,小参数强性能
创始人
2025-10-26 20:07:38
0

过去一年,全球AI视频生成的战场异常热闹:

OpenAI 推出 Sora,震惊全网;Runway、Pika、Kling、Wan 各显神通;可直到今天,国内终于出现了一个真正能打的开源长视频模型,它的名字叫 LongCat-Video,来自美团。

从“图生视频”到“世界模型”,美团这步棋不小

LongCat-Video 是美团团队打造的基础级视频生成大模型,拥有 136亿参数(13.6B),它能同时完成三类任务:

Text-to-Video:文字生成视频

Image-to-Video:图像生成视频

Video-Continuation:视频续写

这意味着,你不仅可以输入一句话生成视频,也可以让它从一张图“长出”完整的动态画面,甚至能让旧视频“续拍下去”,实现真正意义上的连续世界建模。

简单说,这是一只会“自己拍电影”的猫。

统一架构,打破任务壁垒

LongCat 最大的创新之一,是采用了统一架构(Unified Architecture)。

传统的视频生成模型往往针对不同任务各自独立,比如“图生视频”“文生视频”要分开训练,互不兼容;而 LongCat 用一个模型同时支持三类任务,在训练和推理上能实现知识共享,让模型在多任务中表现更加平衡。

这种设计的好处,是它能从不同模态中学到通用的视觉—语义映射,最终提升生成稳定性与画面一致性。

真正的“长视频生成”,不是拼接,而是连续

LongCat 在 Video-Continuation(视频续写)上进行了原生预训练,能生成分钟级视频,并且在长时序里依然保持稳定色彩、光线与运动逻辑,这点很关键。

过去的视频生成模型通常只能输出几秒钟片段,要拼成长视频,只能靠后期拼接。结果就是:光影断层、人物消失、场景跳帧。

LongCat 解决了这一“断片”问题,让生成视频的逻辑连贯性大幅提升。简单来说,它不再是“拼贴动画”,而是真正的故事流动。

高效推理与强化学习的双引擎

LongCat 使用了多项效率与质量兼顾的技术:

720p、30fps 视频可在数分钟内生成;

使用 Block Sparse Attention 提升高分辨率推理速度;

采用多奖励强化学习(Multi-reward RLHF)框架,让模型同时优化“文本对齐”“视觉质量”“动作连贯”三项指标。

在算法层面,美团提出了自己的 GRPO(Group Relative Policy Optimization),这是一种改良版的 RLHF(人类反馈强化学习)策略,使视频生成不再依赖单一评价维度,而能多指标协同进化。

性能对比:小参数,强性能

在美团自测的 MOS(主观质量评估)基准中,LongCat-Video 以 13.6B 参数的体量,表现几乎追平甚至超越部分 28B 级别的开源模型。

在参数量仅一半的情况下,LongCat 的综合表现已追平 Wan 2.2 系列。

这意味着:更轻、更快、更稳。

LongCat-Video 采用 MIT License,这也是目前最宽松的商业开源协议之一。任何个人、企业都可以在遵守协议前提下自由商用。模型已同步上传至 HuggingFace。

从“短视频AI”到“世界模型”的拐点

LongCat-Video 不只是又一个“文生视频”模型,而是美团通往 World Model(世界模型)的起点。

所谓“世界模型”,指的是 AI 能理解并持续模拟现实世界的动态规律。换句话说,AI 不仅能画出画面,还能理解“为什么这个人会往前走”、“为什么云会动”、“为什么光会变”。

LongCat 就像是“现实模拟引擎”的早期形态。它生成的,不只是视频,而是连续的因果世界。

国产AI视频的拐点已至

LongCat-Video 的开源,意味着:

中国团队首次在长视频生成方向实现自主可控的完整体系;

算法、算力、生态三位一体的国产替代路径逐步成形;

美团AI团队,正在从“商业智能”跨向“生成智能”。

相关内容

原创 ...
在中国历史上,许多帝王的登基之路充满了权力斗争和血腥冲突,但也有一...
2025-10-26 05:02:56
原创 ...
“冯唐易老,李广难封。”这句名言出自司马迁的《史记》,其背后有着深...
2025-10-26 05:02:30
广东举办米其林美食节 展现...
新华社深圳10月25日电(记者王丰)24日,金秋的深圳迎来一场味觉...
2025-10-26 04:44:50
原创 ...
刘备,作为蜀汉的开国皇帝,不仅具有远见卓识,更有识人之慧。相比之下...
2025-10-26 04:32:54
原创 ...
古代两军交战时,往往会有专门的士兵扛着军旗,虽然这些旗手手无寸铁,...
2025-10-26 04:31:42
原创 ...
在太平天国运动的动荡时期,清政府开始逐渐依赖汉人来平定叛乱,曾国藩...
2025-10-26 04:02:21
原创 ...
是非分明未必是福 中国人最不欣赏那些过于是非分明的人。三国时期...
2025-10-26 04:02:05
原创 ...
提到三国时期的美女,大家常常会想到貂蝉,这个角色大多来源于《三国演...
2025-10-26 04:01:59
马勇:“人努力,天帮忙” ...
10月22日,“85鉴定”40周年大会在贵州遵义汇川举办。 在“传...
2025-10-26 03:55:06

热门资讯

银河证券:以新需求引领新供给,... 【大河财立方消息】10月26日,银河证券研报称,以新需求引领新供给,就是要大力发展新消费: 1)随着...
原创 重... 现在俄罗斯的手中是积压着数百亿的印度卢比,正在悄然地推动着全球贸易结算体系的变革。 俄乌冲突爆发以后...
原创 3... 千万别觉得美国搞的关税战是“打嘴炮”,这波操作是真往跨境电商的命门上戳。 但有意思的是,一边是新闻...
美国主权信用评级遭下调,发生了... 每经编辑|毕陆名 据央视新闻,欧洲信用评级机构范围评级公司日前发布报告,将美国主权信用评级从“AA...
“十五规划”干货来了! 《“十五规划”干货来了!》 ——从“稳得住”到“跑得快”,中国经济的新引擎已经点火 你有没有发...
比高集团(08220.HK):... 比高集团(08220.HK)发布公告,自2025年10月28日起:周雅致女士及叶耀邦先生已辞任执行董...
不买金镯子改投资黄金 投资者该... 10月以来,黄金国际现货价格在连创历史新高后迎来重挫,受到市场高度关注。 “今天能不能买?”“均价9...
原创 没... 自2023年3月以来,中国房地产市场已进入深度调整期。根据最新数据,今年1月至11月,全国商品房销售...
你刷的短视频,标注“AI生成”... 二〇二五年中国国际信息通信展上,观众体验AI生成杂志封面照片。 罗 伟摄(人民图片) 在微信视频号,...
原创 路... 懂王的话术从“加征150%关税、取消会面(当时压根也没有确定会面)”到“会面未必取消”再到“中国和美...