24-04-27 22:31 发布于 安徽 来自 微博视频号
Vidu:可生成16 秒、1080P 视频的模型

生数科技与清华大学共同发布了中国首个长时长、高一致性、高动态性视频大模型:Vidu。

这款模型被视为国内首个达到Sora级别的视频模型。

Vidu 不仅能模拟真实物理世界,还具备丰富的想象力,支持多镜头生成和高时空一致性。

Vidu 模型融合了 Diffusion 与 Transformer 技术,创新性地开发了 U-ViT 架构。

能够一键生成长达 16 秒、分辨率高达 1080P 的高清视频内容。

在官方资料中,展示了一个视频示例,内容是“画室中的一艘船驶向镜头”,展现了船和海浪的逼真效果。

Vidu 不仅能模拟真实物理世界,还具备丰富的想象力,支持多镜头生成和高时空一致性。

详细:O网页链接 L互联网的那点事的微博视频
欢迎新用户
o p

正在加载,请稍候...