Veo

生成式 AI 视频模型，专注于从文本或图像提示生成高质量视频内容，能够模拟真实物理运动、人物动态和电影级叙事

Google Veo 是 Google DeepMind 开发的一系列生成式 AI 视频模型，专注于从文本或图像提示生成高质量视频内容。它标志着 AI 在视频创作领域的重大进步，能够模拟真实物理运动、人物动态和电影级叙事。

Veo 的强大在于其对提示的精确响应和多模态集成。以下是关键特性：

视频生成能力：
- 分辨率与时长：支持 720p 到 1080p，时长通常为 4-8 秒。帧率为 24 FPS，确保流畅运动。
- 输入类型：文本提示、图像参考、起始/结束帧（用于过渡动画）。
- 输出质量：生成照片级真实视频，减少视觉伪影（如畸形手部或不连贯运动）。支持多种风格，包括电影级、抽象艺术或真实纪录片。
音频集成：
- 原生生成同步音轨，包括对话、环境音和音效。提示中指定“低沉的旁白”或“雨声渐强”即可实现。
- 示例：从提示“一个雨中奔跑的侦探，伴随心跳声和雷鸣”生成带音频的 8 秒视频。

创意控制工具：

生成模式：