在今年的 I/O 开发者大会上,谷歌发布新一代视频生成模型 Veo3,这也是其首个可生成视频背景音效的模型。它不仅能合成画面,还能为鸟鸣或街头交通等场景配上相应的音效,甚至还可生成人物对话。谷歌称,Veo 3 在物理模拟与口型同步方面也表现优异。目前,该模型仅面向美国地区的 Gemini Ultra 用户,以及 Vertex AI 的企业用户开放,也已集成进谷歌的 AI 影视制作工具 Flow 中。用户仍可为 Veo 2 提供人物、风格、场景或物体的图像参考,并通过 Flow 使用镜头控制功能进行旋转、缩放,甚至将画面从竖屏调整为横屏,或在视频中添加、删除元素。
扫码关注二维码
2025-05-15 11:25
2025-05-15 19:56
2025-05-16 15:53
2025-05-13 20:46
2025-05-17 11:22
2025-05-14 11:45
扫码加入社群
扫一扫
关注亿恩公众号