谷歌最新的 AI 文本生成视频工具可让你从零开始创作完整电影

谷歌近日宣布,其 AI 工具包新增了一项强大功能:Vertex AI Media Studio。这是一个生成式工具套件,用户仅需输入文字提示,就能制作出精美的视频。该平台基于 Google Cloud 的 Vertex AI 构建,集成了谷歌多种先进模型,涵盖视频制作的各个方面,包括画面、配音和背景音乐,用户无需任何视频编辑或编程经验。

谷歌最新的 AI 文本生成视频工具可让你从零开始创作完整电影

使用者可先借助谷歌的图像生成模型 Imagen 3 创建图片,然后再通过视频生成模型 Veo 2 将图片转换为视频。Veo 2 还提供了一些自定义工具。谷歌表示,Veo 允许用户选择摄像机运动方式(如无人机视角或平移镜头)、调整帧率、设置视频时长等。如果模型添加了用户不喜欢的元素,还可通过类似 Pixel 手机中“魔术橡皮擦”的功能将其移除。

完成画面制作后,Media Studio 会调用谷歌的语音合成模型 Chirp 添加配音。最后,由谷歌 DeepMind 与 YouTube 联合开发的音乐生成模型 Lyria 为视频生成背景音乐。

理论上,这一整套流程可以在 Vertex AI Studio 的统一工作界面内完成,最终生成一个看起来专业、听起来悦耳的成品视频,用户可以立即分享。这也是开发者测试谷歌最新 Gemini 模型的控制台。

Vertex AI 是承载这些工具的广义平台,它提供对Gemini模型的访问。谷歌称,Gemini 可以处理文本、图像、代码等多种数据类型,从而生成多样化的输出内容。无论是开发者还是普通用户,都可以在 Vertex AI Studio 这一原型环境中测试提示词,并微调AI模型来完成特定任务。

尽管这些新工具在简化内容创作方面前景广阔,但也引发了关于真实性、人类创意以及 AI 责任使用的老问题。不过,谷歌显然押注于这样的趋势:越来越多缺乏剪辑技能的用户将会欢迎这种只需几次点击就能生成高质量品牌视频的便捷方式。

上一篇 2025年4月7日 23:41
下一篇 2025年4月9日 20:39

相关推荐

  • 谷歌希望让Android 16在音乐和视频流媒体播放方面表现更好

    每当您的Android设备播放任何类型的媒体文件,如歌曲或YouTube视频时,操作系统会生成多个复杂的单独进程,以确保媒体文件的安全播放。这是为了减轻利用格式错误的媒体文件或不安全的媒体编解码器的漏洞,例如几年前臭名昭著的Stagefright漏洞。虽然Android现在的媒体文件处理已经更加安全,但也显得低效,而Android 16中的一项新功能旨在解决…

    2025年4月4日
    1.1K
  • 从其他聊天机器人切换到 Gemini 可能很快就会变得更加容易

    毫无疑问,Gemini 是谷歌最重要的产品。因此,谷歌正持续为 Gemini 推出新功能以吸引用户,目前正在测试三项全新功能。不过,除了为用户增加新特性之外,谷歌似乎也在考虑用 Gemini 直接取代另一款聊天机器人。 在 Gemini 目前测试的这些功能中,最引人注目的当属从其他 AI 聊天机器人导入对话的能力,而且还能完整保留对话中共享的所有信息和媒体内…

    2026年2月3日
    233
  • 三星可能正在重新规划 Galaxy S26 系列,而这一线索就藏在型号编号中

    三星刚刚完成了全新 Galaxy Z Fold 7、Galaxy Z Flip 7 以及 Galaxy Z Flip 7 FE 的发布。这些新款折叠屏设备颇具看点,但与此同时,关于三星下一代旗舰机型 Galaxy S26 系列的爆料也开始浮出水面。目前我们已经看到了 Galaxy S26 Edge 和 Galaxy S26 Ultra 的型号信息泄露,而现在…

    2025年7月11日
    683
  • 有一个更好的 Nothing Phone 3 版本,但你无法在美国买到

    Nothing Phone 3 昨天终于发布,这款手机整体表现不错,但设计风格颇具争议。然而,事实证明其中一个地区版本配备了更大容量的电池。 Nothing 向 Android Authority 证实,印度版 Nothing Phone 3 配备了 5500mAh 电池。相比之下,其他型号(包括美国版本)使用的是 5150mAh 电池。此前,Nothing…

    2025年7月2日
    614
  • 你很快可能就能在其他应用上方使用 Gemini Live(APK 解析)

    Google Gemini 注定将在今年年底前全面取代 Android 手机上的 Google Assistant。为此,谷歌正不断升级这款聊天机器人的功能,尤其是在 Gemini Live 上下功夫。这一功能支持实时对话,相较于标准界面能够实现更自由的信息交流。在这一进程中,谷歌也在持续优化 Gemini Live 的界面。今天,我们看到的就是朝这一方向迈…

    2025年8月19日
    579