谷歌最新的 AI 文本生成视频工具可让你从零开始创作完整电影

谷歌近日宣布,其 AI 工具包新增了一项强大功能:Vertex AI Media Studio。这是一个生成式工具套件,用户仅需输入文字提示,就能制作出精美的视频。该平台基于 Google Cloud 的 Vertex AI 构建,集成了谷歌多种先进模型,涵盖视频制作的各个方面,包括画面、配音和背景音乐,用户无需任何视频编辑或编程经验。

谷歌最新的 AI 文本生成视频工具可让你从零开始创作完整电影

使用者可先借助谷歌的图像生成模型 Imagen 3 创建图片,然后再通过视频生成模型 Veo 2 将图片转换为视频。Veo 2 还提供了一些自定义工具。谷歌表示,Veo 允许用户选择摄像机运动方式(如无人机视角或平移镜头)、调整帧率、设置视频时长等。如果模型添加了用户不喜欢的元素,还可通过类似 Pixel 手机中“魔术橡皮擦”的功能将其移除。

完成画面制作后,Media Studio 会调用谷歌的语音合成模型 Chirp 添加配音。最后,由谷歌 DeepMind 与 YouTube 联合开发的音乐生成模型 Lyria 为视频生成背景音乐。

理论上,这一整套流程可以在 Vertex AI Studio 的统一工作界面内完成,最终生成一个看起来专业、听起来悦耳的成品视频,用户可以立即分享。这也是开发者测试谷歌最新 Gemini 模型的控制台。

Vertex AI 是承载这些工具的广义平台,它提供对Gemini模型的访问。谷歌称,Gemini 可以处理文本、图像、代码等多种数据类型,从而生成多样化的输出内容。无论是开发者还是普通用户,都可以在 Vertex AI Studio 这一原型环境中测试提示词,并微调AI模型来完成特定任务。

尽管这些新工具在简化内容创作方面前景广阔,但也引发了关于真实性、人类创意以及 AI 责任使用的老问题。不过,谷歌显然押注于这样的趋势:越来越多缺乏剪辑技能的用户将会欢迎这种只需几次点击就能生成高质量品牌视频的便捷方式。

上一篇 2025年4月7日 23:41
下一篇 2025年4月9日 20:39

相关推荐

  • 谷歌 CEO 暗示:iPhone 用户今年可能会看到 Gemini 集成

    谷歌母公司 Alphabet 正在应对美国司法部(DOJ)提起的一项反垄断诉讼,该案可能导致公司被迫出售 Chrome 浏览器。在该案的法庭审理过程中,首席执行官桑达尔·皮查伊(Sundar Pichai)提到,公司正与苹果洽谈一项合作协议,计划将谷歌的人工智能服务整合进 iPhone。 据彭博社报道,皮查伊在法庭上表示,他希望 Gemini 能在今年作为 …

    2025年5月1日
    987
  • Google 电话应用正在开发更多 Material 3 Expressive 相关改进(APK 拆解)

    Material 3 Expressive 为 Android 平台带来了近年来最显著的一些变化。虽然它并不是对用户体验(UX)进行彻底重构,但仍然有许多细微的调整,带来了更加愉悦和视觉上不同的体验。谷歌已经展示了部分即将应用于电话应用(Phone app)的 Material 3 Expressive 变更,而重新设计的通话手势甚至已经开始向用户推送。但这…

    2025年7月10日
    601
  • 看这个人在 Galaxy Watch Ultra 上玩《巫师3》

    我们已经见过有人通过模拟器在智能手表上运行复古游戏,但事实上,你甚至可以在 Wear OS 手表上玩完整的 PC 游戏。不过,说实话,我也不太明白为什么你会想这么做。 Reddit 用户 BranaMitrovicFloyd 发布了一段视频,展示了 GeForce Now 在 Galaxy Watch Ultra 上运行的画面。该用户借助屏幕上的控制按钮和触…

    2025年6月23日
    580
  • 谷歌 Pixel Watch 4 渲染图泄露:这次有哪些新变化?

    谷歌 Pixel Watch 3 是我们 2024 年最喜欢的智能手表之一,具备多天续航时间、更出色的追踪功能等优点。我们正热切期待 Pixel Watch 4 的发布,而一位博主刚刚曝光了这款即将上市的可穿戴设备。 据 91mobiles 和知名博主 Steve “OnLeaks” Hemmerstoffer 发布的渲染图显示,Pixel Watch 4 …

    2025年4月11日
    914
  • 圈选搜索的翻译功能即将迎来重大升级(APK 拆解)

    Google 的“圈选搜索”(Circle to Search)是一项非常出色的搜索功能,允许用户查找屏幕上任何内容的信息。除了搜索功能外,“圈选搜索”还能翻译屏幕上的静态文本,而这一功能即将迎来重大升级 —— 未来还将支持动态文本的翻译。 我们最近了解到,Google 正在“圈选搜索”中测试一项名为“实时翻译”(Live Translate)的新功能。顾名…

    2025年8月18日
    673