谷歌最新的 AI 文本生成视频工具可让你从零开始创作完整电影

谷歌近日宣布,其 AI 工具包新增了一项强大功能:Vertex AI Media Studio。这是一个生成式工具套件,用户仅需输入文字提示,就能制作出精美的视频。该平台基于 Google Cloud 的 Vertex AI 构建,集成了谷歌多种先进模型,涵盖视频制作的各个方面,包括画面、配音和背景音乐,用户无需任何视频编辑或编程经验。

谷歌最新的 AI 文本生成视频工具可让你从零开始创作完整电影

使用者可先借助谷歌的图像生成模型 Imagen 3 创建图片,然后再通过视频生成模型 Veo 2 将图片转换为视频。Veo 2 还提供了一些自定义工具。谷歌表示,Veo 允许用户选择摄像机运动方式(如无人机视角或平移镜头)、调整帧率、设置视频时长等。如果模型添加了用户不喜欢的元素,还可通过类似 Pixel 手机中“魔术橡皮擦”的功能将其移除。

完成画面制作后,Media Studio 会调用谷歌的语音合成模型 Chirp 添加配音。最后,由谷歌 DeepMind 与 YouTube 联合开发的音乐生成模型 Lyria 为视频生成背景音乐。

理论上,这一整套流程可以在 Vertex AI Studio 的统一工作界面内完成,最终生成一个看起来专业、听起来悦耳的成品视频,用户可以立即分享。这也是开发者测试谷歌最新 Gemini 模型的控制台。

Vertex AI 是承载这些工具的广义平台,它提供对Gemini模型的访问。谷歌称,Gemini 可以处理文本、图像、代码等多种数据类型,从而生成多样化的输出内容。无论是开发者还是普通用户,都可以在 Vertex AI Studio 这一原型环境中测试提示词,并微调AI模型来完成特定任务。

尽管这些新工具在简化内容创作方面前景广阔,但也引发了关于真实性、人类创意以及 AI 责任使用的老问题。不过,谷歌显然押注于这样的趋势:越来越多缺乏剪辑技能的用户将会欢迎这种只需几次点击就能生成高质量品牌视频的便捷方式。

上一篇 2025年4月7日 23:41
下一篇 2025年4月9日 20:39

相关推荐

  • 最新的Pixel 9a泄露图聚焦于其全新的相机设计

    谷歌正准备在本月晚些时候发布一款全新的中端手机,但该公司似乎难以保密。在过去几周内,Pixel 9a的几乎所有信息都已曝光,包括其全新的设计、规格以及售价。甚至已经有高清渲染图流出,展示了这款设备的所有炫酷配色和不同角度的外观。 如今,该设备的营销图片也在网上浮出水面,进一步确认了之前泄露的设计,并揭示了一些新的细节。知名博主Evan Blass分享的最新图…

    2025年3月7日
    928
  • 三星 Galaxy S26 系列爆料再次暗示将走向 Edge 版本的未来

    我们已经知道三星正在紧锣密鼓地研发 Galaxy S26 系列,而且已经有一些相关爆料流出。现在,一家可靠媒体披露了关于三星 2026 年旗舰安卓手机的更多细节。 据 WinFuture 报道,他们从一个匿名数据库中获悉,三星目前正在开发三款 Galaxy S26 手机,代号分别为 NPA1、NPA2 和 NPA3。NPA 的缩写可能代表“Next Para…

    2025年7月14日
    580
  • 这款旗舰手机有望打破Galaxy S25 Ultra的局面,外观上也像徕卡相机

    小米已经连续几周预告小米15 Ultra,预计它将成为2025年最佳拍照手机的强有力竞争者。现在,公司已正式公布了手机的设计和一些摄像头规格。 今天,公司在社交媒体上发布了小米15 Ultra的设计图。图片展示了一款外观与徕卡相机相似的手机,与最近的泄露信息一致。手机背面采用双色设计,包含皮革和看起来像是玻璃的材质,配有类似奥利奥大小的摄像头凸起。以下是这些…

    2025年2月24日
    875
  • 讨厌 Galaxy S25 Edge 的小电池?那你看到泄露的 iPhone 17 Air 电池详情后可能会笑出声

    Galaxy S25 Edge 的发布并未如三星所期待的那样获得满堂喝彩。虽然该机仅有 5.8 毫米的厚度令人称赞,但 3,900mAh 的电池容量却让不少粉丝感到失望,尤其是在它的售价还高于配备 4,900mAh 大电池的 Galaxy S25 Plus 的情况下。这也是为什么 Android Authority 最近进行的一项调查中,许多用户认为 Gal…

    2025年5月19日
    703
  • 以下是 Google 的 Circle to Search 如何可能引入到 Gemini 中的方式(APK 拆解)

    尽管 Android 已经存在了十多年,一些最实用的工具其实是最近才加入的。其中我们最喜欢的一项功能,就是能够直接询问 Google 屏幕上正在显示的内容。Circle to Search(圈选搜索)已成为与 Google 经典搜索工具交互的一种出人意料地强大的方式,而如今一切都在向 AI 靠拢,我们也一直好奇类似的输入机制是否会出现在 Gemini 中。上…

    2025年5月14日
    758