谷歌最新的 AI 文本生成视频工具可让你从零开始创作完整电影

谷歌近日宣布,其 AI 工具包新增了一项强大功能:Vertex AI Media Studio。这是一个生成式工具套件,用户仅需输入文字提示,就能制作出精美的视频。该平台基于 Google Cloud 的 Vertex AI 构建,集成了谷歌多种先进模型,涵盖视频制作的各个方面,包括画面、配音和背景音乐,用户无需任何视频编辑或编程经验。

谷歌最新的 AI 文本生成视频工具可让你从零开始创作完整电影

使用者可先借助谷歌的图像生成模型 Imagen 3 创建图片,然后再通过视频生成模型 Veo 2 将图片转换为视频。Veo 2 还提供了一些自定义工具。谷歌表示,Veo 允许用户选择摄像机运动方式(如无人机视角或平移镜头)、调整帧率、设置视频时长等。如果模型添加了用户不喜欢的元素,还可通过类似 Pixel 手机中“魔术橡皮擦”的功能将其移除。

完成画面制作后,Media Studio 会调用谷歌的语音合成模型 Chirp 添加配音。最后,由谷歌 DeepMind 与 YouTube 联合开发的音乐生成模型 Lyria 为视频生成背景音乐。

理论上,这一整套流程可以在 Vertex AI Studio 的统一工作界面内完成,最终生成一个看起来专业、听起来悦耳的成品视频,用户可以立即分享。这也是开发者测试谷歌最新 Gemini 模型的控制台。

Vertex AI 是承载这些工具的广义平台,它提供对Gemini模型的访问。谷歌称,Gemini 可以处理文本、图像、代码等多种数据类型,从而生成多样化的输出内容。无论是开发者还是普通用户,都可以在 Vertex AI Studio 这一原型环境中测试提示词,并微调AI模型来完成特定任务。

尽管这些新工具在简化内容创作方面前景广阔,但也引发了关于真实性、人类创意以及 AI 责任使用的老问题。不过,谷歌显然押注于这样的趋势:越来越多缺乏剪辑技能的用户将会欢迎这种只需几次点击就能生成高质量品牌视频的便捷方式。

上一篇 2025年4月7日 23:41
下一篇 2025年4月9日 20:39

相关推荐

  • Gemini Live 让你的三星 Galaxy 手机变得更加实用了

    谷歌最近推出了一项名为 Gemini Live 的新功能,允许用户在对话过程中与其他谷歌应用进行互动。该功能目前支持用户在对话中使用 Google 地图、日历、Keep 和任务等应用执行各种操作。不过,我们最近发现的迹象显示,未来可能会支持更多应用,如 YouTube、Spotify、WhatsApp 和 Drive。虽然这些应用的支持尚未正式上线,但谷歌已…

    2025年7月10日
    645
  • JBL Tour Pro 3发布,配备更智能、更古怪的外壳

    JBL的Tour Pro 2耳机不仅因其出色的音频功能而受欢迎,还因为其独特的带内置触摸屏的充电盒。现在,JBL希望通过其新的Tour Pro 3耳机,在可用性和音质之间取得更好的平衡,这款耳机带有更先进的功能。JBL Tour Pro 3配备更大的触摸屏,不仅仅用于控制。 与JBL Tour Pro 2一样,第三代Tour Pro耳机的亮点是:一个带显示屏…

    2024年8月22日
    1.4K
  • 你的Pixel设备可能很快会提醒你另一种拨打电话的方式(APK拆解分析)

    Wi-Fi通话是现代智能手机上非常实用的功能之一,它允许用户通过互联网进行传统的手机通话,尤其适用于移动信号较弱或无信号的地区。现在,谷歌似乎计划提醒用户启用这个功能。 我们深入研究了Adaptive Connectivity Services应用(版本p.2025.01),发现 谷歌将向Pixel用户发送通知,提醒他们启用Wi-Fi通话。以下是相关代码字符…

    2025年2月3日
    511
  • Android 16 将把这个关键的防盗功能带到更多手机上

    智能手机越来越频繁地成为小偷的目标,盗窃者盗取它们并非因为其金钱价值,而是因为其中包含大量的私人金融数据。为了应对手机盗窃的增加,Google 去年推出了几个防盗功能,使小偷更难以访问被盗手机上的数据。其中一个名为“身份验证”(Identity Check)的功能,即使小偷知道手机的密码,也能防止他们解锁敏感应用。目前,身份验证功能仅适用于 Pixel 和三…

    2025年4月15日
    853
  • Gboard 或将大幅简化无须触碰手机即可输入和编辑文字的操作(APK 解析)

    随着谷歌准备推出即将发布的 Pixel 10 系列手机,我们看到越来越多迹象表明,谷歌正在通过 Magic Cues 在其多款应用中引入 AI 的情境化应用。就 Gboard 而言,我们此前见过谷歌推出的半成品写作工具,利用 AI 帮助用户在任何应用中撰写或优化文本。现在,我们看到更多关于 Gboard 语音输入功能改进的细节,这些改进利用生成式 AI 进行…

    2025年7月11日
    502