Google 那款出色的虚拟播客工具现在学会了几乎所有语言的表达

我们可能现在听起来像个重复的唱片,但 Google 最初为 NotebookLM 推出的音频概览,可能是我们在过去几年中看到的最酷的 AI 相关功能。一个多月前,Google 通过将这些类似播客的音频摘要直接嵌入 Gemini,使它们能够接触到更广泛的观众。系统能够将主题拆解并以易于理解的方式传达,这已经非常令人印象深刻,而现在 Google 又推出了一个重大的扩展,这将使音频概览变得更加易于获取。

Google 那款出色的虚拟播客工具现在学会了几乎所有语言的表达

能够跨多种语言解析文档已经相当令人印象深刻,但 Google 更进一步,让音频概览能够在 50 多种语言中生成语音输出。有时候我们习惯看到 Google 在为这类系统添加新语言时步伐较为零散,因此看到公司像这样全力以赴地进行统一努力,实在令人欣慰 —— 尽管总会有一些边缘情况,但这应该足以满足绝大多数用户的需求。

除了包含的语言种类之广,我们还对 Google 提到 NotebookLM 能够无缝切换语言的方式印象深刻。该工具将新增一个专门用于设置输出语言的选项,如果你需要为一个语言需求多样的群体准备材料,可以轻松地切换到你想要的语言。

如果你还没尝试过音频概览,现在正是一个好时机。只需打开 NotebookLM,提供一些源文档(或者让它自行搜索),然后让音频概览开始为你编织播客般的魔力——你甚至可以引导对话朝着你想要的方向发展。

上一篇 2025年4月30日 08:28
下一篇 2025年4月30日 08:36

相关推荐

  • 谷歌希望为更多的第三方相机应用提供RAW照片支持

    智能手机摄影技术已经取得了很多的进步,虽然大多数人对于智能手机摄像头的默认输出效果感到满意,但仍有一些人希望在分享照片之前对其进行美化。不幸的是,当你给Android的照片编辑应用程序提供以 JPEG 格式保存的照片时,它们能做的调整有限。如果你想要更多的编辑自由,那么你需要切换到RAW格式拍摄。然而,许多带有摄像功能的Android应用并不支持RAW格式拍…

    2024年11月10日
    944
  • 谷歌更新后的 Gemini 2.5 Flash 定价既有好消息,也有坏消息

    谷歌今年早些时候推出了 Gemini 2.5,其中首款机型是 Pro(实验版)。几个月后,谷歌又在早期访问中推出了一款速度更快的模型,名为 Gemini 2.5 Flash。现在,该公司对这两款模型发布了最新进展,并预览推出了一款速度更快的新模型。 目前要搞清楚所有不同的 Gemini 模型可能有点困难,但谷歌在 2.5 系列中推出了第三款模型。这款新模型名…

    2025年6月18日
    629
  • Pixel 10 的这一新功能让你在手机旁入睡变得更轻松

    经过数月等待,谷歌正式发布了 Pixel 10 系列。随着新机发布,公司为这款最新旗舰手机带来了多项新功能,如语音翻译(Voice Translate)、自动最佳拍摄(Auto Best Take)等。其中一个不容忽视的新功能,是针对屏幕保护程序的新技巧。 将手机放在床边充电并不少见。然而,如果启用了屏幕保护程序,手机发出的光可能会分散注意力或影响睡眠。虽然…

    2025年8月21日
    367
  • 苹果的Android Automotive竞争对手无限期推迟

    多年来,CarPlay一直通过优化的用户界面将iPhone屏幕镜像到车辆的信息娱乐系统,允许用户通过数字地图进行音乐播放和导航。在WWDC22的主题演讲中,苹果宣布了CarPlay 2,并承诺将在去年推出。与Android Automotive类似,下一代CarPlay将在部分情况下无需连接智能手机即可工作,让用户可以访问车辆控制和相关数据。然而,在错过了2…

    2025年1月24日
    624
  • 索尼庆祝PlayStation 30周年,推出PS5和PS5 Pro的PS1复古版

    很难相信,距离初代PlayStation发布已经过去了30年。为了庆祝其三十周年纪念,PlayStation推出了一款限量版的数字版PS5、PS5 Pro以及一系列致敬公司起源的配套产品,就像他们在二十周年时所做的那样。 今天,PlayStation发布了一段视频和一篇博客,正式宣布了30周年纪念系列的推出。每款产品都包括采用初代PlayStation配色设…

    2024年9月20日
    916