NotebookLM 是谷歌推出的一款研究助手型 AI 工具,也是其最强大的 AI 工具之一。它配备了丰富的功能,让深入研究变得更加轻松,而音频和视频概览等特性更让学习过程变得更具互动性和趣味性。受到其广受欢迎的启发,谷歌正将其中的一项功能扩展到其他应用中。

谷歌目前正在将 NotebookLM 的音频概览功能扩展到保存在 Google Drive 中的 PDF 文件。借助该功能,任何 PDF 的内容都可以被转换为类似 NotebookLM 音频概览的交互式播客式音频摘要。

现在,当你在 Google Drive 中打开 PDF 文件时,会在文档预览顶部看到一个专用按钮,用于生成音频概览。你可以点击该按钮,或在与 Gemini 互动的侧边栏中输入提示。根据文档的长度,Google 表示 Drive 将生成时长约为 2 到 10 分钟不等的音频概览。
目前,你只能在网页端创建音频概览;不过我们也希望谷歌能尽快为移动端应用加入这一功能。
当你点击播放生成的音频概览时,它会在新标签页中打开,并像普通音频文件一样在 Drive 中播放。这是因为生成的音频概览也会作为一个独立文件保存在你的 Google Drive 中。不过遗憾的是,Gemini 的侧边栏目前并不会保存任何对话历史,因此若想之后再次访问,只能通过新生成的文件来进行。
目前,你还无法像在 NotebookLM 中那样打断或与 AI 播客主持人互动。而且,与 NotebookLM 一样,目前也尚未支持进度同步或文字转录功能,不过我们希望谷歌未来能完善这些特性。
与 Drive 或 Gmail 中的其他 Gemini 功能一样,音频概览目前并非免费功能。它需要用户拥有 Google Workspace 会员资格(支持企业版和教育版),或付费订阅 Gemini 服务。谷歌表示,Drive 中的 PDF 音频概览功能将从今天(11 月 12 日)开始逐步推出,并将在接下来的几周内向所有 Workspace 和 Gemini AI Pro 或 Ultra 用户开放。
谷歌尚未明确说明此次更新的地区范围,因此我们可以预计该功能将面向全球用户开放。但需要注意的是,初期版本仅支持英文文档。