早在 2024 年,苹果就承诺会对 Siri 进行重大升级,使其更好地理解语音指令,拥有更直观的底层模型,并实现与系统的“深度集成”。不过,由于性能问题,这次升级被推迟,苹果选择集成 ChatGPT 来保持在 AI 竞赛中的竞争力,而没有从根本上升级 Siri。新版 Siri 预计将在明年某个时间发布。为了弥补长时间的延迟,苹果可能会赋予 Siri 卓越的能力,让它仅凭语音就能全面控制你的 iPhone,远远领先于竞争对手 Gemini。

此前,苹果展示的 Siri 增强功能主要限于系统应用和设置。但彭博社 Mark Gurman 本周末发布的《Power On》通讯(付费内容)透露,增强版 Siri 将能够控制任何第三方应用。Gurman 表示,借助新版 Siri,你将可以用语音完成编辑照片、评论社交媒体帖子,甚至在任何购物应用中购买特定商品等操作。
这次改进得益于苹果的 App Intents 框架,该框架允许苹果的界面(如 Spotlight 或 Siri)通过非苹果开发的应用执行操作,类似于安卓的 App Actions。
苹果的目标是让你用语音像平时操作一样控制 iPhone、iPad 或 Mac,无需触摸输入。Gurman 未透露具体技术细节,但表示苹果正积极测试该功能,重点解决性能问题,尤其是涉及财务交易等“高风险”场景。目前,升级版Siri正在测试支持包括 AllTrails、亚马逊、Facebook、Temu、Threads、优步、WhatsApp 和 YouTube 在内的一系列热门第三方应用。但该功能的成功依赖于 App Intents 能否与大量应用无缝兼容,因此苹果工程师正全力确保广泛支持。
苹果很可能会在 2026 年春季推出这次全新的 Siri 体验,或作为 iOS 26.4 的一部分。如果实现得当,这将开启智能移动使用的新纪元,并有望激励谷歌推出类似功能。
新版Siri还可能使传闻中的苹果智能家居产品(包括智能显示屏和桌面机器人)区别于亚马逊或谷歌的现有产品。这也是为什么 Siri 的延迟不仅影响了移动设备,还波及苹果的其他产品线。
Gemini 能与新版 Siri 竞争吗?
目前,我们已有迹象表明谷歌尝试通过 Gemini 控制第三方应用,但其功能主要限于谷歌自家的少数应用。谷歌在这方面的重大突破可能是传闻中的 Magic Cue 功能,据说它能读取屏幕内容、捕捉使用历史,并准备帮助你执行后续操作。我们尚不确定其具体功能及其与 Siri 的对比情况——也不清楚它是否能真正控制应用,还是仅仅提供操作建议。
此外,该功能可能仅在 Pixel 10 系列首发,而不会广泛推送至所有安卓设备,这可能让希望在手机上体验更智能助手的用户感到失望。