谷歌已为我们提供了许多用于处理图像的强大工具,数月前,我们还发现了另一重大功能开发的迹象:即允许用户对通过 Gemini 应用程序分享的图像进行标注。几周前,有消息泄露称,谷歌正为网页版 Gemini 准备同样的标注功能。如今,这两项功能似乎都已进入积极测试阶段。

在收到 Telegram 用户迭戈(Diego)提供的线索后,我们启动了 Gemini 进行验证,并确认在 Gemini 应用程序以及 Chrome 浏览器桌面端的 Gemini 中均能看到这一标注功能。首次在安卓版Gemini中附加图像时,该应用会告知用户这一新功能:

在上次的拆解分析中,我们就已发现这一基于编辑功能的引导性说明提示,不过请放心,这并非该工具的唯一用途。正如我们最初所预料的那样,它还能引导 Gemini 关注图像中的特定区域。


正如你在图像编辑和分析中所看到的那样,当我们输入提示词时,Gemini 能够轻松理解我们关注的输入图片中的那部分内容。
编辑功能在此处的展示效果或许更为出色,但即便右侧 Gemini 的分析出现了偏差(你怎么会把曼佐卡斯(Mantzoukas)和谢尔(Scheer)搞混呢?),它也显然明白我们询问的是图片中三人里最左边的那个人。
目前,我们仍无法确定这一测试的普及范围有多广,也不清楚谷歌是否真的正在全面推出这项功能。希望周末过后我们能对其可用性有更清晰的了解,不过你现在就可以检查自己的设备,看看能否开始使用这些工具。