OpenAI 刚刚宣布,ChatGPT 正式迈入更先进的智能代理(agentic AI)时代,推出了一项全新的功能 ——“ChatGPT 代理”(ChatGPT Agent)。这项新功能将突破传统聊天机器人的使用场景,能够在无需过多干预的情况下执行多步骤任务。

ChatGPT 代理是在现有“操作员”功能的基础上进一步发展而来。现在,ChatGPT 可以自主完成多个任务步骤,不再局限于网页浏览器环境。OpenAI 表示,通过该代理功能,ChatGPT 将能够在“使用自己的电脑”时执行更复杂的操作。其中一个关键特点是,它具备像人类一样“停下来做出决策”的能力。OpenAI 联合创始人 Sam Altman 指出,这一代理将依靠 ChatGPT 强大的深度研究能力与对话能力,根据当前需求自主判断是快速行动还是深入分析。
在演示视频中,OpenAI 说明,用户无需始终主动使用 ChatGPT 应用或网页界面,任务依然可以继续运行,这对于同时处理多项事务的用户非常有帮助。在登录过程中可能仍需用户手动输入凭据。出于安全考虑,金融交易功能被禁用;如果用户跳转至支付页面,与 ChatGPT 的交互也会被终止。
OpenAI 补充称,这一体验是交互式的,用户可以随时中断代理任务,更新指令或提供补充说明。借助连接器(connectors),用户还可接入第三方应用,如 Gmail 或 Google Drive;而更高级的用户甚至可以通过 API 将其连接至外部应用程序。虽然 OpenAI 对代理的能力充满信心,但也坦言,目前从零创建的幻灯片可能仍欠缺精细度。
ChatGPT 代理目前仅面向付费用户开放,首批为“Pro”订阅用户,而“Plus”与“Team”级别的用户将在接下来的几周内陆续获得访问权限。教育版与企业版用户也将在未来几周内获得该功能。