用于计算机使用代理的 GPT-5。
社区文章 发布于 2025 年 8 月 8 日
任务相同,基础模型也相同,我们只是将思考模型从 GPT-4o 换成了 GPT-5。
左 = 4o,右 = 5。
看 GPT-5 遥遥领先。
推理模型:OpenAI GPT-5
基础模型:Salesforce GTA1-7B
操作空间:CUA 云实例 (macOS/Linux/Windows)
任务是:“导航到 {random_url} 并玩游戏,直到得分达到 5/5”……每个任务都是通过让 Claude 从预定义的提示列表(多项选择题、表格填写或颜色匹配)中生成一个随机应用来设置的。
在这里亲自尝试:https://github.com/trycua/cua
文档:https://docs.trycua.com/docs/agent-sdk/supported-agents/composed-agents