我们更新了Artificial Analysis编码Agent指数,用Datacurve的DeepSWE基准取代了SWE-Bench Pro——这一换位使得搭载GPT-5.5(xhigh...
我们更新了Artificial Analysis编码Agent指数,用Datacurve的DeepSWE基准取代了SWE-Bench Pro——这一换位使得搭载GPT-5.5(xhigh)的Codex超越了搭载Opus 4.8(max)的Claude Code,而新发布的Claude Code中的Claude Fable 5(max)首次登顶