AI Code Arena - 搜索 News

13 天

刚刚，Code Arena最新放榜，国内AI闯入全球编程前二

就在今天，Code Arena最新榜单出炉！ Qwen3.7-Max以1541分闯入全球前四，一举超越了GPT-5.5、Gemini 3.5 Flash等一众顶尖模型。排在它前面的，只剩Claude Opus 4.7和Opus 4.6。换句话说，在全球编程模型的竞技场上，阿里是唯一杀进这张牌桌的中国厂商，仅次于Anthropic，位列第二。其实在Code Arena放榜之前，Qwen3.7- ...

15 天

Code Arena放榜：阿里千问3.7编程能力超越GPT、Gemini，仅次于Claude系列

5月26日凌晨，全球权威三方编程榜单Code Arena放榜，阿里最新旗舰模型Qwen3.7-Max得分1541，超越GPT-5.5、Gemini-3.5-Flash、GLM-5.1、Kimi-K2.6等一众模型，仅次于Claude系列，在大模型厂商中排名全球第二，这也标志着在代码理解与生成领域，千问3.7成功跻身全球编程模型第一梯队。图说：Code Arena榜单显示，凭借Qwen3.7-Ma ...

15 天

国产第一：阿里 Qwen3.7-Max 模型 AI 编程能力超 Claude Opus 4.6

IT之家5 月 26 日消息，全球权威三方编程榜单 Code Arena 昨日（5 月 25 日）更新榜单，阿里旗舰模型 Qwen3.7-Max 得分 1541 分，仅次于 Claude 系列，在大模型厂商中排名全球第二。 IT之家查询公开资料，Code Arena 是目前全球人工智能领域含金量最高、最权威的编程大模型（LLM）能力评估榜单之一。该榜单不测试学术化的选择题，而是评估模型在生成、调 ...

腾讯网

AI日报：OpenAI未官宣新旗舰GPT-5.6意外曝光；昆仑万维发布天工SkyClaw-v1 ...

AI日报5月26日•AIbase1、上下文 150 万 tokens！OpenAI未官宣新旗舰GPT-5.6意外曝光2、国产模型大突破！昆仑万维发布天工高性能 Agent 模型 SkyClaw-v1.03、阿里 Qwen3.7-Max 编程能力全球登顶第二！Code Arena 1541 分，仅次 Claude4、商汤 Seko AI 再进化：发布生产链路 Seko Space，加速漫短剧工业化布 ...

15 天

Code Arena放榜，千问3.7编程能力位列全球第二

据阿里云公众号消息，今天（5月26日），第三方大模型盲测平台LMArena旗下编程榜单Code Arena更新排名，阿里最新旗舰模型Qwen3.7-Max得分1541，在大模型厂商中位列全球第二，也是唯一突破1540分的中国模型。 Code Arena是当前最具影响力的AI编程能力评测榜单之一。与传统代码基准测试不同，Code Arena由开发者出题，要求模型从零生成完整的、可交互的Web应用程序 ...

腾讯网

太卷了！专属Coding的新一代Arena榜单来了，有国产模型登上榜首

大模型编程最近太猛了。自从编码成了大模型的核心能力后，各大模型厂商都卷得要命，从卷模型参数和性能，到卷开发工具链，编码能力的提升，简直是一场军备竞赛。近几个月以来，以 Claude 4.5、GLM-4.6、kimi-k2 等为代表的编码模型，都具备了执行复杂项目 ...

14 天

阿里Qwen3.7-Max模型在Code Arena编程榜居第二，Design Arena亦获佳绩

全球人工智能领域权威编程评测榜单Code Arena近日完成更新，阿里巴巴自主研发的旗舰大模型Qwen3.7-Max以1541分的成绩跻身全球前列。该模型在编程能力评估中位列全球第四，仅次于Claude系列的三款模型，在大模型厂商中稳居第二把交椅。作为人工智能领域最具公信力的编程能力评估平台，Code Arena的评测体系突破传统学术测试框架，重点考察模型处理复杂代码生成、调试与重构任务的实际能 ...

观点网

阿里千问3.6-Plus登顶Code Arena中国最强编程模型

阿里千问3.6-Plus在全球知名大模型盲测榜单LMArena旗下Code Arena公布的新一期排名中位列全球第二，超越OpenAI、Google、xAI等国际巨头，成为该榜单上排名最高的中国大模型。观点网讯：4月3日，全球知名大模型盲测榜单LMArena旗下聚焦AI编程能力的Code Arena公布新一期 ...

小熊财经 on MSN

阿里Qwen3.7-Max模型在Code Arena编程榜全球第二，Design Arena也获佳绩

全球人工智能领域权威编程评测榜单Code Arena近日迎来重要更新，阿里自主研发的旗舰大模型Qwen3.7-Max以1541分的成绩跻身全球前列。根据最新公布的排名，该模型在编程能力评估中位列第四，仅落后于Claude系列三款模型，在大模型厂商中稳居全球第二，展现出强劲的技术实力。作为人工智能领域最具公信力的编程能力评估平台之一，Code ...

14 天on MSN

阿里Qwen3.7-Max模型闪耀Code Arena：编程实力跻身全球前列

全球人工智能领域权威编程能力评估榜单Code Arena近日迎来重要更新。在这份被视为行业风向标的榜单中，阿里最新推出的旗舰模型Qwen3.7-Max以1541分的成绩跻身全球前列，仅落后于Claude系列模型，在大模型厂商中稳居第二把交椅。与传统学术测试不同，Code ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果