就在今天,Code Arena最新榜单出炉! Qwen3.7-Max以1541分闯入全球前四,一举超越了GPT-5.5、Gemini 3.5 Flash等一众顶尖模型。 排在它前面的,只剩Claude Opus 4.7和Opus 4.6。 换句话说,在全球编程模型的竞技场上,阿里是唯一杀进这张牌桌的中国厂商,仅次于Anthropic,位列第二。 其实在Code Arena放榜之前,Qwen3.7- ...
5月26日凌晨,全球权威三方编程榜单Code Arena放榜,阿里最新旗舰模型Qwen3.7-Max得分1541,超越GPT-5.5、Gemini-3.5-Flash、GLM-5.1、Kimi-K2.6等一众模型,仅次于Claude系列,在大模型厂商中排名全球第二,这也标志着在代码理解与生成领域,千问3.7成功跻身全球编程模型第一梯队。 图说:Code Arena榜单显示,凭借Qwen3.7-Ma ...
IT之家5 月 26 日消息,全球权威三方编程榜单 Code Arena 昨日(5 月 25 日)更新榜单,阿里旗舰模型 Qwen3.7-Max 得分 1541 分,仅次于 Claude 系列,在大模型厂商中排名全球第二。 IT之家查询公开资料,Code Arena 是目前全球人工智能领域含金量最高、最权威的编程大模型(LLM)能力评估榜单之一。 该榜单不测试学术化的选择题,而是评估模型在生成、调 ...
AI日报5月26日•AIbase1、上下文 150 万 tokens!OpenAI未官宣新旗舰GPT-5.6意外曝光2、国产模型大突破!昆仑万维发布天工高性能 Agent 模型 SkyClaw-v1.03、阿里 Qwen3.7-Max 编程能力全球登顶第二!Code Arena 1541 分,仅次 Claude4、商汤 Seko AI 再进化:发布生产链路 Seko Space,加速漫短剧工业化布 ...
据阿里云公众号消息,今天(5月26日),第三方大模型盲测平台LMArena旗下编程榜单Code Arena更新排名,阿里最新旗舰模型Qwen3.7-Max得分1541,在大模型厂商中位列全球第二,也是唯一突破1540分的中国模型。 Code Arena是当前最具影响力的AI编程能力评测榜单之一。与传统代码基准测试不同,Code Arena由开发者出题,要求模型从零生成完整的、可交互的Web应用程序 ...
大模型编程最近太猛了。 自从编码成了大模型的核心能力后,各大模型厂商都卷得要命,从卷模型参数和性能,到卷开发工具链,编码能力的提升,简直是一场军备竞赛。 近几个月以来,以 Claude 4.5、GLM-4.6、kimi-k2 等为代表的编码模型,都具备了执行复杂项目 ...
全球人工智能领域权威编程评测榜单Code Arena近日完成更新,阿里巴巴自主研发的旗舰大模型Qwen3.7-Max以1541分的成绩跻身全球前列。该模型在编程能力评估中位列全球第四,仅次于Claude系列的三款模型,在大模型厂商中稳居第二把交椅。 作为人工智能领域最具公信力的编程能力评估平台,Code Arena的评测体系突破传统学术测试框架,重点考察模型处理复杂代码生成、调试与重构任务的实际能 ...
阿里千问3.6-Plus在全球知名大模型盲测榜单LMArena旗下Code Arena公布的新一期排名中位列全球第二,超越OpenAI、Google、xAI等国际巨头,成为该榜单上排名最高的中国大模型。 观点网讯:4月3日,全球知名大模型盲测榜单LMArena旗下聚焦AI编程能力的Code Arena公布新一期 ...
全球人工智能领域权威编程评测榜单Code Arena近日迎来重要更新,阿里自主研发的旗舰大模型Qwen3.7-Max以1541分的成绩跻身全球前列。根据最新公布的排名,该模型在编程能力评估中位列第四,仅落后于Claude系列三款模型,在大模型厂商中稳居全球第二,展现出强劲的技术实力。 作为人工智能领域最具公信力的编程能力评估平台之一,Code ...
14 天on MSN
阿里Qwen3.7-Max模型闪耀Code Arena:编程实力跻身全球前列
全球人工智能领域权威编程能力评估榜单Code Arena近日迎来重要更新。在这份被视为行业风向标的榜单中,阿里最新推出的旗舰模型Qwen3.7-Max以1541分的成绩跻身全球前列,仅落后于Claude系列模型,在大模型厂商中稳居第二把交椅。 与传统学术测试不同,Code ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果