Math Coding Coding - 搜索 News

2 天

“智能体最后的考试”，Fable 5竟然不敌GPT 5.5

没想到打脸来得如此之快！！刚刚，UC伯克利放出了一场号称“智能体最后的考试”的全新基准测试。它把当今最强的AI Agent们拉到考场上，让它们干真正的活—— 在Siemens NX里建3D模型、在Unreal Engine里搭游戏场景、在Adobe After Effects里做特效合成。结果成绩令人傻眼：最难的一档，当今公认最强的Claude Fable 5、GPT 5.5，全是大写的零 ...

雷峰网

四道题评测 Qwen3.7-Max：从空间推理到 3D 建模，它离 Agent 更近了吗？

导语：三个月内，三款旗舰。雷峰网(公众号：雷峰网)讯 5 月 20 日，阿里云峰会上，通义千问团队正式发布 Qwen3.7-Max。这已经是三个月内的第三个旗舰版本了。3 月 20 日 Qwen3.5-Max-Preview 问世，4 月 20 日的 Qwen3.6-Max-Preview，再到这次的 Qwen3.7-Max 正式版，每 30 天一款旗舰模型的迭代速度，放眼全球大模型厂商，几乎 ...

IT之家

2026 年 vibe coding、AI Coding、无代码编程、AI 建网站工具 TOP10 深度体验

在 2026 年，AI 技术已全面革新软件开发流程。“Vibe coding”—— 通过自然语言描述开发“氛围”与想法，让 AI 快速生成代码、原型或完整应用的模式 —— 成为开发者与非技术人员共同追捧的潮流。它极大降低了编程门槛，让创意能够以极高效率落地。无论是 ...

36氪

DeepSeek V4、GPT5.5会师：通向AGI的门票只有Coding？

今天，OpenAI发布GPT-5.5，DeepSeekV4预览版亮相并开源。 OpenAI发布GPT-5.5，官方公告的第一句话是：我们最智能的模型。在所有能力维度里，OpenAI选择重点强调Agentic Coding：在测试复杂命令行工作流的Terminal-Bench 2.0上达到82.7%，在测试真实GitHub问题解决能力的SWE-Bench Pro ...

China Internet Information Center

China Focus: DeepSeek unveils new AI model, matching best open-source options

HANGZHOU, April 24 (Xinhua) -- Chinese AI firm DeepSeek on Friday released and open-sourced its highly anticipated V4 model, which features good performance in programming, world knowledge and logical ...

腾讯网

小米MiMo-V2.5-Pro开启公测，押注Agent和长程执行

4月23日，小米发布新一代旗舰模型MiMo-V2.5-Pro，并官宣公测。按照官方说法，这次升级主要集中在通用智能体能力、更复杂的软件工程任务，以及更长链条任务中的稳定执行。小米同时称，该模型已上线 API Platform、AI Studio 等入口，价格维持不变。小米表示 ...

界面新闻

DeepSeek研究员郭达雅近亿元年薪入职字节？抖音副总裁：报道不实

抖音集团副总裁李亮称，近期更没有招聘到什么近亿元年薪的员工。针对DeepSeek 95后研究员郭达雅近亿元年薪入职字节的报道，抖音集团副总裁李亮在线否认。 4月16日晚，抖音集团副总裁李亮在社交平台发文表示，“这个报道不实，字节跳动招聘的所有Seed团队 ...

新浪网

三星发力大模型！三星研究院联合北大发布 M2RL，系统揭秘多领域RL ...

三星研究院开展了M2RL研究项目，对多域强化学习进行了系统性的研究和分析。大模型训练需要同时兼顾多个领域能力，包括Agentic 能力、数学推理、代码生成等。如何训练一个能够在多个领域同时达到专家水平的通用模型，已成为当前研究中的一项关键挑战。

csdn

全球大模型竞技场：多款国产模型上榜，Seed 2.0排名领先

春节期间国产大模型迎来集中上新周期，全球大模型竞技场 LMArena 榜单格局随之出现重大调整。其中，字节跳动旗下 Seed 2.0 的表现最为亮眼。该模型为首次亮相 LMArena 榜单，便成功跻身综合排行榜全球前十，位列本次登榜国产模型首位。同期密集发布的多款 ...

证券时报官方网站

国产大模型集体冲击全球大模型技术最高水平，豆包2.0表现最亮眼

春节期间国产大模型迎来集中上新周期，全球大模型竞技场 LMArena 榜单格局随之出现重大调整。其中，字节跳动旗下 Seed 2.0 的表现最为亮眼。该模型首次亮相 LMArena 榜单，便成功跻身综合排行榜全球前十，位列本次登榜国产模型首位。同期密集发布的多款国产 ...

5 个月

虚拟币在各数字货币交易平台价格行情一览

虚拟货币，也常称数字货币，即非真实的货币，当下提到的虚拟币一般指比特币、以太坊、瑞波币、EOS等数字虚拟货币，也称加密货币，是由加密算法规则产生的数字货币。全网最全的虚拟数字货币行情，超过1700种加密数字货币，与其他货币兑换的实时价格，行情，走势与交易量，包括各大数字货币交易所数据。您可选择任意一种虚拟币及兑换的币种，按交易所查看筛选。查看加密货币实时行情 ...

福布斯中文网

Cursor成造富神器！四位不到30岁的创始人，全部晋身亿万富豪

热门AI编程工具Cursor的联合创始人现在都已成为亿万富豪。此前，Anysphere宣布完成23亿美元新一轮融资，使这家初创公司的估值达到293亿美元。《福布斯》估计，创始人迈克尔·特鲁尔、阿曼·桑格、苏阿莱·阿西夫和阿维德·伦内马克各自持有公司4.5%的股份 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果