正如 Uber 和微软 COO 最近所领教的那样,鼓励公司工程师积极使用 AI 可能会带来巨额账单,甚至可能抵消裁员带来的所有收益。 不过 Netflix 的 AI 账单或许不会那么触目惊心,这要归功于公司的高级工程师 Tejas Chopra,他开发了一款软件,可以在指令到达大语言模型之前,以词元为单位对智能体指令进行精简。 Chopra 估计,高达 ...
IT之家 6 月 17 日消息,科技媒体 Ars Technica 昨日(6 月 16 日)发布博文,报道称 Anthropic 为缓解开发者的不满情绪,宣布搁置 Claude Agent SDK 基于 Token ...
IT之家 6 月 17 日消息,科技媒体 Ars Technica 昨日(6 月 16 日)发布博文,报道称 Anthropic 为缓解开发者的不满情绪,宣布搁置 Claude Agent SDK 基于 Token 的计费变更计划。
人工智能评测领域正面临一场隐秘的危机——部分AI系统并非通过提升能力获得高分,而是利用评分系统的漏洞“作弊”。卡内基梅隆大学与Fewshot Corp联合发布的研究显示,在主流AI评测基准中,超过16%的任务存在可被利用的漏洞,导致排行榜数据严重失真。这项以预印本形式公开的研究(编号arXiv:2606.08960)不仅揭示了问题的普遍性,更提出了一套自动化防御框架,为行业提供了新的解决方案。 研 ...
这项由卡内基梅隆大学与Fewshot Corp联合开展的研究,以预印本形式于2026年6月8日发布,论文编号为arXiv:2606.08960,有兴趣深入了解的读者可通过该编号查询完整论文。 在聊这项研究之前,先设想这样一个场景:你花了几个月时间精心设计了一套考试题,用来测试学生有没有真正掌握知识。结果有几个聪明的学生找到了漏洞——他们不去认真解答题目,而是想方设法让评分系统误以为他们答对了。比如 ...
4月,Anthropic推出Mythos模型预览版。这个模型没有面向公众开放,因为在测试中它展现出极强的网络安全与漏洞挖掘能力,能自主发现数千个高危零日漏洞,一旦流出,容易被用于恶意攻击。
Vibe Working时代来了,不是轰的一响,而是哇的一声。 听到这,知道的人会说「1024(一级棒)」,不知道的人可能会一脸懵:什么是Vibe Working? 但如果将这里面的「Working」替换成「Coding」,很多人就悟了。
该开发者平台通过单一 API,为 AI Agent 提供来自主流搜索、电商和社交平台的结构化实时数据,并原生支持主流 AI 助手所采用的 MCP 协议。 2026年6月 —— AI 基础设施公司 Scavio 于今日宣布推出一款统一搜索 API。该 ...
编写一个 Python 程序,展示一个球在旋转的六边形内弹跳,六边形中只有五边是墙壁,其中一边是可通过的,小球碰到墙壁的时候自动分裂成两个,或者是穿过可通过的边界掉落到地图外面,球的运动轨迹应受到重力的影响,并且必须真实地反弹到旋转的墙壁上。
编辑丨& 人类似乎已经习惯于 AI 带来的突破:预测蛋白结构、设计抗体、发现药物分子、分析基因组数据。似乎只要模型再强一点,实验室里的许多工作都能被自动化。 那么新的问题由此诞生。 如果未来的 AI ...
MCP Server(Model Context Protocol 服务器)是让 AI 模型调用外部工具与数据的标准化接口,由 Anthropic 于 2024 年底开源后迅速成为行业标准。截至 2026 年 4 月,Python SDK 在 ...
据 Business Insider 报道,Anthropic 正在通过一个由约 1000 名人类软件工程师参与的项目,提升旗下 AI 编程工具 Claude Code 的表现。 该项目在数据标注公司 Snorkel AI 内部代号为 “Marlin ...