本期焦点:SpaceX 创纪录 IPO 后闪电收购 Cursor、Kimi K2.7 Code 开源万亿参数编码模型、AUR 供应链攻击波及 400+ 包、WASI 0.3 正式发布。 •值得关注:Musk 将 xAI 合并入 SpaceX 后,收购 ...
这正是清华大学研究团队发现的一个令人意外的安全漏洞。他们的研究揭示了一件令业界震惊的事情:一种原本被设计用来让AI写出更规范代码的"好工具",在特定操作下,竟然能够绕过AI的安全防护机制,诱使其生成恶意程序。
你很难把 Coding 仅仅视为大模型的诸多能力维度之一。 和单纯的文本或图像生成相比,代码更明确的规则、严格的语法和可验证的结果只是部分原因。更为特殊之处在于,在 ChatBot 到 Agent 这条进化链上,Coding 意味着的工具调用、数据处理和复杂流程自动化,几乎承载了模型从“会说”走向“能干”的绝大部分期待。 一个值得关注的变化是,Coding 正在从眼花缭乱的 Benchmark 榜 ...
OpenAI公司近日在社交平台X上宣布,正式启动Codex推广计划。即日起,用户可通过推荐好友参与活动,获取免费速率限制重置权限,以提升AI代码生成工具的使用体验。 根据活动规则,用户每成功邀请一位好友注册并使用Codex发送首条消息,即可获得一次速率限制 ...
当程序员们开始用“灵魂架构师”取代“码农”自嘲时,一场由AI驱动的办公革命已悄然蔓延至更广阔的职场领域。这场变革的起点是Vibe Coding——这个诞生于2025年初的概念,通过意图驱动开发模式,让开发者从逐行敲代码的桎梏中解放出来。如今,其技术逻辑正通过Vibe Working模式向十亿级白领群体渗透,重新定义着知识工作的形态。 在编程领域,Claude Code、Codex等工具已实现“语音 ...
编写一个 Python 程序,展示一个球在旋转的六边形内弹跳,六边形中只有五边是墙壁,其中一边是可通过的,小球碰到墙壁的时候自动分裂成两个,或者是穿过可通过的边界掉落到地图外面,球的运动轨迹应受到重力的影响,并且必须真实地反弹到旋转的墙壁上。
Harness和Scaffold到底什么区别,为什么每个人解释都不一样?这篇就帮你把这些容易混淆的概念一次性理清楚。 AI Agent领域每天都在冒新词,Harness、Scaffold、Policy、Rollout,一个比一个玄乎,听的人是一头雾水 ...
MCP Server(Model Context Protocol 服务器)是让 AI 模型调用外部工具与数据的标准化接口,由 Anthropic 于 2024 年底开源后迅速成为行业标准。截至 2026 年 4 月,Python SDK 在 ...
据 Axios 报道,一家企业因为开通了企业授权却忘了设用量上限,一个月烧掉了 5 亿美元的 Claude 账单。Uber 的工程师只用 4 个月就烧光了全年的 Claude Code 预算,其 COO 公开表示,Token ...
知名安全研究员Kasra Rahjerdi自费1500美元测试多款主流大模型的自主渗透能力,结果显示GPT-5.5以70%的成功率遥遥领先,成为唯一具备较强实战漏洞挖掘能力的模型。DeepSeek V4 Pro虽成功率仅30%,但成本优势突出;Claude、Gemini等多数模型受安全护栏、推理偏差或API稳定性限制表现不佳,5款模型全部颗粒无收。
原文标题:《一文读懂微软Build 2026开发者大会:“Agent优先”时代到来,一口气发七款自研模型》 文丨李海伦 编辑丨徐青阳 美国当地时间6月2日,微软Build ...
将成功或失败的经验提取为结构化的“技能”(Skills),并实现技能生产的自动化,似乎已经成了当下各大先进Agent框架的标配。从集成Claude Code到Codex执行环境,让智能体“吃一堑长一智”并自动撰写操作指南,听起来是一条完美的自我进化之路。但这套模式真的有用吗?Agent自己写的Skills,真的能让Agent自己变得更厉害吗?