【新智元导读】Anthropic自家工程师早已基本不写代码了,却280美元一个任务,花钱请约1000名外部工程师,手把手教Claude Code写出好代码。喂养前沿模型的,终究还是人。 最近,一篇报道把Claude Code的「进步秘笈」摆在了台面上。 Business Insider称,Anthropic有一个专门提升Claude Code的项目,正在通过约1000名软件工程师的反馈来打磨它。
原因并不是培训体系发生了革命性的变化,而是因为大家已经习惯直接询问 Claude。新人不需要知道数据库应该如何查询。他们甚至不需要知道应该向谁请教。在 Anthropic 内部,当有人问「数据库怎么查」的时候,经常得到的回答是:「打开 Claude,让 Claude 去查数据库。」很多原本需要资深工程师掌握的隐性知识,开始被转移到 Agent 身上。在 Boris 看来,这或许才是最重要的变化。
为了打破这一局限,Perplexity 近日发布了一项名为“搜索即代码”(Search as Code, 简称 SaC)的全新架构。该技术不再让模型调用现成的、整体式的搜索 API,而是允许 AI 模型以 Python 代码 的形式,动态构建并运行自定义的搜索工作流程。
作为一个完全用 AI 写出来的编程工具,Claude Code 官方仓库里的用户反馈几乎每天都在刷新。近期就有用户称,自 2 月更新后,Claude Code 在复杂工程任务中的表现明显退化,已经“无法被信任用于复杂工程工作”。该 issue ...
最近在写一本《Harness Engineering 实战》。第七章是验证层,原本只是想引几篇 Anthropic 和 METR 的论文带过去。结果跑实验跑出了几个反直觉的数字,干脆停下来把整章重新梳理了一遍。 我用 DeepSeek 改 5 个 Python bug,每个跑 3 次。 15 次结果都是"任务完成 "。
3 天on MSN
搜索新纪元:Search as Code如何重塑智能体时代的搜索范式
当大语言模型从对话交互迈向智能体应用,搜索技术正经历前所未有的范式转变。传统搜索引擎巨头已悄然调整结果展示逻辑,AI生成的摘要内容取代网页链接占据首屏位置,这种变化背后折射出技术架构的深层迭代——搜索服务的主要对象正从人类用户转向智能体系统。
说两个群体越相似,越会对彼此一丁点不同的地方抓狂。所有程序员面对的压力几乎一样:改不完的需求、查不尽的Bug、半夜三点的报警,发际线曲线都高度重合。 正因为太像了,才需要找一个微小差异来证明——"我跟你不一样"。
5 天on MSN
Search as code:搜索架构革新,开启智能体时代搜索新范式
当大语言模型从简单的对话工具进化为具备任务执行能力的智能体时,传统搜索引擎的生存空间正被逐步压缩。谷歌与百度等老牌搜索引擎的界面已发生根本性转变——AI生成的摘要内容占据首屏,传统链接列表退居次席。这种表面变化背后,是搜索服务对象的彻底迁移:过去为人类设计的关键词匹配模式,正在被智能体对结构化数据的需求所取代。
“我已经整整半年没有手写过一行代码了。我全身心扑在造东西上,但是自己一行代码都没写。” “现在模型的代码写得比我好得多。一年前我不会这么讲,但现在完全变了。” “谁学习使用AI,谁就会成为最高效的人,你一个人加上两三个Agent就能挑战大厂。” ...
今年 4 月初,Moonshot 的 kimi-cli 仓库收到了一个 PR,标题是「kimicli 用 python 是彻底的失败 立刻重构为 ts」。 结果你猜怎么着,前几天 kimi-cli 真的用 Type 重写了,只不过是以名为 ...
敲下第一行代码前,屏幕微光映着凌晨三点的键盘;调试一个Python服务时,后台还跑着Docker容器、Chrome标签页堆叠二十个、VS Code开着五个工作区——程序员的日常办公,从来不是‘能用就行’,而是‘瞬时响应、持续稳定、扩展从容’。CPU作为整套开发环境的 ...
一个来自苏黎世联邦理工的开源项目,让 FPGA 网卡开发从"刀耕火种"迈向"现代文明"。5篇CCF-A顶会加持,这可能是目前最强的开源FPGA SmartNIC平台。 先讲一个故事 假设你是一个程序员,想写一个 Web 服务。 你打开电脑,启动 VS Code,pip install flask,写几行代码 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果