说在前面:这又是一篇讲Harness的Survey,你最近可能已经看过了数篇讲Harness的文章、论文,其中还可能包括我上周解读的《Agent Harness Engineering:Agent的底盘工程综述|CMU、耶鲁、Amazon》。 上周的《Agent Harness Survey》更像是在回答一个系统架构问题:一个真正可用的 Agent,外面应该包哪些东西? 而UIUC、Meta、St ...
今年3月,腾讯发布了《2026年AI人才报告》,其中提到“AI辅助编程工具使通用型开发任务效率提升约50%”。这个数字在测试圈的讨论群里引发了一轮激烈争论。不是因为50%有多吓人,而是因为测试本身就是一道“执行质量”的防线——如果连执行者都在被加速, ...