比起今天大家追捧的 Anthropic 发布的Claude Fable 5 和 Claude Mythos 5 模型,我更关注Google 今天发布的这个模型...虽然Claude Fable ...
Anthropic终于把他们那个,强到不敢公开、强到怕引起恐慌的新模型,给放出来了。 众所周知,前俩月,Claude 给咱们上演了一波好戏。 先是宣布,自己整出了个牛逼到爆炸的新模型 Claude Mythos。 不但各门类的跑分爆 ...
为了打破这一局限,Perplexity 近日发布了一项名为“搜索即代码”(Search as Code, 简称 SaC)的全新架构。该技术不再让模型调用现成的、整体式的搜索 API,而是允许 AI 模型以 Python 代码 的形式,动态构建并运行自定义的搜索工作流程。
人工智能巨头 OpenAI 的硬件布局迎来了实质性进展,其高管层对正在秘密研发的 AI 硬件设备给予了极高评价。OpenAI 首席财务官萨拉·弗里亚尔在近日的一场行业峰会上公开表示,自己已经亲自体验过这款未面世的设备,并坦言其带来的交互体验非常自然,甚至让人产生喜爱之情。
前段时间,微软退役老兵Raymond Chen在他的博客上翻出了一段旧事: 当年微软和IBM合作开发OS/2操作系统时,两边因为一个按键吵了起来。
专注AIGC技术的专业社区,关注大语言模型(LLM)的发展和应用落地,聚焦LLM及AI技术的市场研究和开发者生态,欢迎关注!AI Agent到底靠什么变强?Agent的能力不只取决于底层大模型,还取决于围绕它的整个系统架构,也就是所谓的Harness ...
团队还针对小模型常见的循环推理和幻觉问题做了专项优化。Liquid AI 称,靶向强化学习让模型在超出知识边界时更倾向于承认不知道,无幻觉率从前代 7.46% 提升至 63.47%。
5月29日,基础大模型创业公司阶跃星辰(StepFun)发布并开源新一代Flash模型Step 3.7 Flash。这是一款专为生产级Agent打造的模型,官方称其目标是在速度、成本、可靠执行和复杂任务处理能力之间取得更好的平衡。 随着Agent从演示阶段走向企业真实的生产环境,对基础模型的要求也在发生变化。模型不仅要能回答问题,还要理解复杂输入、主动搜索信息、稳定调用工具,并在多轮长程任务中保持 ...
做个测试。读一下这段话: “熊猫是最可爱的动物,它最爱吃竹子,样子最憨态可掬,是世界上最珍贵的宝藏。” 如果你笑了,或者皱了眉,很明显,你的“鉴AI雷达”已经觉醒。 近期把网友笑到打鸣的“豆包体”里,“最”是高频词汇。大家纷纷晒出自己使用、调教AI,结果内容啼笑皆非的截图。这场围绕AI味写作的调侃就此出圈。 ● 网友@也许像星星发布的AI味吐槽突破 微博AI味相关话题浏览阅读量不小,小红书相关笔记 ...
GPT-5.4真正的杀招终于落地!OpenAI连夜重写基建、原生收编七大沙盒,彻底封死第三方框架的活路。旧时代的聊天玩具已被抛弃,工业级Agent全面觉醒。 OpenAI不声不响,又下了一手狠棋。 就在刚刚,Agents SDK迎来一次彻底的架构重写。 原生harness、原生沙盒、Codex级的文件系统工具,外加七家头部沙盒厂商一键接入。 3月初,GPT-5.4带着原生computer use( ...