据报道,华为已通知合作伙伴和渠道经销商,将从7月1日起提高其智能协作(Intelligent ...
B, a 3-billion-parameter AI model, is challenging OpenAI, Google and DeepSeek on math and coding benchmarks while reigniting ...
Nous Research 的 Hermes Agent 有个好处:你指向哪个模型,它就老老实实跑哪个。换句话说,账单多少是你自己配出来的,不是写死的。 所以选模型这件事,重点不在"哪个最聪明",而在"哪个便宜模型够用",以及"怎么配 Hermes,让它别白白烧 token"。 下面这五个模型都 ...
This week’s recap covers exploited flaws, supply chain attacks, phishing kits, AI lures, macOS stealers, urgent CVEs, tools, ...
近期,科技圈内关于DeepSeek V4.1即将发布的讨论热度持续攀升。有消息称,部分网友已率先体验到该新模型的灰度测试版本,并反馈其在代码生成等核心能力上有了显著突破。这一动态引发了开发者社区的广泛关注。 据Linux.do社区用户“风云雨”透露,其在网页端测试时发现疑似V4.1 Flash模型的更新迹象。该用户观察到两个关键变化:模型的知识库更新至2026年1月,较此前版本延长了半年;在鸬鹚S ...
智谱近日在港交所发布重要公告,正式对外推出其最新研发的旗舰级模型GLM-5.2。这一模型在技术层面实现了重大突破,支持长达1M的上下文处理能力,使其在执行复杂长程任务时展现出显著优势,性能表现持续领先行业同类产品。 据公告披露,GLM-5.2采用MIT协议开源,这一举措将进一步推动人工智能领域的技术共享与创新。该模型的核心竞争力在于其强大的长文本处理能力,能够高效完成需要上下文关联的复杂任务,为开 ...
你很难把 Coding 仅仅视为大模型的诸多能力维度之一。 和单纯的文本或图像生成相比,代码更明确的规则、严格的语法和可验证的结果只是部分原因。更为特殊之处在于,在 ChatBot 到 Agent 这条进化链上,Coding 意味着的工具调用、数据处理和复杂流程自动化,几乎承载了模型从“会说”走向“能干”的绝大部分期待。 一个值得关注的变化是,Coding 正在从眼花缭乱的 Benchmark 榜 ...
Tom Fenton benchmarks the Lenovo ThinkPad T1g Gen 8 across SPECworkstation 4, Geekbench AI and Ollama tests to assess its performance for office workloads, local AI and large language models.
Cybersecurity roundup: supply chain threats, AI agent risks, browser-cloning malware, mule networks, endpoint bypasses, and ...
4月,Anthropic推出Mythos模型预览版。这个模型没有面向公众开放,因为在测试中它展现出极强的网络安全与漏洞挖掘能力,能自主发现数千个高危零日漏洞,一旦流出,容易被用于恶意攻击。
这项由vivo AI Lab、蚂蚁集团和浙江大学联合开展的研究,发表于2026年的KDD(国际知识发现与数据挖掘大会),论文编号为arXiv:2605.30039,有兴趣深入钻研的读者可以通过这个编号找到完整原文。 一、一个让工程师头疼的老问题 ...