GPU Cache - 搜索 News

6 天

从 GPU 到 Token：AI 基础设施的八层可观测性体系

GPU 利用率不是终点，Token 成本才是 AI 基础设施真正的北极星指标。过去几年，AI 基础设施领域最热门的话题之一是 GPU 调度。无论是 Kubernetes、Volcano、Kueue，还是 ...

AMD疑似为Navi 31 GPU预留了3D V-Cache连接点

根据测试结果表明，AMD似乎为其全新的顶级显卡GPU也预留了3D V-Cache连接点 AMD目前已经在其EPYC服务器处理器和部分消费级处理器产品线上采用了3D V-Cache技术。但根据来自海外工程师的最新测试结果发现，AMD似乎为其全新的顶级显卡GPU也预留了3D V-Cache连接点，这 ...

电子工程专辑

谈谈三星手机上的AMD GPU，秒杀iPhone还有多远？

前不久的一则新闻，曝光了三星即将推出的Exynos芯片的图形性能。这颗应用于未来三星手机的SoC芯片，据说其3DMark Wild Life跑分达到了8134分。这个性能成绩比高通骁龙888的Adreno 660高出大约50%。至于和苹果A14比，我们手头没有可现测的设备，有媒体提到8134这个得分 ...

电子工程专辑

Intel GPU的野望：从游戏到数据中心

今年的Intel Architecture Day上，更多有关Intel GPU的产品信息揭开面纱。这次Intel主要谈到了面向游戏玩家的Xe-HPG架构Alchemist GPU；以及面向数据中心的Xe-HPC架构GPU芯片Ponte Vecchio。后者被Intel形容为技术难度“堪比登月”的芯片，这也是我们第一次见到MCM（Multi-chip Module ...

新浪网

榨干GPU性能，中兴Mariana（马里亚纳）突破显存壁垒

当大语言模型（LLM）走向千行百业，推理效率与显存成本的矛盾日益尖锐。 KV Cache （Key-Value Cache）作为提升生成速度的核心技术，却像一个 “吞存巨兽”—— 每增加一个 token，就需要更多显存存储键（Key）和值（Value）向量，最终成为制约模型规模扩张、并发 ...

新浪网

破局显存焦虑：新华三推出大模型推理场景加速方案

据多家权威研究机构最新研判，2026 年核心存储供应链的结构性短缺已成行业刚性现实，供需缺口持续扩大且很可能延续至 2027 年。不仅是存储部件的单点问题，当前，生成式 AI 正从技术尝鲜全面走向规模化落地，大模型技术的应用场景正在从训练为主转向 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果