“买显存送核心”,AI芯片竞赛进入“内存为王”!智能体大时代,中国AI芯片有何机会?
2025年下半年以来存储芯片持续涨价,进入2026年涨幅更惊人,AI芯片进入“内存为王”时代。大模型发展使训练和推理对显存需求大增,内存重要性超GPU核心。在此背景下,中国AI芯片厂商在工程化领域或凸显优势。
每经记者 朱成祥 每经编辑 杜宇
曾经,云服务厂商买AI芯片,关注GPU(图形处理器)算力大小,而如今,可能更多的是看重显存大小,比如是40GB还是80GB。
甚至有人调侃“买显存送核心”,即买一张GPU算力卡,更看重的是显存带宽和容量,而不是GPU算力大小。
如今,内存芯片一两个月价格翻倍的大涨潮,正是对AI芯片进入“内存为王”的集中体现。
AI云基础设施厂商PPIO相关专家告诉每经记者:“HBM(高带宽内存)及CoWoS(基板上晶圆、芯片)封装产生的成本已经超过纯GPU芯片,HBM成本已经‘碾压’核心,‘买显存送核心’已成为现实。”
某GPU芯片企业技术负责人李明(化名)对每经记者表示:“结合我们硬件设计与供应链经验,CoWoS封装GPU中,当前HBM显存成本已接近甚至超过GPU核心,是整卡成本最高的单一组件。”
懂芯创始人张慧娟告诉每经记者:“AI芯片的竞争已从单纯的算力竞赛,转向了内存带宽和内存容量的双重竞赛。HBM通过先进封装技术与GPU裸片集成在同一封装内,实现了计算与存储的紧耦合,极大地缓解了内存难题,越来越成为业界追捧的主要方向。”
图片来源:每经媒资库
智能体大时代:内存需求强劲
2025年下半年以来,存储芯片持续涨价成了半导体行业最热门的话题。进入2026年,存储芯片仍保持上涨趋势,且涨幅惊人。
而这背后,是AI芯片已进入“内存为王”的时代。
2023年,ChatGPT石破天惊,人类社会进入大模型时代。进入2026年,大模型已然从思考转向应用,智能体、Skill以及“养虾”成了热门话题。
人工智能的发展,也对AI芯片有了新的要求。随着大模型参数的增加,训练和推理对显存(内存的一种)的需求也与日俱增。
张慧娟表示:“我们已经见证了模型参数量的指数级增长,从GPT-3的1750亿到万亿级MoE(混合专家模型),直接推动了HBM需求的爆发。这也逐步造成,制约算力的瓶颈往往不是芯片算力本身,而是数据从内存传输到计算核心的速度,因为参数必须被加载到计算单元附近的高速存储介质中,计算单元才能以极低的延迟调用它们进行运算。”
李明认为:“大模型的参数量与内存需求之间存在着直接的正向关系。在2026年的技术背景下,虽然模型架构(如MoE混合专家模型)和量化技术(Quantization)在不断优化,但‘参数量越大,内存需求越高’依然是AI领域的基本物理定律。除了模型权重需要的静态显存占用以外,大模型运行时需要的KV Cache和激活值等都会额外占用显存。在训练任务中,还需要额外显存来保存梯度和优化器状态等信息。”
但大模型对内存的强劲“渴望”,不仅仅局限于参数的增长。
智能体的快速发展,令AI推理对AI芯片的需求大增。业界普遍认为,未来AI推理对AI芯片的需求将大幅超越AI训练。
PPIO专家表示:“大模型推理场景中,GPU内存主要用于两个方面,一是保存大模型的权重,另一个是推理过程中用于存储中间状态,也就是KV Cache缓存。前者由大模型参数量决定,后者取决于会话的上下文长度。大模型发展至今,参数量已经趋于稳定,不会大幅增加。而会话的上下文长度还在持续增加,特别是Agent(智能体)场景下,1百万Token的上下文长度已成为主流。这样进一步增加对内存的开销,长上下文成为内存需求的主要因素。”
参数、长上下文,这两大因素的作用下,内存的重要性已然超越GPU计算核心。
成本结构:内存>算力
不仅仅客户需求侧更加看重内存。在成本结构中,内存的成本也大幅高于纯粹的GPU核心。
PPIO专家称:“一张GPU的成本构成主要分成三部分,一是HBM内存,容量越大成本越高;二是GPU核心(逻辑计算芯片);三是先进封装工艺(CoWoS)。高端GPU,由于HBM内存容量更大,其HBM的成本更高,以B200(英伟达GPU)为例,其总生产成本的构成中,HBM内存占比约45%,CoWoS封装及良率损失占比约34%,GPU核心芯片占比只有14%左右。”
即英伟达B200的成本结构中,45%源自向SK海力士、三星、美光等厂商购买HBM,14%源自台积电代工的GPU裸芯,34%源自台积电代工的CoWoS封装及良率损失。
而HBM由多层DRAM(动态随机存取存储器)堆叠而成。HBM需求大增,意味着SK海力士这类厂商将越来越多的DRAM产能用于制造HBM,相应用于消费级的DRAM产能便少了。
PPIO专家表示:“三大存储巨头(三星、SK海力士、美光)已经将70%的产能转移到HBM上,用于消费电子的GDDR产能反而会下降。因此我们首先看到消费领域的GeForce GPU的价格普遍上涨,大内存GPU减产甚至停产,这是由于GDDR内存减产以优先保障HBM内存导致的。”
那么,若未来存储行业产能提升,消费电子领域存储价格是否也将率先受到冲击?
张慧娟认为:“消费电子往往是最先感知到波动的领域。特别是对于存储来说,比如手机、PC(个人电脑)用的LPDDR(低功耗内存)、SSD(固态硬盘)等接近于标准品,价格弹性大。一旦上游晶圆产能提升,最先反映在现货价上的是这些产品。”
李明认为:“未来存储产能提升后,最先受到影响的是消费电子用存储。消费级存储认证周期短、需求弹性大、替换灵活,新产能可快速导入消费端,价格波动也最为明显。而数据中心用存储认证流程通常需要6—18个月,新产能导入速度较慢,且存储厂商会优先保障数据中心的产能供给,因此它受产能提升的影响最晚、幅度最小。总体而言,产能提升的影响会先平抑消费端价格,再逐步传导至企业级市场。”
简而言之,存储产能提升后,将率先平抑消费端存储芯片价格。
HBM需求强劲,产能严重不足
值得一提的是,三星、SK海力士未来将有两座晶圆厂陆续投产,这将缓解内存“缺货涨价”吗?若P4L(三星电子)和M15x(SK海力士)提前投入运营,是否将对存储芯片价格带来冲击?
张慧娟认为:“P4L和M15x新增产能,很大程度上是为HBM和高性能DDR5(第五代计算机内存规格)准备的,而不是传统的DDR4(第四代计算机内存规格)或NAND(闪存)。这些属于高端产能。”
其补充表示:“对HBM的价格冲击可能不大,甚至不会降价。因为AI芯片开发周期长,且市场处于供不应求的局面。新增产能是为了填平供需缺口,有望抑制价格进一步大涨,但难以带来大幅降价。对普通DRAM而言,假设HBM需求不及预期,或者厂商将部分产线切换回通用DRAM,那么会对消费电子内存价格带来压力。但目前看,晶圆厂更倾向于优先保证高利润的HBM生产。”
李明对每经记者表示:“从存储芯片供应链与GPU硬件配套的角度分析,三星P4L与SK海力士M15x即便提前投产,短期内对存储芯片价格的冲击也较为有限。核心原因在于,这两座工厂的新产能主要聚焦于HBM、先进制程DDR等高端存储产品,并未直接扩产消费级存储。”
李明补充表示:“当前AI需求呈爆发式增长,高端存储仍处于供需紧张状态,因此短期价格将维持高位。中长期来看,随着产能逐步释放,高端存储的供给压力会有所缓解,但新产能将优先配套AI与数据中心需求,普通消费级存储不会出现大幅降价,整体呈现结构性缓和态势。此外,各大厂商的存储优化技术,也能进一步平衡供需,避免全品类存储价格出现大幅波动。”
PPIO认为:“HBM的产能严重不足以及AI数据中心对GPU的旺盛需求是造成HBM内存成本远高于GPU核心的主要因素。市场的供需不平衡会促使更多内存厂商扩大生产,尤其是增加HBM的生产和供给,不过短期很难改变供需失衡的现状,未来HBM内存价格还将继续上涨,但趋势会放缓。”
在AI算力相对不稀缺而HBM短缺的背景下,中国AI芯片厂商有何机会?
据记者了解,国内AI芯片厂商除了自身产品和技术解决方案,还在基础软件层面联合各大人工智能基础设施公司、大模型厂商和互联网等生态伙伴一同研究例如低精度量化、专家预测加载等工程优化技术,来系统性地降低实际大模型部署和应用过程中对内存的需求。
即在工程化领域,中国工程师红利或将凸显。
封面图片来源:每经媒资库
每经头条
每经热评
川公网安备 51019002002025号