导火索:谷歌的TurboQuant算法


当地时间3月24日,谷歌研究院发布了一项名为 TurboQuant 的内存压缩技术。
它解决了什么痛点?
大模型运行时,需要大量显存来存储历史对话(即KV缓存)。例如,一个700亿参数的模型,
其KV缓存占用可能是模型本身的4倍,成为巨大的成本瓶颈。它有多厉害?
谷歌宣称,TurboQuant可以将这部分KV缓存的内存占用压缩至原有的1/6(降幅约83%),
同时在特定硬件上实现最高8倍的性能提升,且几乎不损失模型准确性。
市场反应:股价与内存条双双“跳水”这则消息迅速冲击了资本市场。股价暴跌
消息发布后,存储芯片巨头股价集体重挫。美光科技、SK海力士、三星电子等公司
市值在两天内蒸发了超过900亿美元。内存条降价
这股寒意也传导至消费市场。国内DDR5内存条价格出现下跌,有专家分析,这虽
短期受情绪影响,但已引发行业对未来的担忧。同时,DDR4内存条也结束了长达一
年的涨价行情,价格出现明显回落,部分规格单日跌幅接近两成。
深层解读:专家为何说是“过度反应”?
面对这场暴跌,华尔街分析师们却出奇地冷静,普遍认为市场反应过度了,
理由主要有三点:
技术影响范围有限:TurboQuant仅优化大模型“推理”阶段的KV缓存,不影
响模型本身的存储,也与“训练”环节无关。它提升的是效率,而非直接消灭对
内存硬件的总需求。存在“杰文斯悖论”:这是一个经典的经济学理论,指技术进步提高资源使用
效率后,反而可能因使用成本降低、应用场景增多,导致总需求大幅增加。
正如瓦特改良蒸汽机后,全球煤炭消耗量不降反升。股价本就该回调了:在暴跌前,存储芯片股已经历了长达一年的暴涨。例如,
美光科技股价此前涨幅超过300%,估值处于历史高位。谷歌的消息,正好为
投资者的“获利了结”提供了一个完美借口。 后市展望:短期波动还是长期拐点?
多数机构认为,这次更像是一次短期情绪冲击,而非行业基本面发生了根本性逆转。机构喊出“上车机会”:瑞穗、摩根士丹利等多家机构认为,本次回调反而是个“买入
机会”。他们指出,类似的情况在2025年初DeepSeek发布时也发生过,当时市场担
忧算力需求见顶,导致英伟达股价暴跌,但不久后便收复失地并再创新高。AI需求依然强劲:科技巨头们仍在斥巨资建设数据中心,对HBM(高带宽内存)
等高性能存储芯片的需求丝毫未减。SK集团会长甚至预测,内存芯片的短缺将持续到2030年。算法与硬件的协同进化:长远来看,TurboQuant这类算法能让AI应用的门槛更低、
范围更广,最终反而会消耗掉更多的算力和存储资源,推动整个行业进入新的增长阶段。

