 

当前位置：Donews采集站  36氪  正文

谷歌推出压缩算法TurboQuant，宣称实现约6倍内存节省

2026-03-26 分类：36氪评论(0) 赞(0)

谷歌推出一种可能降低人工智能系统内存需求的压缩算法TurboQuant。TurboQuant压缩技术旨在降低大语言模型和向量搜索引擎的内存占用。该算法主要针对AI系统中用于存储高频访问信息的键值缓存（key-value cache）瓶颈问题。随着上下文窗口变大，这些缓存正成为主要的内存瓶颈。TurboQuant可在无需重新训练或微调模型的情况下，将键值缓存压缩至3bit精度，同时基本保持模型准确率不受影响。对包括Gemma等开源模型的测试显示，该技术可实现约6倍的键值缓存内存压缩效果。（财联社）

赞(0) 打赏

未经允许不得转载：Donews采集站 » 谷歌推出压缩算法TurboQuant，宣称实现约6倍内存节省

分享到

相关推荐

评论抢沙发

回顶部