Donews采集站Donews采集站Donews采集站

最新发布 第303页

谷歌推出压缩算法TurboQuant,宣称实现约6倍内存节省

谷歌推出一种可能降低人工智能系统内存需求的压缩算法TurboQuant。TurboQuant压缩技术旨在降低大语言模型和向量搜索引擎的内存占用。该算法主要针对AI系统中用于存储高频访问信息的键值缓存(key-value cache)瓶颈问题。随着上下文窗口变大,这些缓存正成为主要的内存瓶颈。TurboQuant可在无需重新训练或微调模型的情况下,将键值缓存压缩至3bit精度,同时基本保持模型准确率不受影响。对包括Gemma等开源模型的测试显示,该技术可实现约6倍的键值缓存内存压缩效果。(财联社)

中科曙光scaleX40超节点亮相中关村论坛

36氪获悉,2026年中关村论坛年会现场,中科曙光正式发布首个无线缆箱式超节点scaleX40。据了解,scaleX40内置40张GPU,总算力超28 PFLOPS(FP8精度),显存总容量超5TB,整机采用16U标准机箱设计,兼容99%以上机房环境。

美图:注意到网络上关于公司2025年年度业绩等未公开消息,公司股票停牌

36氪获悉,美图公告,公司注意到部分网络贴文提及本公司2025年年度业绩等未公开消息,构成本公司的内幕消息。本公司谨此澄清,2025年年度业绩仍需董事会于3月27日董事会会议上批准。应本公司要求,本公司股份已于2026年3月26日上午9时起于香港联合交易所有限公司短暂停止交易,以待本公司于2026年3月27日刊发该期间的年度业绩公告。

首个AI助手上车:千问进入红旗汽车

3月26日,阿里AI助手千问被接入红旗汽车智能座舱,即将首发搭载于红旗HS6 PHEV。这是继AI眼镜之后,千问进一步拓展至更高复杂度的车载场景,也是通用AI助手首次以完整形态进入车载场景。千问上车后,用户只需一句话即可完成多目标任务。系统可同时理解导航、用餐与时间约束等多重需求,并结合实时路况、天气、商户营业状态等信息,生成完整行程方案。后续还将接入即时零售、票务预订、出行服务等更多阿里生态的“办事能力”。