曦望发布新一代推理芯片S3

36氪获悉,国产GPU厂商曦望(Sunrise)发布新一代推理芯片S3。在算力与存储设计上,S3支持从FP16到FP4的精度自由切换,并率先在国内GPGPU产品中采用LPDDR6 显存方案,显存容量较上一代提升4倍,缓解了大模型推理中常见的显存瓶颈问题。在DeepSeek等主流大模型上,其单位Token推理成本较上一代降低约90%。

赞(0) 打赏
未经允许不得转载:Donews采集站 » 曦望发布新一代推理芯片S3

评论 抢沙发

觉得文章有用就打赏一下文章作者

非常感谢你的打赏,我们将继续提供更多优质内容,让我们一起创建更加美好的网络世界!

支付宝扫一扫

微信扫一扫