华为宣布开源盘古7B稠密和72B混合专家模型

____simple_html_dom__voku__html_wrapper____>

____simple_html_dom__voku__html_wrapper____>

____simple_html_dom__voku__html_wrapper____>

快科技6月30日消息,华为今日正式宣布开源盘古70亿参数的稠密模型、盘古Pro MoE 720亿参数的混合专家模型和基于昇腾的模型推理技术。

华为表示:“此举是华为践行昇腾生态战略的又一关键举措,推动大模型技术的研究与创新发展,加速推进人工智能在千行百业的应用与价值创造。”

根据华为官网显示:

盘古Pro MoE 72B模型权重、基础推理代码,已正式上线开源平台。

基于昇腾的超大规模MoE模型推理代码,已正式上线开源平台。

盘古7B相关模型权重与推理代码将于近期上线开源平台。

据悉,基于MoGE架构构建的盘古Pro MoE大模型(72B总参数、16B激活参数)在昇腾300I Duo和800I A2可实现更优的专家负载分布与计算效率(321 tokens/s和1528 tokens/s)。

而在模型能力方面,盘古Pro MoE在最新一期业界权威大模型榜单SuperCLUE上交出了超能打的成绩。

和其他动辄千亿以上的大模型相比,如DeepSeek-R1具有671B参数,盘古Pro MoE以72B总参数量达到了59分,千亿参数量以内大模型排行并列国内第一。

并且,16B激活参数量可以媲美其他厂商更大规模的模型。

【本文结束】如需转载请务必注明出处:快科技

文章内容举报

赞(0) 打赏
未经允许不得转载:donews官方支持 » 华为宣布开源盘古7B稠密和72B混合专家模型

评论 抢沙发

更好的WordPress主题

支持快讯、专题、百度收录推送、人机验证、多级分类筛选器,适用于垂直站点、科技博客、个人站,扁平化设计、简洁白色、超多功能配置、会员中心、直达链接、文章图片弹窗、自动缩略图等...

联系我们联系我们

觉得文章有用就打赏一下文章作者

非常感谢你的打赏,我们将继续提供更多优质内容,让我们一起创建更加美好的网络世界!

支付宝扫一扫

微信扫一扫

登录

找回密码

注册