蚂蚁集团开源全模态大模型Ming-flash-omni 2.0

36氪获悉,2月11日,蚂蚁集团开源发布全模态大模型Ming-flash-omni 2.0。在多项公开基准测试中,该模型在视觉语言理解、语音可控生成、图像生成与编辑等关键能力表现突出,部分指标超越Gemini 2.5 Pro。Ming-flash-omni 2.0也是业界首个全场景音频统一生成模型,可在同一条音轨中同时生成语音、环境音效与音乐。

赞(0) 打赏
未经允许不得转载:Donews采集站 » 蚂蚁集团开源全模态大模型Ming-flash-omni 2.0

评论 抢沙发

觉得文章有用就打赏一下文章作者

非常感谢你的打赏,我们将继续提供更多优质内容,让我们一起创建更加美好的网络世界!

支付宝扫一扫

微信扫一扫