36氪获悉,本周,由阿里国际联合上海人工智能实验室、北京语言大学一起制定的AI翻译测评榜单TransBench在OpenCompass上线。与传统的翻译测评体系相比,增加了幻觉率、文化禁忌词、敬语规范等指标,并首次针对行业的细分领域构建评测数据和评测方法。这些指标均来自真实场景的使用反馈,测评方法也已开源。
阿里国际联合上海人工智能实验室、北京语言大学发布首个应用型AI翻译评测榜单
未经允许不得转载:donews官方支持 » 阿里国际联合上海人工智能实验室、北京语言大学发布首个应用型AI翻译评测榜单