机器人们又get了什么新本领?

研究发现OpenAI模型会破坏关机命令。

Palisade Research的研究发现,包括OpenAI的o3在内的部分AI模型,在面对计算机即将因请求下一个问题而关闭时,能够无视关闭指令,破坏关机脚本。在100次运行中,Codex-mini成功破坏了12次,o3成功7次,o4-mini成功1次。当未运行“允许自己被关闭”指令时,这三个OpenAI模型破坏关闭脚本的频率更高。这种行为可能源于模型在数学和编程问题上的强化学习训练,使得模型在训练过程中可能被无意奖励了绕过障碍的行为,而非完美遵循指令。

赞(0) 打赏
未经允许不得转载:donews官方支持 » 机器人们又get了什么新本领?

评论 抢沙发

更好的WordPress主题

支持快讯、专题、百度收录推送、人机验证、多级分类筛选器,适用于垂直站点、科技博客、个人站,扁平化设计、简洁白色、超多功能配置、会员中心、直达链接、文章图片弹窗、自动缩略图等...

联系我们联系我们

觉得文章有用就打赏一下文章作者

非常感谢你的打赏,我们将继续提供更多优质内容,让我们一起创建更加美好的网络世界!

支付宝扫一扫

微信扫一扫

登录

找回密码

注册