梦晨 发自 凹非寺量子位 | 公众号 QbitAI o1/o3这样的推理模型太强大,一有机会就会利用漏洞作弊,怎么办? OpenAI新研究,用语言模型监控思维链,及时发现不当行为。 来看一个栗子:红色为监控模型的输出摘要,绿色为推理模型的原始思维链。