新LLM自学成才变身「预言家」! 最近,关于大型语言模型(LLM)的预测能力的研究引起了广泛关注。来自LightningRodLabs和伦敦政治经济学院的研究者们通过自我博弈和直接偏好优化(DPO)技术,成功提升了LLM的预测能力,使... AI资讯# 推理# 样本# 轨迹 5天前02440