这才是真・开源模型!公开「后训练」一切,性能超越Llama 3.1 Instruct 在最近关于「ScalingLaw是否撞墙」的讨论中,后训练被寄予厚望。近期发布的OpenAIo1在数学、代码、长程规划等问题上取得了显著提升背后的成功离不开后训练阶段强化学习训练 Llama3.1Instruct 2024年11月27日 77 点赞 1 评论 116 浏览