微软研究人员指出,并非所有token都符合需求 微软研究人员挑战了语言模型预训练的传统方法,该方法在训练语料库中的所有token上均匀应用下一个token预测损失。他们提出了一种新的语言模型称为RHO-1,该模型利用选择性语 AI数据 2024年05月07日 118 点赞 1 评论 178 浏览