提供商:Schloss Dagstuhl-莱布尼茨信息中心数据库:dblp计算机科学书目内容:文本/纯文本;charset=“utf-8”TY-非正式或其他出版物ID-DBLP:日志/corr/abs-2402-14740非盟-艾哈迈迪安,阿拉什澳大利亚-克里默,克里斯澳大利亚-加莱,马提亚斯AU-马齐·法代伊(Marzieh Fadaee)AU-朱莉娅·克鲁泽AU-奥利维尔派琴Ahmet,AU-U stün澳大利亚——萨拉·胡克TI-回到基础:重温强化风格优化,以从LLM中的人的反馈中学习。JO-CoRR公司VL-abs/2402.147402024年上半年//DO-10.48550/ARXIV.2402.14740UR-(欧元)https://doi.org/10.48550/arXiv.2402.14740急诊室-