@文章{JMLR:v25-23-0870,作者={Hyung Won Chung、Le Hou、Shayne Longpre、Barret Zoph、Yi Tay、William Fedus、Yunxuan Li、Xuezhi Wang、Mostafa Deghani、Siddhartha Brahma、Albert Webson、Shixiang Shane Gu、Zhuyun Dai、Mirac Suzgun、Xinunn Chen、Aakansha Chowdhery、Alex Castro-Ros、Marie Pellat、Kevin Robinson和Dasha Valter、Sharan Narang、Gaurav Mishra、Adams Yu、Vincent Zhao、Yanping Huang、Andrew Dai、Hongkun Yu、Slav Petrov、Ed H.Chi、Jeff Dean、Jacob Devlin、Adam Roberts、Denny Zhou、Quoc V.Le和Jason Wei},title={缩放教学-线性语言模型},journal={机器学习研究杂志},年份={2024},体积={25},数字={70},页数={1--53},url={http://jmlr.org/papers/v25/23-0870.html}}