@文章{JMLR:v25-23-0870，作者={Hyung Won Chung、Le Hou、Shayne Longpre、Barret Zoph、Yi Tay、William Fedus、Yunxuan Li、Xuezhi Wang、Mostafa Deghani、Siddhartha Brahma、Albert Webson、Shixiang Shane Gu、Zhuyun Dai、Mirac Suzgun、Xinunn Chen、Aakansha Chowdhery、Alex Castro-Ros、Marie Pellat、Kevin Robinson和Dasha Valter、Sharan Narang、Gaurav Mishra、Adams Yu、Vincent Zhao、Yanping Huang、Andrew Dai、Hongkun Yu、Slav Petrov、Ed H.Chi、Jeff Dean、Jacob Devlin、Adam Roberts、Denny Zhou、Quoc V.Le和Jason Wei}，title={缩放教学-线性语言模型}，journal={机器学习研究杂志}，年份={2024}，体积={25}，数字={70}，页数={1--53}，url={http://jmlr.org/papers/v25/23-0870.html}}