“沈玲凤等人:预训练的变形金刚真的能通过梯度下降学习内文吗?(2023)”。 _:ID_5410df2174f83f08b694d77bb9c3d809。_:ID_5410df2174f83f08b694d77bb9c3d809 _:ID_5410df2174f83f08b694d77bb9c3d809 _:ID_5410df2174f83f08b694d77bb9c3d809“日记账/corr/abs-2310-08540”。 _:ID_4c8c3418300102852e7bd86fcab5a02e。_:ID_4c8c3418300102852e7bd86fcab5a02e _:ID_4c8c3418300102852e7bd86fcab5a02e _:ID_4c8c3418300102852e7bd86fcab5a02e“10.48550/ARXIV.2310.08540”。 “经过预处理的变形金刚真的可以通过梯度下降学习内控吗?”。 "3"^^ _:Sig_40f2fdfe698bda4ca376f658ae57734d_1。_:Sig_40f2fdfe698bda4ca376f658ae57734d_1 _:Sig_40f2fdfe698bda4ca376f658ae57734d_1“凌风神”。_:信号_40f2fdfe698bda4ca376f658ae57734d_1 _:信号_40f2fdfe698bda4ca376f658ae57734d_1"1"^^_:Sig_40f2fdfe698bda4ca376f658ae57734d_1 _:Sig_40f2fdfe698bda4ca376f658ae57734d_2。_:Sig_40f2fdfe698bda4ca376f658ae57734d_2 _:Sig_40f2fdfe698bda4ca376f658ae57734d_2“Aayush Mishra”。_:Sig_40f2fdfe698bda4ca376f658ae57734d_2 _:Sig_40f2fdfe698bda4ca376f658ae57734d_2"2"^^_:Sig_40f2fdfe698bda4ca376f658ae57734d_2 _:Sig_40f2fdfe698bda4ca376f658ae57734d_3。_:Sig_40f2fdfe698bda4ca376f658ae57734d_3 _:Sig_40f2fdfe698bda4ca376f658ae57734d_3“丹尼尔·卡沙比”。_:Sig_40f2fdfe698bda4ca376f658ae57734d_3 _:Sig_40f2fdfe698bda4ca376f658ae57734d_3"3"^^_:Sig_40f2fdfe698bda4ca376f658ae57734d_3 “CoRR”。 “CoRR”。 “abs/2310.08540”。 "2023"^^ “dblp记录‘journals/corr/abs-2310-08540’的RDF数据的来源信息”。 “2023-10-25T17:11:46+0200”。