@正在进行{yaune-eytal-2023数据,title=“数据相似性不足以解释语言模型性能”,author=“Yauney、Gregory和Reif、Emily和大卫·米姆诺”,editor=“Bouamor、Houda和皮诺、胡安和巴厘岛,卡利卡”,booktitle=“2023年自然语言处理实证方法会议记录”,月=12月,年=“2023”,address=“新加坡”,publisher=“计算语言学协会”,url=“https://aclantology.org/2023.emnlp-main.695”,doi=“10.18653/v1/2023.emnlp-main.695”,页码=“11295-11304”,abstract=“大型语言模型在许多但不是所有下游任务上都能实现高性能。通常假设预训练数据和任务数据之间的交互作用决定了这种差异:数据更类似于模型{'}的任务对于该模型,假设s预处理数据更容易。通过对Pile和C4预处理数据集与下游基准的大规模比较,我们测试了分布和特定示例的相似性度量(嵌入、令牌和基于模型)是否与语言模型性能相关。相似性与多语言数据集的性能相关,但在其他基准测试中,我们惊讶地发现相似性度量与准确性甚至彼此之间都不相关。这表明预训练数据和下游任务之间的关系比通常假设的更复杂。",}
<?xml version=“1.0”encoding=“UTF-8”?><modsCollection xmlns=“http://www.loc.gov/mods/v3"><mods ID=“yaune-etal-2023-data”><标题信息><title>数据相似性不足以解释语言模型性能</titleInfo><name type=“personal”>格雷戈里Yauney(雅尼)<角色>作者</角色></name><name type=“personal”>艾米丽Reif<角色>作者</角色></name><name type=“personal”>大卫米姆诺<角色>作者</角色></name><originInfo>2023-12发布日期</originInfo><typeOfResource>文本<relatedItem type=“主机”><标题信息>2023年自然语言处理实证方法会议记录</titleInfo><name type=“personal”>侯达布阿莫尔<角色>编辑器</角色></name><name type=“personal”>胡安皮诺<角色>编辑器</角色></name><name type=“personal”>卡利卡语巴厘岛<角色>编辑器</角色></name><originInfo>计算语言学协会<位置>新加坡</place></originInfo>会议出版物</relatedItem>大型语言模型在许多但不是所有下游任务上实现了高性能。通常假设预处理数据和任务数据之间的交互作用来确定这种差异:假设数据与模型的预处理数据更相似的任务对该模型更容易。通过对Pile和C4预处理数据集与下游基准的大规模比较,我们测试了分布和特定示例的相似性度量(嵌入、令牌和基于模型)是否与语言模型性能相关。相似性与多语言数据集的性能相关,但在其他基准测试中,我们惊讶地发现相似性度量与准确性甚至彼此之间都不相关。这表明预训练数据和下游任务之间的关系比通常假设的更复杂</摘要><identifier type=“citekey”>yauney-etal-2023-data</identifier>10.18653/v1/2023.emnlp-main.695<位置><网址>https://aclantology.org/2023.emnlp-main.695</url></位置><部分>2023-12年<扩展单元=“page”><开始>11295</开始><end>11304</范围></部分></mods></modsCollection>
%0会议记录%T数据相似性不足以解释语言模型的性能%格雷戈里·雅尼%艾米丽·雷夫%A Mimno,大卫%Y Bouamor,Houda公司%胡安·皮诺%Y巴厘岛,卡利卡%2023年自然语言处理实证方法会议论文集%D 2023年%12月8日%计算语言学协会%C新加坡%F yauney-etal-2023-数据%X大型语言模型在许多但不是所有下游任务上实现了高性能。通常假设预处理数据和任务数据之间的交互作用来确定这种差异:假设数据与模型的预处理数据更相似的任务对该模型更容易。通过对Pile和C4预处理数据集与下游基准的大规模比较,我们测试了分布和特定示例的相似性度量(嵌入、令牌和基于模型)是否与语言模型性能相关。相似性与多语言数据集的性能相关,但在其他基准测试中,我们惊讶地发现相似性度量与准确性甚至彼此之间都不相关。这表明预训练数据和下游任务之间的关系比通常假设的更复杂。%R10.18653/v1/2023.emnlp-main.695%U型https://aclantology.org/2023.emnlp-main.695%U型https://doi.org/10.18653/v1/2023.emnlp-main.695%电话:11295-11304
降价(非正式)
[数据相似性不足以解释语言模型性能](https://aclantology.org/2023.emnlp-main.695)(Yauney等人,EMNLP 2023)
国际计算语言学协会
- Gregory Yauney、Emily Reif和David Mimno。2023数据相似性不足以解释语言模型的性能.英寸2023年自然语言处理实证方法会议记录,第11295–11304页,新加坡。计算语言学协会。