×

使用可解释半监督分类器测试对新物理信号进行模型相关检测。 (英语) Zbl 07789406号

摘要:实验高能物理的一个中心目标是检测出已知物理无法解释的新物理信号。在本文中,我们的目标是在高维粒子物理数据中搜索与已知标准模型物理存在偏差的新信号。为此,我们确定标准模型背景样本的分布与实验观测值(背景和潜在新信号的混合)的分布之间是否存在统计上的显著差异。传统上,人们还假设可以从模型中获取样本,用于假设的信号分布。在此,我们研究了一种模型相关的方法,该方法不对信号做任何假设,并使用半监督分类器检测实验数据中是否存在信号。我们使用分类器构造了三个测试统计量:估计似然比测试统计量(LRT)、基于ROC曲线下面积的测试统计量和基于误分类误差的测试统统计量(MCE)。此外,我们提出了一种估计信号强度参数的方法,并探索了有源子空间方法来解释所提出的半监督分类器,以了解检测信号的特性。我们还提出了一个可用于模型相关设置的分数测试统计。我们在欧洲粒子物理研究所(CERN)大型强子对撞机上搜索希格斯玻色子的模拟数据集上研究了这些方法的性能。我们证明,对于指定的信号,半监督测试的功率与经典监督方法相比具有竞争力,但对于可能被监督测试完全忽略的意外信号,其功率要高得多。

MSC公司:

62件 统计学的应用
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] ADAM-BOURDARIOS,C.、COWAN,G.、GERMAIN,C.、GUYON,I.、KéGL,B.和ROUSSEAU,D.(2015)。希格斯玻色子机器学习挑战。《NIPS 2014高能物理与机器学习研讨会论文集》(G.Cowan、C.Germain、I.Guyon、B.Kégl和D.Rousseau编辑)。机器学习研究论文集42 19-55。加拿大蒙特利尔PMLR。
[2] ANDREASSEN,A.、NACHMAN,B.和SHIH,D.(2020年)。模拟辅助的无似然异常检测。物理学。版次:D 101 095004。
[3] ATLAS合作(2012)。在LHC用ATLAS探测器搜索标准模型希格斯玻色子过程中观察到一个新粒子。物理学。莱特。B 716 1-29。
[4] ATLAS合作(2014)。2014年ATLAS希格斯玻色子机器学习挑战赛的数据集。CERN开放数据门户。
[5] ATLAS合作(2019年)。使用数据衍生信号区域对新现象进行一般搜索的策略及其在ATLAS实验中的应用。欧洲物理学。《法院判例汇编》第79卷第120页。
[6] ATLAS合作与CMS合作(2011年)。LHC-Higgs组合小组,2011年夏季LHC-Higs玻色子搜索组合程序。技术报告,CMS-NOTE-2011-005。
[7] BACH,S.、BINDER,A.、MONTAVON,G.、KLAUSCHEN,F.、MüLLER,K.-R.和SAMEK,W.(2015)。通过分层相关传播对非线性分类器决策进行像素级解释。公共科学图书馆ONE 10 e0130140。数字对象标识符:10.1371/journal.pone.0130140谷歌学者:查找链接·doi:10.1371/journal.pone.0130140
[8] BEHNKE,O.、KRNINGER,K.、SCHOTT,G.和SCHRNER-SADENIUS,T.(2013)。高能物理中的数据分析:统计方法实用指南。纽约威利。
[9] BHAT,P.C.(2011)。粒子物理学中的多元分析方法。每年。版次编号。第部分。科学。61 281-309.
[10] BHNING,D.,DIETZ,E.,SCHAUB,R.,SCHLATTMANN,P.和LINDSAY,B.G.(1994)。单参数指数族密度混合物的似然比分布。Ann.Inst.Statist公司。数学。46 373-388. ·Zbl 0802.62017年
[11] 博斯特·ÖM,H.(2008年)。校准随机森林。2008年第七届机器学习和应用国际会议121-126。
[12] Breiman,L.(2001)。随机森林。机器。学习。45 5-32. ·Zbl 1007.68152号
[13] CASA,A.和MENARDI,G.(2018年)。高能物理中用于信号检测的非参数半监督分类。ArXiv预印本。可从ArXiv:1809.02977获得。
[14] CDF合作(2008)。CDF对新物理的模型相关和准模型无关搜索。物理学。版次:D 78 012002。
[15] CDF合作(2009)。在CDF使用\(2.0\mathit{f}\mathit{b}^{-1}\)进行新物理的全局搜索。物理学。版次:D 79 011101。
[16] CHAKRAVARTI,P.、KUUSELA,M.、LEI,J.和WASSERMAN,L.(2023年)。补充“使用可解释的半监督分类器测试对信号进行模型相关检测”https://doi.org/10.1214/22-AOAS1722SUPA网站, https://doi.org/10.1214/22-AOAS1722SUPB网站
[17] CHANDOLA,V.、BANERJEE,A.和KUMAR,V.(2009年)。异常检测:一项调查。ACM计算。Surv公司。41 1-58.
[18] CHOUDALAKIS,G.(2008)。在Tevatron进行独立于模型的新物理搜索。ArXiv预印本。可从ArXiv:0805.3954获取。
[19] CMS合作(2012)。利用大型强子对撞机的CMS实验观察到一个质量为125 GeV的新玻色子。物理学。莱特。乙716 30-61。
[20] CMS合作(2017)。MUSiC是一种对新物理的非特定搜索模型,在(sqrt{mathit{s}}=8TeV的pp碰撞中。CMS物理分析总结CMS-PAS-EXO-14/016。
[21] CMS合作(2020年)。MUSiC是一种对新物理的非特定搜索模型,在sqrt(s)=13TeV的pp碰撞中。技术报告,技术报告CMS-PAS-EXO-19-008,CERN,日内瓦。
[22] COLLINS,J.、HOWE,K.和NACHMAN,B.(2018)。共振新物理与机器学习的异常检测。物理学。修订稿。121 241803. 数字对象标识符:10.1103/PhysRevLett.121.41803谷歌学者:查找链接·doi:10.1103/PhysRevLett.121.241803
[23] COLLINS,J.H.、HOWE,K.和NACHMAN,B.(2019年)。通过机器学习扩展对新共振的搜索。物理学。版次:D 99 014038。
[24] 康斯坦丁,P.G.(2015)。主动子空间:参数研究中降维的新思路。SIAM聚焦2。宾夕法尼亚州费城SIAM。数字对象标识符:10.1137/1.9781611973860谷歌学者:查找链接MathSciNet:MR3486165·Zbl 1431.65001号 ·doi:10.1137/1.9781611973860
[25] CONSTANTINE,P.G.、DOW,E.和WANG,Q.(2014)。理论和实践中的主动子空间方法:在克里格曲面中的应用。SIAM J.科学。计算。36 A1500-A1524。数字对象标识符:10.1137/130916138谷歌学者:查找链接数学科学网:MR3233940·Zbl 1311.65008号 ·数字对象标识代码:10.1137/130916138
[26] CONSTANTINE,P.G.、EMORY,M.、LARSSON,J.和IACCARINO,G.(2015)。利用有源子空间量化HyShot II超燃冲压发动机数值模拟中的不确定性。J.计算。物理学。302 1-20. 数字对象标识符:10.1016/j.jcp.2015.09.001谷歌学者:查找链接数学科学网:MR3404505·Zbl 1349.76153号 ·doi:10.1016/j.jcp.2015.09.001
[27] COWAN,G.、CRANMER,K.、GROSS,E.和VITELLS,O.(2011年)。新物理相似基础测试的渐近公式。欧洲物理学。《期刊》第71卷第1554页。
[28] 克兰默(2015)。LHC的实际统计数据。ArXiv预印本。可从ArXiv:153.07622获得。
[29] CRANMER,K.、PAVEZ,J.和LOUPPE,G.(2015)。使用校准的判别分类器近似似然比。ArXiv预印本。可从ArXiv:1506.02169获得。
[30] CUI,C.、ZHANG,K.、DAULBAEV,T.、GUSAK,J.、OSELEDETS,I.和ZHANG(2020)。神经网络的主动子空间:结构分析和通用攻击。SIAM J.数学。数据科学。2 1096-1122。数字对象标识符:10.1137/19M1296070谷歌学者:查找链接数学科学网:MR4168214·Zbl 1486.90152号 ·doi:10.137/19M1296070
[31] D’AGNOLO,R.T.和WULZER,A.(2019年)。从机器上学习新物理。物理学。版次:D 99 015014。
[32] D’AGNOLO,R.T.、GROSSO,G.、PIERINI,M.、WULZER,A.和ZANETTI,M.(2021)。学习多元新物理。欧洲物理学。《期刊》第81卷第1-21页。
[33] D’AGNOLO,R.T.、GROSSO,G.、PIERINI,M.、WULZER,A.和ZANETTI,M.(2022年)。从一台不完美的机器上学习新的物理学。欧洲物理学。J.C 82第1-37页。
[34] D0合作(2012)。在(sqrt{\mathit{s}}=1.96\text{TeV}\)处对pp(bar)碰撞中的新现象进行独立于模型的搜索。物理学。版次D 85。
[35] DAUNCEY,P.、KENZIE,M.、WARDLE,N.和DAVIES,G.(2015)。处理背景形状中的不确定性:离散剖面法。J.仪器。10 P04015。
[36] Davison,A.C.和Hinkley,D.V.(1997年)。引导方法及其应用。剑桥统计与概率数学系列1。剑桥大学出版社,剑桥。数字对象标识符:10.1017/CBO9780511802843谷歌学者:查找链接数学科学网:MR1478673·Zbl 0886.62001号 ·doi:10.1017/CBO9780511802843
[37] DOBSON,A.J.和BARNETT,A.G.(2018)。广义线性模型导论,第四版,《统计科学丛书》。佛罗里达州博卡拉顿CRC出版社MathSciNet:MR3890007·Zbl 1412.62001号
[38] DORIGO,T.和DE CASTRO,P.(2020年)。高能物理中使用机器学习处理有害参数:综述。ArXiv预印本。可从ArXiv:2007.09121获得。
[39] Efron,B.和Tibshirani,R.J.(1993年)。引导程序简介。统计学和应用概率专著57。纽约CRC出版社。数字对象标识符:10.1007/978-1-4899-4541-9谷歌学者:查找链接数学科学网:MR1270903·兹比尔083562038 ·doi:10.1007/978-1-4899-4541-9
[40] 弗里德曼,J.H.(2003)。关于多元拟合优度和两样本检验。物理统计师2003年,加利福尼亚州斯坦福SLAC。
[41] GHOSH,A.、NACHMAN,B.和WHITESON,D.(2021)。高能物理中的不确定感知机器学习。物理学。版次:D 104 056026。
[42] GHOSH,J.K.和SEN,P.K.(1985年)。关于混合模型对数似然比统计量的渐近性能及相关结果。在纪念耶日·奈曼和杰克·基弗的伯克利会议记录,第二卷(加利福尼亚州伯克利,1983年)。华兹华斯统计师/可能性。序列号。789-806. Wadsworth,Belmont,CA。数学科学网:MR0822065·Zbl 1373.62075号
[43] Goodfellow,I.、Pouget-Abadie,J.、Mirza,M.、Xu,B.、Warde-Farley,D.、Ozair,S.、Courville,A.和Bengio,Y.(2014)。生成性对抗网络。神经信息处理系统进展2672-2680。
[44] 格伦·MPING,U.(2009年)。回归中的变量重要性评估:线性回归与随机森林。阿默尔。统计师。63 308-319. 数字对象标识符:10.1198/tast.2009.08199谷歌学者:查找链接数学科学网:MR2751747·doi:10.1198/tast.2009.08199
[45] H1合作(2004)。HERA中ep散射新现象的一般搜索。物理学。莱特。乙602 14-30。
[46] Hanley,J.A.和McNeil,B.J.(1982)。接收机工作特性(ROC)曲线下面积的含义和用途。放射科143 29-36.
[47] HANLEY,J.A.等人(1989年)。接收器操作特征(ROC)方法:最新技术。Crit Rev Diagn Imaging 29 307-335。
[48] Hastie,T.、Tibshirani,R.和Friedman,J.(2009)。《统计学习的要素:数据挖掘、推断和预测》,第二版,《统计学中的斯普林格系列》。纽约州施普林格。数字对象标识符:10.1007/978-0-387-84858-7谷歌学者:查找链接数学科学网:MR2722294·Zbl 1273.62005年 ·doi:10.1007/978-0-387-84858-7
[49] HENZE,N.(1988年)。基于最近邻类型重合度的多变量双样本检验。安。统计师。16 772-783. 数字对象标识符:10.1214/aos/1176350835谷歌学者:查找链接MathSciNet:MR00947577·Zbl 0645.62062号 ·doi:10.1214/aos/1176350835
[50] ISHWARAN,H.(2007年)。二元回归树和森林中的变量重要性。电子。《美国联邦法律大全》第1卷第519-537页。数字对象标识符:10.1214/07-EJS039谷歌学者:查找链接数学科学网:MR2357716·Zbl 1320.62158号 ·doi:10.1214/07-EJS039
[51] KASIECZKA,G.、NACHMAN,B.、SHIH,D.、AMRAM,O.、ANDREASSEN,A.、BENKENDORFER,K.、BORTOLATO,B.、BROOIJMANS,G.和CANELLI,F.等人(2021年)。2020年大型强子对撞机奥运会:高能物理异常检测的社区挑战。ArXiv预印本。可从ArXiv:2101.08320获得。
[52] KIM,I.、LEE,A.B.和LEI,J.(2019年)。通过回归进行全球和本地双样本测试。电子。《美国联邦法律大全》第13卷第5253-5305页。数字对象标识符:10.1214/19-EJS1648谷歌学者:查找链接数学科学网:MR4043073·Zbl 1435.62199号 ·doi:10.1214/19-EJS1648
[53] KIM,I.、RAMDAS,A.、SINGH,A.和WASSERMAN,L.(2021)。分类准确度作为双样本测试的代表。安。统计师。49 411-434. 数字对象标识符:10.1214/20-AOS1962谷歌学者:查找链接数学科学网:MR4206684·Zbl 1461.62100号 ·doi:10.1214/20-AOS1962
[54] KNUTESON,B.(2000年)。加州大学伯克利分校博士论文。
[55] KUUSELA,M.、VATANEN,T.、MALMI,E.、RAIKO,T.,AALTONEN,T.和NAGAI,Y.(2012)。半监督异常检测-面向新物理的模型相关搜索。摘自《物理学杂志:会议系列368 012032》。IOP出版社,布里斯托尔。
[56] Lei,J.、G'Sell,M.、Rinaldo,A.、Tibshirani,R.J.和Wasserman,L.(2018)。回归的无分布预测推断。J.艾默。统计师。协会113 1094-1111。数字对象标识符:10.1080/01621459.2017.1307116谷歌学者:查找链接数学科学网:MR3862342·兹比尔1402.62155 ·doi:10.1080/01621459.2017.1307116
[57] LYONS,L.和WARDLE,N.(2018年)。高能物理学中寻找新现象的统计问题。《物理学杂志》。G、 编号。第部分。物理学。45 033001.
[58] METZ,C.E.(1978年)。ROC分析的基本原则。核医学研讨会8 283-298。阿姆斯特丹爱思唯尔。
[59] NACHMAN,B.(2020年)。LHC搜索中部署深度学习的指南:如何实现最优化并考虑不确定性。SciPost物理。8第090号论文。数字对象标识符:10.21468/scipostphys.8.6.090谷歌学者:查找链接数学科学网:MR4196320·doi:10.21468/scipostphys.8.6.090
[60] NACHMAN,B.和SHIH,D.(2020年)。使用密度估计进行异常检测。物理学。版次:D 101 075042。
[61] NELDER,J.A.和WEDDERBURN,R.W.(1972年)。广义线性模型。J.R.Stat.Soc.,(A 135 370-384)。
[62] 纽康比,R.G.(2006)。基于Mann-Whitney统计的效应大小度量的置信区间。第2部分:渐近方法和评估。统计医学25 559-573。数字对象标识符:10.1002/sim.2324谷歌学者:查找链接数学科学网:MR2222114·doi:10.1002/sim.2324
[63] NICULESCU-MIZIL,A.和CARUANA,R.(2005)。通过监督学习预测良好概率。第22届机器学习国际会议论文集。ICML公司2005 625-632. 美国纽约州纽约市计算机协会。
[64] 颗粒数据组(2020年)。粒子物理学综述。PTEP公司2020 083C01。
[65] PEYRé,G.、CUTURI,M.等人(2019年)。计算优化传输:应用于数据科学。已找到。趋势马赫数。学习。11 355-607。
[66] RADOVIC,A.、WILLIAMS,M.、ROUSSEAU,D.、KAGAN,M.,BONACORSI,D.、HIMMEL,A.、AURISANO,A.、TERAO,K.和WONGJIRAD,T.(2018)。粒子物理能量和强度前沿的机器学习。自然560 41-48中。数字对象标识符:10.1038/s41586-018-0361-2谷歌学者:查找链接·doi:10.1038/s41586-018-0361-2
[67] REISS,R.-D.(1993年)。点过程课程。统计学中的斯普林格系列。纽约州施普林格。数字对象标识符:10.1007/978-1-4613-9308-5谷歌学者:查找链接数学科学网:MR1199815·Zbl 0771.60037号 ·doi:10.1007/978-1-4613-9308-5
[68] SCHILLING,M.F.(1986年)。基于最近邻的多元双样本检验。J.艾默。统计师。协会81 799-806。数学科学网:MR0860514·Zbl 0612.62081号
[69] SHRIKUMAR,A.、GREENSIDE,P.和KUNDAJE,A.(2017)。通过传播激活差异来学习重要功能。ArXiv预印本。可从ArXiv:1704.02685获得。
[70] SOHA,A.L.(2008)。新物理的一般搜索。在第34届国际高能物理会议上。
[71] Storey,J.D.(2002)。错误发现率的直接方法。J.R.统计社会服务。B.统计方法。64 479-498. 数字对象标识符:10.1111/1467-9868.00346谷歌学者:查找链接数学科学网:MR1924302·Zbl 1090.62073号 ·doi:10.1111/1467-9868.00346
[72] STROBL,C.、BOULESTEIX,A.-L.、KNEIB,T.、AUGUSTIN,T.和ZEILEIS,A.(2008)。随机森林的条件变量重要性。BMC生物信息。9 307. 数字对象标识符:10.1186/1471-2105-9-307谷歌学者:查找链接·doi:10.1186/1471-2105-9-307
[73] SUNDARARAJAN,M.、TALY,A.和YAN,Q.(2017)。深层网络的公理属性。ArXiv预印本。可从ArXiv:1703.01365获得。
[74] 范德莱恩,M.J.(2006)。变量重要性的统计推断。国际生物统计杂志。2第2条。数字对象标识符:10.2202/1557-4679.1008谷歌学者:查找链接数学科学网:MR2275897·doi:10.2202/1557-4679.1008
[75] VATANEN,T.、KUUSELA,M.、MALMI,E.、RAIKO,T.,AALTONEN,T.和NAGAI,Y.(2012)。高能粒子物理中集体异常的半监督检测。这个2012年国际神经网络联合会议(国际JCNN) 1-8. IEEE,纽约。
[76] 威廉姆森(WILLIAMSON,B.D.)、吉尔伯特(GILBERT,P.B.)、西蒙(SIMON,N.R.)和卡隆(CARONE,M.)(2020年)。一种统一的算法辨识变量重要性推理方法。ArXiv预印本。可从ArXiv:2004.03683获得。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。