人工智能(AI)在我们的社会和科学中比以往任何时候都更为普遍。这一发展的核心是深度学习的概念,即使用多层深度的人工神经网络(ANN),与其他机器学习技术相比,ANN通常可以更好地再现类似人类的行为。
这一发展已经持续了很长一段时间,目前还不清楚具体的开始日期。可能的候选者可能是1943年的第一批人工神经网络(McCulloch&Pitts,1943),1985年推广反向传播以同时训练网络中的多个层(Rumelhart等。,1986)和1989年用于识别人类笔迹的应用(乐村等。, 1989).
如今,这一领域的增长似乎呈指数级增长,几乎每年都有重大突破的报道。一些最著名的例子是
(1) 在围棋比赛中击败职业选手(银牌等。, 2016),
(2) 用于图像识别的剩余神经网络(ResNets)(He等。, 2016),
(3) AlphaFold蛋白质结构预测(Jumper等., 2021),
(4) ChatGPT和其他大型语言模型(LLM)(https://gluebenchmark.com/leaderboard网站).
在同一时间段内,深度学习也在许多不太突出的情况下渗透到我们的社会中,例如
(1) 对手机摄像头拍摄的照片进行自动图像处理,
(2) 流媒体服务上的音乐或电影建议,
(3) 服务器大厅电源效率的优化。
毫无疑问,正如我们今天所知,人工智能已经成为社会的基础。到目前为止,这项技术主要是由大型科技公司开发的。
有了这些知识,许多科学家已经开始研究这些新工具对他们的研究领域意味着什么。虽然一些科学领域采用这些方法的速度相当慢,但我们现在看到人工智能应用在许多不同领域的迅速普及,以及来自应用晶体学杂志(https://journals.iucr.org/special_issues/2024/ANNs(英文))证明了X射线光子科学和结晶学的观察结果。
然而,人工智能的大多数应用都不是变革型的,与AlphaFold在结构预测领域的作用相比,它的效果不相上下。相反,我们有一些示例,比如对数据质量进行较小改进的预处理,或者对一项普通任务进行自动化,否则这项任务必须由研究人员完成。
分类机器学习的第一个应用之一是对数据进行分类。著名的例子包括识别手写数字和字母或识别人脸。在光子科学中,这也是一个常见的用例,例如,最近我们看到它被用于飞秒X射线成像模式(FXI)(Assalauova等。,2022),X射线光子相关光谱(Timmermann等。2022)和系列飞秒晶体学(Rahmani等。, 2023). 这通常是一种方便的方法,可以通过自动化一项劳动密集型任务,手动对一小组模式进行分类,然后训练机器学习算法,以类似的方式对更大的数据集进行分类,来加快研究人员的工作。
另一个例子来自中子衍射(Hao等。2023年),其中神经网络方法不仅用于过滤相关数据,还用于标记每个衍射图案中的感兴趣区域。
对神经网络方法的一个常见批评是其黑盒特性,即我们通常对经过训练的网络实际执行的分析了解非常有限。因此,一个特别有趣的发展是试图了解我们网络的内部工作。Nawaz报道了一个这样的例子等。(2023).
数据分析最近的一个发展是,除了分类之外,神经网络在数据分析中发挥了更积极的作用。我们在整个数据处理管道中看到了一些案例。一个成功的例子是数据预处理,例如,可以使用深度神经网络重新创建数据的缺失区域。小/广角X射线散射(SAXS/WAXS)(查韦斯等。2022年)和FXI(Bellisario等。,2022)实验。
神经网络进行大量分析的情况仍然相当罕见。然而,一个这样的例子是对金属-有机框架中的带隙结构的研究,其中对大量模拟数据进行训练的人工神经网络被应用于实验数据,取得了显著的成功(Gómez-Peralta等., 2022). 在Lim的另一个例子中等(2023),将实验数据与基于人工神经网络的模拟进行比较,估计激光熔化过程中的亚表面温度。
参数估计。更常见的应用是使用神经网络为使用传统方法的分析提供参数,或减少现有算法的搜索空间。奇图里等。(2021)使用神经网络估计X射线粉末衍射数据的晶格参数,这可以将此耗时算法的搜索空间减少100倍以上。类似的例子来自X射线反射率,其中使用神经网络在传统方法所需时间的一小部分内估计模型参数(Mareček等., 2022). 最近,一个名为CrystalMELA公司也发布了,它可以使用几种机器学习方法来估计晶体系统(Corriero等., 2023).
除了直接应用之外,许多文章都提到了人工智能,很明显,人们对该领域的人工智能技术充满了好奇和乐观。然而,人工智能技术的实施很可能还处于初级阶段。这里包括的大多数例子是使用相对温和的硬件的小型天才研究团队的工作。通过加快研究速度、识别隐藏模式以及通过自动化任务为研究人员腾出时间,这些影响已经显现出来。鉴于目前为止的成功,更多的努力和更多的计算能力可能会在我们的领域产生与AlphaFold在蛋白质结构预测方面相同的变革效果。
参考文献
Assalauova,D.、Ignatenko,A.、Isensee,F.、Trofimova,D.&Vartanyants,I.A.(2022年)。J.应用。克里斯特。 55, 444–454.
Bellisario,A.、Maia,F.R.N.C.和Ekeberg,T.(2022)。J.应用。克里斯特。 55, 122–132.
Chavez,T.、Roberts,E.J.、Zwart,P.H.和Hexemer,A.(2022)。J.应用。克里斯特。 55, 1277–1288.
Chitturi,S.R.、Ratner,D.、Walroth,R.C.、Thampy,V.、Reed,E.J.、Dunne,M.、Tassone,C.J.和Stone,K.H.(2021)。J.应用。克里斯特。 54, 1799–1810.
Corriero,N.、Rizzi,R.、Settembre,G.、Del Buono,N.和Diacono,D.(2023年)。J.应用。克里斯特。 56, 409–419.
Gómez-Peralta,J.I.,Bokhimi,X.,García-Peña,N.G.,Quintana-Owen,P.&Rodríguez-Gattorno,G.(2022)。J.应用。克里斯特。 55, 1538–1548.
Hao,Y.、Feng,E.、Lu,D.、Zimmer,L.、Morgan,Z.、Chakoumakos,B.C.、Zhang,G.和Cao,H.(2023)。J.应用。克里斯特.56, 519–525.
He,K.,Zhang,X.,Ren,S.和Sun,J.(2016)。2016年IEEE计算机视觉和模式识别会议(CVPR)第770-778页,https://doi.org/10.109/CVPR.2016.90皮斯卡塔韦:IEEE。
Jumper,J.、Evans,R.、Pritzel,A.、Green,T.、Figurnov,M.、Ronneberger,O.、Tunyasuunakool,K.、Bates,R.、日德克,A.、Potapenko,A.、Bridgland,A.、Meyer,C.、Kohl,S.A.、Ballard,A.J.、Cowie,A.、Romera Paredes,B.、Nikolov,S.、Jain,R.、Adler,J.、Back,T.、Petersen,S.、Reiman,D.、Clancy,E.、Zielinski,M.、Steineger,M.、Pacholska,M.,Berghammer,T.,Bodenstein,S.,Silver,D.,Vinyals,O.,Senior,A.W.,Kavukcuoglu,K.,Kohli,P.&Hassabis,D.(2021)。性质,596, 583–589.
Le Cun,Y.、Jackel,L.D.、Boser,B.、Denker,J.S.、Graf,H.P.、Guyon,I.、Henderson,D.、Howard,R.E.和Hubbard,W.(1989)。IEEE通信。美格.27, 41–46.
Lim,R.E.,Mukherjee,T.,Chuang,C.,Phan,T.Q.,DebRoy,T.&Pagan,D.C.(2023年)。J.应用。克里斯特。 56, 1131–1143.
Mareček,D.、Oberrieter,J.、Nelson,A.和Kowarik,S.(2022年)。J.应用。克里斯特。 55, 1305–1313.
McCulloch,W.和Pitts,W.(1943年)。牛市。数学。生物物理学。 5, 115–133.
Nawaz,S.、Rahmani,V.、Pennicard,D.、Setty,S.P.R.、Klaudel,B.和Graafsma,H.(2023)。J.应用。克里斯特。 56, 1494–1504.
Rahmani,V.、Nawaz,S.、Pennicard,D.、Setty,S.P.R.和Graafsma,H.(2023年)。J.应用。克里斯特。 56, 200–213.
Rumelhart,D.、Hinton,G.和Williams,R.(1986年)。性质,323, 533–536.
Silver,D.、Huang,A.、Maddison,C.J.、Guez,A.、Sifre,L.、van den Driessche,G.、Schrittwieser,J.、Antonoglou,I.、Panneershelvam,V.、Lanctot,M.、Dieleman,S.、Grewe,D.、Nham,J..、Kalchbrenner,N.、Sutskever,I.,Lillicrap,T.、Leach,M.,Kavukcuoglu,K.、Graepel,T.和Hassabis,D.(2016)。性质,529, 484–489.
Timmermann,S.、Starostin,V.、Girelli,A.、Ragulskaya,A.、Lahmann,H.、Reiser,M.、Begam,N.、Randolph,L.、Sprung,M.,Westermier,F.、Zhang,F.,Schreiber,F.和Gutt,C.(2022)。J.应用。克里斯特。 55, 751–757.
本文最初发表于J.应用。克里斯特。(2024年)。57, 1–2.
发布于晶体学报(剖面图A,B和天),国际癌症研究所和同步辐射杂志可以找到在这里.