研究论文\(\def\h填{\hskip5em}\def\hfil{\hski p3em}\def\eqno#1{\hfil{#1}}\)

期刊徽标基础
进展
国际标准编号:2053-2733

N个-用冻结核电子重构具有代表性的单电子约化密度矩阵

十字标记徽标

法国巴黎萨克利大学中央科学研究院SPMS实验室,法国伊维特基夫苏尔F91190
*通信电子邮件:sizzuo.yu@centralesupelec.fr

波兰华沙大学P.M.Dominiak编辑(收到日期:2023年12月1日; 2024年2月19日接受; 在线2024年3月21日)

量子晶体学的最新进展表明,超越传统电荷密度细化,满足以下条件的单电子约化密度矩阵(1-RDM)N个-可表示性条件可以通过半定规划使用联合实验的X射线结构因子和方向康普顿轮廓(DCP)来重建。到目前为止,这种1-RDM的重建方法,不局限于幂等性,只在玩具模型系统(CO)上进行了测试2). 在这项工作中,对结晶尿素[CO(NH2)2]使用静态(0K) 和动态(50K) 人工实验数据。为了更好地处理日益增加的系统复杂性,引入了一个改进的模型,其中包括对称约束和冻结核电子贡献。对重建的1-RDM、变形密度和DCP各向异性进行了分析,结果表明,即使在信息不足和数据损坏的情况下,模型中的变化也能显著提高重建质量。因此,该模型和策略的鲁棒性很好地适应了实际实验散射数据的重建问题。

1.简介

While期间N个-电子波函数对晶体中的电子结构提供了最完整、最准确的描述,但由于实际系统的指数级复杂性,其实验测定仍遥不可及。此外,用库尔森的话来说:“一个传统的多电子波函数告诉我们的比我们需要知道的更多”(库尔森,1960年【Coulson,C.A.(1960),《现代物理学评论》32,170-177。】). 因此,值得考虑将一(二)电子约化密度矩阵(1,2-RDM)作为波函数的紧凑替代物,因为它们涉及的参数少得多。截至今日N个-代表性条件(刘等。, 2007[Liu,Y.K.,Christandl,M.&Verstraete,F.(2007),《物理评论稿》,第98期,第110503页。]),确保减少的密度矩阵可以与完整的N个-人体密度矩阵,以及缺乏具有足够信息内容的实验观测数据,仍然是2-RDM重建的巨大障碍。因此,1-RDM不受相同的阻碍,并且仍然包含有价值的量子力学信息,被认为是从实验数据模拟电子行为的合适候选者。然而,重建进程仍然是一项具有挑战性的任务。首先,N个-要使实验重建的1-RDM具有物理意义,还需要满足可表示性条件。其次,从纯测量的角度来看,由于1-RDM包含位置和动量空间信息,据我们所知,目前无法使用单一的实验技术获得它。

从实验数据重建1-RDM的挑战是由克林顿及其同事在20世纪60年代提出的,他们使用一种极端的幂等性条件来确保N个-代表性(克林顿等。, 1969[Clinton,W.L.,Galli,A.J.,Henderson,G.A.,Lamers,G.B.,Massa,L.J.和Zarur,J.(1969a)。Phys.Rev.177,27-33。]b条[克林顿·W·L、加利·A·J和马萨·L·J(1969b),《物理评论》177,7-13。]c(c)[Clinton,W.L.、Henderson,G.A.和Prestia,J.V.(1969c),《物理评论》177、13-18。]d日[Clinton,W.L.,Nakhleh,J.&Wunderlich,F.(1969d),《物理学评论》177,1-6。]; 克林顿和拉默斯,1969年[Clinton,W.L.&Lamers,G.B.(1969),《物理评论》177,19-27。]). 基于结合孤立原子的位置和动量空间数据的一系列工作,施密德等。(1992[Schmider,H.,Smith,V.H.Jr&Weyrich,W.(1992),《化学物理杂志》96,8986-8994.])认为幂等性条件会阻碍重构密度矩阵中电子(静态和动态)相关效应的恢复。最近X射线约束波函数证实了位置空间中可能存在此类信息精炼尿素和丙氨酸(Hupf等。, 2023【Hupf,E.,Kleemis,F.,Borrmann,T.,Pal,R.,Krzeszczakowska,J.M.,Woin,M.,Jayatilaka,D.,Genoni,A.&Grabowsky,S.(2023).化学物理杂志.158,124103。】). 作者认为,可以使用高分辨率X射线衍射结构因子找到明显偏离Hartree–Fock描述的证据。任何基于单一确定性的模型都将禁止访问数据中的此类细微特征。采用正式观点,Mazziotti(2007[Mazziotti,D.A.(2007),《降低密度矩阵力学:应用于多电子原子和分子》,第134卷。威利在线图书馆。])讨论了要包括的不同策略N个-一系列文章中的可表示性条件,并提出了1,2-RDM重建问题的半定规划(SDP)公式(Foley&Mazziotti,2012【Foley,J.J.和Mazziotti,D.A.(2012),《物理学评论A》,86,012512。】). 基于更实际的理由,继施密德及其同事的开创性工作之后,几篇论文报道了X射线衍射结构因子(SF)和定向康普顿轮廓(DCP)的联合使用探索磁性和非磁性分子化合物中1-RDM建模的不同非单行列式模型和策略(Schmider&Smith,1993[Schmider,H.&Smith,V.H.Jr(1993).Z.Naturforsch.A,48221-226。]; 施密德等。, 1993[Schmider,H.,Smith,V.H.Jr&Weyrich,W.(1993).Z.Naturforsch.A,48,211-220.]; 施瓦茨等。, 1994【Schwarz,W.H.E.,Langenbach,A.&Birlenbach,L.(1994),《Theor Chim.Acta》,第88期,第437-445页。】; 施密德,1996【Schmider,H.(1996),《化学物理杂志》105,3627-3635。】; 盖迪达等。, 2018【Gueddida,S.、Yan,Z.和Gillet,J.-M.(2018a),《水晶学报》A74、131-142。】b条【Gueddida,S.,Yan,Z.,Kibalin,I.,Voufack,A.B.,Claiser,N.,Souhassou,M.,Lecomte,C.,Gillon,B.&Gillet,J.-M.(2018b),《化学物理杂志》148,164106。】; De Bruyne&Gillet,2020年【De Bruyne,B.和Gillet,J.-M.(2020),《结晶学报》,A76,1-6。】; Launay&Gillet,2021年【Launay,Y.和Gillet,J.-M.(2021),《水晶学报》B77,683-694。】). 然而,所有已提出的基于SDP的1-RDM重建尝试都适用于最多含有两个或三个原子的孤立原子或分子。

本工作基于De Bruyne&Gillet(2020)提出的凸优化方法,进一步研究了分子晶体中的1-RDM重建问题【De Bruyne,B.和Gillet,J.-M.(2020),《结晶学报》,A76,1-6。】)、Launay&Gillet(2021年[Launay,Y.和Gillet,J.-M.(2021)。晶体学报B77,683-694。]),从适度的干冰(CO)扩大系统规模2)到更实际的尿素[CO(NH2)2]水晶。因此,目的是证明改进方法的潜力,该方法更符合实际应用,并且适用于补偿稀疏动量空间数据。为了应对系统规模显著增加带来的挑战,我们建议实施对称约束和冻结核心电子贡献的可能性。首次使用近似能量和维里比来确定1-RDM模型精化的最佳数据集。

本文的结构如下。在第2节中[链接],我们解释了如何将1-RDM重建表示为凸优化问题N个-表示条件、对称性和冻结核电子作为凸约束。简要回顾了热运动反褶积重建方法。在第3节中[链接],我们展示了联合使用位置和动量空间数据的重要性,即使在怀疑康普顿散射数据信息不足的情况下。说明了噪声和温度效应引起的附加退化,以及使用对称性和冻结芯约束提高的鲁棒性。最后一节给出了结论和未来的发展方向。

2.方法

2.1. 基于最小二乘拟合的1-RDM重建

对于自旋跟踪(无自旋)纯态N个-电子系统,1-RDM可以通过将N个−1的坐标N个-电子密度矩阵,

[\Gamma^{(1)}({\bfr},{\bfr}^{\prime})=N\textstyle\int\psi{2}\ldots\,{\rm d}{\bf r}_{N},\eqno(1)]

哪里ψ(第页第页2 … 第页N个)是纯粹的国家N个-电子波函数。混合状态系统1-RDM只是纯状态1-RDM的凸组合。

这是众所周知的(Löwdin,1955【Löwdin,P.-O.(1955),《物理学评论》第97期,第1474-1489页。】)使用离散的单电子基组可以方便地近似1-RDM{ϕ}作为

[\Gamma^{(1)}({\bfr},{\bfr}^{\prime})=\textstyle\sum\limits_{ij}点_{ij}\phi{i}({\bfr})\phi^{*}{j}(\\bfr}^{prime})。\等式(2)]

如果基础集保持不变,则一旦人口矩阵确定1-RDMP(P)英寸(2[链接])找到。因此,模型中参数的数量完全取决于总体矩阵的大小,因此也取决于基函数的数量。在这项工作中,基函数是原子轨道,但如果需要,对于强离域电子系统,也可以考虑平面波。

1-RDM通过其对角元素与位置空间中的平均电子密度分布直接相连,

[\rho({\bfr})=\Gamma^{(1)}({\Bfr},{\bf r}).\eqno(3)]

此外,1-RDM通过6D傅立叶-狄拉克变换封装动量空间信息(Weyrich,1996[Weyrich,W.(1996)。单电子密度矩阵和相关观测值,第245-272页。柏林:施普林格。]),

[n({\bf-p})={{1}\over{(2\pi\hbar)^{3}}}\int\Gamma^{(1)}^{3} t吨\,{\rm d}^{3} 第页,\eqno(4)]

具有n个(第页)就是动量密度。这两个相空间轴的双重连接强烈表明,从单一实验技术提供的数据重建高质量1-RDM的希望不大。

由于效率很高精炼方法和模型(Gatti&Macchi,2012【Gatti,C.&Macchi,P.(2012),编辑,《现代电荷密度分析》,多德雷赫特:施普林格荷兰出版社。】)由弹性相干X射线衍射获得的高分辨率X射线SF几乎常用于位置空间电子密度的重建。使用(3[链接]),SF和1-RDM之间的关系很简单

[F({\bf-q})=\textstyle\int\Gamma^{(1)}({\bf-r},{\bfr})\exp(-i{\bfr}\cdot{\bf q}

另一方面,DCP是通过深度非弹性非相干X射线散射测量的。在脉冲近似下(Phillips&Weiss,1968【Phillips,W.C.&Weiss,R.J.(1968),《物理学评论》171、790-800。】),它们可以获得动量空间电子密度的投影,

[J(q,{\bfu})=\intn({\bf-p})\delta({\bf-p}\cdot{\bfu}-q)\,{\rmd}{\bfp}\eqno(6)]

[={{1}\over{2\pi\hbar}}\int\Gamma^{(1)}({\bfr},{\bfr}+t{\bfu})\exp(-iqt/\hbar)\,{\rmd}t,{\RMd}^{3} 第页,\eqno(7)]

哪里u个是在动量空间中给出电子密度投影到其上的方向的单位向量。它与康普顿测量的散射矢量共线。

本工作中使用的模型基于表达式(2[链接]). 因此,确定给定一组SF和DCP的最佳总体矩阵需要将实验观测值表示为矩阵的函数P(P)使用运算符窗体

[F({\bf q})={\rm Tr}({\bf F}_{\bf q}}{\bf P})\quad{\rm and}\quad J({\bf q})={\rm Tr}({\bf J}_{\bf q}}{\bf P}),\eqno(8)]

具有F类q个J型q个分别是SF和DCP运营商。为了简洁起见,q个代表(q个u个)在(8)的康普顿轮廓矩阵元素中[链接]). 为了进一步进行,操作员F类q个J型q个因为矩阵元素需要写在基本集表示中

[\eqaligno{({\bf F}_{{\bf-q}}){ij}&=int\phi_{i}^{*}^{3} 第页,&\cr({\bf J}{{\bf-q}}){ij}&={{1}\over{2\pi\hbar}}\int\phi_{i}^{*}^{3} r.(右)。&(9)}]

在这项工作中,特别关注了最终1-RDM重建的可靠性。如果假设数据点上的误差条不相关并遵循正态分布规律,对于无偏模型,最可能的总体矩阵P(P)通过求解最小化问题得到

[{\rm argmin}_{{\bf P}}\,\sum_{i}\left[{{\rm-Tr}({\bf-O}_{i{\bf-P})-O^{\exp}_{i}}\ over{\sigma_{ineneneep}\ right]^{2},\eqno(10)]

其中,模型预计会产生以下表示的每个可观测数据的平均值O(运行)而它的实际实验测量给出了 O(运行)经验与相关的估计方差[\sigma{i}^{2}]在我们的例子中,每个数据点都来自X射线衍射或康普顿散射测量,因此[{\bf-O}_{i}={\bf F}_{\bfq}_{i}][{\bf-O}_{j}={\bf j}_{\bfq}_{j}}]针对不同的散射矢量。在本工作中,对于给定的高斯收缩Slater型轨道基集,每个矩阵元(9[链接])在之前计算精炼使用数学软件代码(Wolfram Research,2023[Wolfram Research(2023年)。Mathematica,13.3版。美国伊利诺伊州香槟市]).

(10)的最小化[链接])是一个凸最小二乘拟合问题。以下部分将解释如何以及必要的N个-在可表示性条件下,重构问题属于一个称为半定规划的凸优化问题(Boyd&Vandenberghe,2004[Boyd,S.P.&Vandenberghe,L.(2004).凸优化.剑桥大学出版社.]).

2.2。约束条件:N个-代表性、对称性和冻结核

这个N个-必须满足可代表性条件,以确保人口矩阵产生具有物理意义的密度矩阵。值得注意的是N个-如果要求系统处于纯态而不是量子态的统计混合态,则表示性条件要困难得多。纯净 N个-代表性和合奏 N个-代表性通常用于区分各自的情况(Chakraborty和Mazziotti,2015【Chakraborty,R.&Mazziotti,D.A.(2015),国际量子化学杂志,115,1305-1310。】). 出于实际原因,我们选择考虑后一种情况,因为系统不可能始终处于基态,而不与环境交互。因此,对于合奏 N个-可表示的1-RDM,人口矩阵P(P)对于与正交基集相关联的闭壳系统,必须满足以下约束条件,

[{\bf P}^{\perp}\succeq 0,\eqno(11a)]

[2{\bf I}-{\bf-P}^{\perp}\succeq 0,\eqno(11b)]

[{\rm Tr}({\bf P}^{\perp})=N,\eqno(11c)]

以及明显的条件P(P)是赫密特人。在这里是单位矩阵,符号[\成功]意味着矩阵是半正定的,这相当于说明所有特征值都是非负的。因此,约束(11b条)[链接]需要以下特征值P(P)小于2。如前所述,本基础集由Slater型原子轨道(表示为高斯收缩)组成,这些轨道互不正交。因此,在重建之前,对原子基集进行Lowdin正交化。

(11)中列出的所有约束条件[链接][链接][链接]是凸的;因此,方程(10)最小化的凸性[链接])已保存。此外P(P)Ş(11)中规定的[链接])使使用SDP工具成为可能(Foley&Mazziotti,2012【Foley,J.J.和Mazziotti,D.A.(2012),《物理学评论A》,86,012512。】; De Bruyne&Gillet,2020年【De Bruyne,B.和Gillet,J.-M.(2020),《结晶学报》,A76,1-6。】). 因此,极大地便利了对解决方案的访问。

本工作中开发的模型特别适用于分子晶体,对于分子晶体,可以将单个原子组视为形成特定实体。假定这一组被称为“分子”,与同一或相邻单位细胞中的其他实体不共享任何电荷。因此,1-RDM模型只是一个分子1-RDM,在其上可以应用平移和旋转对称操作来生成整个晶体的密度矩阵。本工作充分考虑了这些操作。

也可以考虑分子水平上的对称不变性。因此,要求种群矩阵是每个对称算子不变子空间中矩阵的直接和。换句话说,P(P)当使用对称适配轨道作为新的基础时,应该是块-对角的, [{\bf S}^{\rm T}{\bf-P}{\b S}=\oplus{j=1}^{n}{\ff-P}_{j}],其中S公司将原子轨道的基础转换为对称自适应轨道,n个是不可约表示的数量P(P)j个与每个不可约表示相关的块矩阵。

新模型还允许冻结核心电子贡献。它有效地减少了模型的活动空间,从而减少了人口矩阵中要确定的参数的数量。因此,如下一节所示,计算成本降低了,并且提高了结果对噪声污染和热效应的鲁棒性。它可以最好地观察到核电子的空间密度分布,有助于在每个核附近形成尖峰。因此,准确再现人口矩阵模型的这些特征需要高-q个SF,在正常温度下可能会带来实验挑战。在这里,选择了一种替代但通用的方法。对波函数进行单行列式计算,从中提取核电子分子轨道,构建近似的核电子密度矩阵[{\bfP}^{\perp}={\bf P}^}{\prime\perp{+{\bf-P}_{\rm{core}}^{\ perp}],使用[{\bf P}_{\rm{core}}^{\perp}]是冻结的核心电子布居矩阵。后者表示固定数量的电子,并且通过构造是幂等的。因此,如果满足以下条件,优化就必须在与核心电子轨道所跨越的子空间正交的子空间中搜索最优解N个-要保留总1-RDM上的可表示性。

结合对称性和冻结核条件,假设一个非磁性系统N个-可表示性约束变为

[{\bf P}^{\prime\perp}\succeq 0,\eqno(12a)]

[2{\bf I}-{\bf-P}^{\prime\perp}-{\ff P}^}\perp{{\rm{core}}\succeq 0,\eqno(12b)]

[{\rm Tr}({\bf P}^{\prime\perp}+{\bf P}^{\perm}_{\rm{core})=N\eqno(12c)]

[{\bf S^{\prime}}^{\rm T}

具有P(P)是价电子的布居矩阵N个单个分子的总电子数。S公司'将正交原子基转换为对称自适应基。我们用(12[链接])–(12d日[链接]),优化问题仍然可以用SDP建模。在这项工作中,使用CVXPY公司套餐(Diamond&Boyd,2016【Diamond,S.&Boyd,S.(2016),J.Mach.Learn.Res.17,1-5.】).

2.3. 非零温数据重建

必须注意的是,重构方法本质上与温度无关,因为1-RDM描述混合态和纯态。然而,与第一原理计算相比,通常最好在零开尔文极限下进行。因此,有助于反褶积热运动效应,以恢复理想的静态1-RDM。在这项工作中,假设给定大光子-电子能量传递在康普顿散射过程中,DCP在相当低的温度下几乎不受核搅拌的影响(斯特尼曼等。, 2000[Sternemann,C.,Döring,G.,Wittkop,C.,Schülke,W.,Shukla,A.,Buslaps,T.&Suortti,P.(2000).物理化学固体杂志,61,379-382.]; Dugdale&Jarlborg,1998年【Dugdale,S.&Jarlborg,T.(1998),《固态通讯》105,283-287。】; 松田等。, 2020【Matsuda,K.、Kimura,K.、Hagiya,T.、Kajihara,Y.、Inui,M.、Hiraka,N.、Tamura,K.和Sakurai,Y.(2020)。物理状态固体B,2572000187。】). 因此,对于X射线SF,只考虑温度引起的实验数据变化。在这种情况下,模型被修改,使得SF矩阵元素包括各向异性的Debye–Waller因子,

[({\bf F}_{{\bfq}})_{ij}=\exp(-{\bf-q}\cdot\widehat{乙}_{a} \cdot{\bf q})\textstyle\int\phi_{i}^{*}({\bf r})\phi_{j}({\bf r})\exp(-i{\bf q}\cdot{\bf r})\,{\rm d}^{3} 第页,\eqno(13)]

哪里[\widehat(宽度){乙}_{a} ]是原子核的热位移张量这两个基本功能ϕϕj个是居中的。当基函数与不同的原子关联时,不应用任何变化。更复杂的温度方案值得考虑(史蒂文斯等。, 1977【Stevens,E.D.、Rys,J.和Coppens,P.(1977),《水晶学报》,A33,333-338。】). 例如,我们以前的工作(Launay&Gillet,2021)中实现了双中心贡献的Mulliken分区方法【Launay,Y.和Gillet,J.-M.(2021),《水晶学报》B77,683-694。】)并应与实际数据一起使用。然而,选择通常的独立原子模型是为了防止与用于生成参考数据的计算方法(Erba等。, 2013【Erba,A.,Ferrabone,M.,Orlando,R.&Dovesi,R.(2013),《计算化学杂志》34,346-354。】). 经检查,当数据不受噪声污染时,这种简单的方法允许对热搅动效应进行公平的反褶积。

3.结果

上述模型非常适合于分子晶体,应针对实际系统进行评估。特别是,对于这种结合不同实验的方法,有必要评估数据质量对1-RDM重建的影响。

尿素晶体[CO(NH2)2](图1[链接])之所以选择它,有两个具体原因:首先,它长期以来被视为电荷密度重建领域的标准测试系统。代表了几种键类型,其中高流动性和离域电子密度有助于非线性光学特性(卡西迪等。, 1979【Cassidy,C.、Halbout,J.、Donaldson,W.和Tang,C.(1979),《公共选择》29、243-246。】; 西部等。, 2015【West,A.C.,Schmidt,M.W.,Gordon,M.S.&Ruedenberg,K.(2015),《物理化学杂志》,第119期,第10368-10375页。】). 其次,由于多年来吸引了人们的兴趣,高质量的SF(Zavodnik等。, 1999[Zavodnik,V.、Stash,A.、Tsirelson,V.和de Vries,R.&Feil,D.(1999),《结晶学报》,B55,45-54。]; 比克达尔等。, 2004【Birkedal,H.,Madsen,D.,Mathiesen,R.H.,Knudsen,K.,Weber,H.-P.,Pattison,P.&Schwarzenbach,D.(2004),《结晶学报》A60,371-381.】)和康普顿剖面数据(Shukla等。, 2001【Shukla,A.、Isaacs,E.D.、Hamann,D.R.和Platzman,P.M.(2001),《物理评论B》,64,052101。】)可从文献中获得。因此,尿素是分子化合物上实验1-RDM的第一相空间衍生重建的合理候选物。此外,尿素分子比我们以前的测试系统大得多,可能是康普顿测量报告中最大的分子之一(Shukla等。, 2001【Shukla,A.、Isaacs,E.D.、Hamann,D.R.和Platzman,P.M.(2001),《物理评论B》,64,052101。】). 因此,它可以被视为寻求1-RDM重建的重要一步。本文是根据真实实验数据进行最终重建之前模型校准的最后阶段。

[图1]
图1
()单位电池尿素晶体([P\overline公司{4} 2100万]具有= 5.66,c(c)= 4.71Å). (b条)绿色虚线表示计算本文中显示的1-RDM值的路径。路径是通过O–C–N–H原子的一系列片段。

我们在这里使用与小型系统相同的模型评估策略,并在之前的论文中进行了描述(De Bruyne&Gillet,2020【De Bruyne,B.和Gillet,J.-M.(2020),《结晶学报》,A76,1-6。】; Launay&Gillet,2021年【Launay,Y.和Gillet,J.-M.(2021),《水晶学报》B77,683-694。】):参考1-RDM是从使用B3LYP泛函的周期密度泛函理论(DFT)计算中获得的(Becke,1993[Becke,A.D.(1993),《化学物理杂志》,第98卷,第5648-5652页。])和一个pob-DZVP基组(Peintinger等。, 2013[佩廷格,M.F.、奥利维拉,D.V.和布雷多,T.(2013),《计算化学杂志》34,451-459。])使用晶体14程序(Dovesi等。, 2014【Dovesi,R.、Orlando,R.,Erba,A.、Zicovich-Wilson,C.M.、Civalleri,B.、Casassa,S.、Maschio,L.、Ferrabone,M.、De La Pierre,M.,D'Arco,P.、NoöL,Y.、Causá,M..、Rérat,M.&Kirtman,B.(2014)。国际量子化学杂志114,1287-1317。】). 原子核的位置是沃瑟姆(1957)给出的[Worsham,J.E.、Levy,H.A.和Peterson,S.W.(1957),《结晶学报》,第10期,第319-323页。])并由中子衍射数据导出。然后基于该DFT衍生的1-RDM生成人工实验数据点。50K SF计算为[\sin\theta/\lambda=]1.1Å−1使用专用选项获得原子位移参数后晶体14(埃尔巴等。, 2013【Erba,A.,Ferrabone,M.,Orlando,R.&Dovesi,R.(2013),《计算化学杂志》34,346-354。】). 康普顿轮廓在如此低的温度下几乎不受热运动的影响,并且在其情况下没有进行特殊处理。这个晶体14SF和DCP值被视为理想平均值,高斯噪声分布集中于每个数据点。因此,在我们的测试重建中也考虑了噪声污染数据。重建的密度矩阵是通过确定一个质量低于人工数据生成质量的总体矩阵来获得的。因此,模型中引入了不可避免的偏差。因此,1-RDM模型的基础集被视为一个简单的6-31G基础集第页氢原子上的轨道。

3.1. 从理想数据重建

当在没有热运动和噪声的情况下获得数据时,期望得到最佳重建结果。无法避免使用人工数据来测试这种最佳情况。观察仅仅使用X射线衍射数据所产生的重建结果是很有说明性的。人工实验装置包括3627平方英尺[\sin\theta/\lambda]<1.1Å−1检查1-RDMΓ(第页第页′)在O–C–N–H路径上作为2D函数清楚地表明,仅SF导出的1-RDM缺少大多数非对角区域的重要特征(图2[链接]). 这与之前关于更小系统的工作得出的结论是一致的。在这种情况下,推断非对角线区域本质上很困难,因为SF仅与位置空间密度相关,因此与对角线分量相关ρ(第页) =Γ(第页第页). 只有模型上的约束才有可能改进非对角描述。这是评估1-RDM重建质量的一个重要标准,因为本质上,非对角线部分取决于键合机制以及不同位置的干扰如何形成波函数。

[图2]
图2
()沿O–C–N–H路径的参考1-RDM计算如下晶体14。包含和不包含DCP人工数据的重建1-RDM分别显示在的左上角和右下角(b条). 等高线绘制于[\pm 10^{-2}\乘以2^{n} e(电子)]Å−3[在[0.20]]中,其中正(负)轮廓以蓝色(红色)阴影的实线(虚线)显示。

第二步是将无噪康普顿数据包含在观测值中。在以下所有情况下,使用八个非等效结晶方向([100]、[110]、[111]、[210]、[211]、[310]、[311]、[321])。对于每个方向,每0.1取一个数据点原子单位。该值对应于通常的康普顿光谱仪分辨率,并防止了连续点之间的显著相关性。最大动量值设置为10原子单位。因此,数据集总共包含800个DCP值。很明显,没有噪音精炼案例并不能证明任何加权方案是合理的σ在目标函数中(10[链接])均取1。

如图2所示[链接](b条),重建的1-RDM现在显示出与参考值的微小偏差。非对角线区域仍存在轻微差异Γ(第页第页′ ≠第页). 当沿着两条不同的O–C–N–H路径可视化重建的1-RDM时,观察到差异。一旦施加对称限制,这种差异就会得到纠正。

维里比率−V(V)/2T型是为重建的1-RDM计算的,其中两个电子势能使用2-RDM表达式ansatz进行估计Γ(2)(第页1第页2第页1第页2) =Γ(1)(第页1第页1)Γ(1)(第页2第页2) −Γ(1)(第页1第页2)Γ(1)(第页2第页1). 使用和不使用DCP重建的维里比率分别为0.996和0.934,证实了康普顿数据在获得更具针对性的解决方案方面的作用。这两种重建之间的区别表明了动量空间测量的重要性,即使对于像尿素晶体这样的系统,其中DCP各向异性不超过总电子数的1%(见图5)。请注意,良好的细化后维里比仅仅是重建质量的结果,不需要任何广告 hoc(特别)模型或目标函数中的约束。

在以下段落中,将更详细地讨论重建误差的可能来源,并强调提高模型鲁棒性的技术。

3.2. 更贴近现实生活:噪音和温度影响

当使用真实的实验数据时,噪声污染是不可避免的。本节首先考虑统计噪声的影响,作为一种常见做法,假设模型中没有偏差。然后,介绍了核的热运动,并研究了它如何与统计噪声相结合,进一步恶化重建的1-RDM。

人工数据现在受到根据高斯定律产生的随机噪声的污染。例如,SF数据值变为F类′(q个) =F类(q个) +n个×ε(q个)带有[\epsilon\sim{\cal N}[0,|F({\bf q})|]]。通过设置,噪声级选择为1%n个= 0.01. DCP值也采用了类似的程序。注意,考虑到该系统中的弱康普顿各向异性,所选择的噪声级会从康普顿散射光谱中抹去大部分方向信息。我们发现,这种噪声模型导致目标函数中的权重高度不平衡。因此,(10)的未加权版本[链接])在实践中使用。

正如预期的那样,由噪声数据重建的1-RDM现在与参考值的偏差更大。如图3所示[链接](). 通过查看图4中显示的电子变形密度,可以强调RDM对角线部分的适度差异[链接](). 提醒一下,变形密度是总电子密度和独立原子密度之和之间的差值,前分子密度。后者来自晶体14软件使用与参考计算相同的基础集(pob-DZVP)。正如预期的那样,1-RDM的非对角线区域差异更大[图3[链接]()]. 模型受N个-在代表性条件下,显然很难从噪声下的弱康普顿各向异性中获得敏感信息。图5所示的各向异性振荡的明显失配证明了这一点[链接](填充红色三角形)。然而,可以看出,重建的DCP各向异性的偏差仍然适中,这可能是由于SF数据所携带的信息所致。在从数据中删除SF(填充蓝色三角形)后,观察到进一步恶化后,验证了该假设。

[图3]
图3
()参考(左上)和重建(右下)1-RDMΓ(第页第页')与0K 1%噪声数据。(b条)从50重建1-RDMK 1%噪声数据,有(左上)和无(右下)限制。(c(c))重建的估计标准偏差如所示(b条). 的轮廓()和(b条)与图2相同[链接]。对于(c(c))等高线绘制于[10^{-4}\乘以2^{n} e(电子)]Å−3[在[0,12]中].(缩写:N个0K w/o R.=噪声0无限制的K数据。)
[图4]
图4
()C–O–N基准面上的变形密度(左)和用0重建K 1%噪声数据(右)。(b条)从50重建变形密度有(左)和无(右)核电子和对称限制的K 1%噪声数据。等高线的绘制与图2中的等高线相同[链接].
[图5]
图5
参考(点)和重构(线)DCP各向异性在[110]方向无(圆)和(三角形)1%噪声。虚线表示不使用SF人工数据的重建。红色阴影区域表示重采样时重建的标准偏差。

对于所提出的模型,温度效应的反褶积是一个困难的挑战。与大多数常见的电子密度重建不同,例如使用广泛使用的kappa重定义伪原子多极模型(Hansen&Coppens,1978)【Hansen,N.K.和Coppens,P.(1978),《水晶学报》,A34,909-921。】; Gatti&Macchi,2012年【Gatti,C.&Macchi,P.(2012),编辑,《现代电荷密度分析》,多德雷赫特:施普林格荷兰出版社。】),我们的1-RDM确定方法依赖于线性表达式(2[链接])结合线性约束(第2.2节[链接]),使得使用积极的SDP方法成为可能。插入德拜-沃勒公式来解释热效应会破坏这种线性。虽然目前正在开发一种替代配方,但决定目前的工作是探索按顺序处理这两个问题的可能性。首先ab公司 初始1-RDM是用模型的基集来计算的。然后,由高阶SF确定原子位移参数([\sin\theta/\lambda]>0.7Å−1),如第2.3节所述[链接]然后,这些ADP值B类固定并并入模型中。因此,1-RDM的模型保持线性精炼步骤,因为仅仅是因子exp(−q个 · B类 · q个)添加到SF运算符。这类ADP的质量在很大程度上取决于模型基集,不能期望细化P(P)基体不受热运动污染。如图3下部面板所示[链接](b条)和图4[链接](b条),重建的1-RDM和变形密度继续恶化,这清楚地证明热运动效应尚未彻底反褶积。尽管康普顿数据被假定在如此低的温度下未受干扰,但非对角线区域继续恶化。这必须归因于动量空间中可靠信息的稀疏性,而SF无法对其进行补偿。图4所示氮中心附近的非物理电子耗尽清楚地表明了我们的独立原子德拜-沃勒描述的糟糕性能[链接](b条). 此外,精炼和参考(来自晶体14)氮原子核的ADP(大约25%的差异)。当涉及实际数据时,这个非常粗糙的方案需要在(13)中添加前面提到的双中心项[链接])以及更全面地将德拜-沃勒的贡献纳入总体精细化。该功能目前正在实施中。

3.3. 进一步限制:冻结核和对称

在上一节中,我们使用(2)讨论了噪声和热运动的组合如何影响1-RDM重建[链接]). 为了缓解这些问题,一种可能的方法是减少自由度从而使其对噪声污染更具鲁棒性。如第2.2节所述[链接],人们自然会首先提出对模型应用对称限制的必要性。由于消除了不必要的自由参数,重建质量得到了全面改善。

通过冻结核心电子对密度矩阵的贡献,可以进一步限制活性空间。这一常见程序不会影响我们吸收动量空间数据的能力,动量空间数据主要描述离域价电子。在SF方面,冻结1-RDM的核心组件有助于稳定精炼高阶反射受噪声和核运动影响最大,同时几乎保留了模型的所有灵活性。在本小节中,我们报告了这种方案在非理想重建场景下的影响。

当冻结核和对称限制添加到有关N个-可代表性,图3[链接](b条)(上面板)显示,重建的1-RDM中的失真大大降低。在这种情况下,即使存在噪音和热搅拌,模型也能捕捉到参考1-RDM中观察到的大多数特征[图3[链接]()]. 请注意,最显著的差异是在与氢和碳之间的长程相互作用相对应的非对角线区域,氢和碳是第二邻居。如此显著的改进证实了限制活动空间可以有效地提高重构的抗噪声鲁棒性。有无附加约束条件下重建的1-RDM的标准偏差[图3[链接](c(c))]根据高斯噪声分布的重采样进行估计。可以观察到,活动空间的限制明显减少了重建的不确定性。

有趣的是,1-RDM模型的这种改进只对核附近产生的变形密度带来了微小的变化。同样,DCP各向异性重建也没有观察到重大改进(参见支持信息)。当采用优化问题的观点时,这种看似矛盾的观察可以得到解决。

如前所述,1-RDM重建通过(10[链接])作为给定SF和DCP数据的最小二乘最小化问题。因此,引入诸如(12[链接])–(12d日[链接])只能得到一个新的最优解χ2值,更不适合SF和DCP。因此,DCP各向异性和变形密度不太可能得到改善,因为它们只取决于我们拟合康普顿数据和一组电子密度的傅里叶系数的能力。然而,1-RDM是6D空间中的一个函数,它包含的信息比数据值给出的有限数量的投影更多。在这种情况下,有充分理由相信,限制解空间的大小可以有效地正则化模型,使其具有更强的预测能力。

从实验SF估算总电子能量是一个众所周知的难题。添加康普顿散射信息不会显著促进任务。然而,仅在相对尺度上,可以使用能量准则来比较不同的精炼策略。在这项工作中,一个经常出现的问题是评估[\sin\theta/\lambda]对于SF。在一个没有热运动的完美世界中,只要高Miller指数反射高于统计噪声,它们就应该保持不变。图6中的实心曲线[链接]表明,对于理想的0K组SF,总电子能量稳定在0.7以上的任何截止值Å−1。当数据值受到温度搅拌的影响时,这不再正确。在50人中K情况(虚线曲线),SF对应于[\sin\theta/\lambda]> 0.7Å−1从电子能量的角度来看,这导致了重构的严重恶化。如图6所示[链接](所有虚线),只有反射低于0.7时才达到最小能量Å−1包含在集合中。然后,当一个人增加埃瓦尔德球体半径,总能量开始持续上升。这证实了受热运动影响最大的附加高阶反射没有被单中心Debye–Waller模型足够好地反褶积,只会导致扰动精炼过程。

[图6]
图6
从1%的噪声数据重建的一个尿素分子的平均场能量(见正文)。带有圆形和三角形数据点的虚线和实线表示重建为0K和50K SF数据和相同的康普顿数据。蓝线表示重建没有附加约束。浅蓝色和红色线条显示了使用对称性和核心电子约束时的结果。紫色虚线表示0的维里比率附加限制的K 1%噪声数据重建。

当仅应用对称强制时,可以在0以下观察到整体改进K和50K场景。更值得注意的是,引入额外的冻结核分量不仅进一步减少了高阶反射引起的扰动,而且在只有少量反射数据的情况下大大提高了重建能力。因此,这两种限制通过滤除热运动和噪声污染带来的大部分扰动以及减少不必要的自由参数数量,有效地提高了模型的稳定性。此外,简化模型中完全受限模型的行为q个最大值domain表示可以用有限数量的低角度SF数据重建1-RDM,这些数据描述了最扩散的电子。

我们坚持认为,这里计算的Hartree–Fock-like能量仅作为重建质量的指标有意义,因为它同时使用了位置和动量空间电子密度。然而,由于从1-RDM预测能量的固有困难,是否可以准确地从散射实验中确定总(或相互作用)能量的问题应该留给更仔细的检查和讨论。

4.结论与讨论

在这项工作中,改进的1-RDM重建方法已经在一个比先前研究的系统大得多的系统上进行了测试(De Bruyne&Gillet,2020【De Bruyne,B.和Gillet,J.-M.(2020),《结晶学报》,A76,1-6。】; Launay&Gillet,2021年【Launay,Y.和Gillet,J.-M.(2021),《水晶学报》B77,683-694。】). 证实了来自康普顿散射数据的动量空间信息所起的关键作用。它有助于提高重建质量,即使弱各向异性被统计噪声掩盖。模型中的两个主要附加项,对称性限制和冻结核贡献,可以显著稳定1-RDM重建过程,避免统计噪声和温度影响。同时,在没有附加约束的情况下,结果表明,从建模的1-RDM计算得出的能量非常符合维里定理。因此,发现近似的总能量和维里比是有价值的指标,可以确定埃瓦尔德球体,其平衡了相关信息和噪声污染。

然而,对温度引起的核运动进行适当的反褶积仍然是一个具有挑战性的问题。在当前的方法中,已经确定了两个主要障碍:第一,我们选择限制温度模型和基础集的灵活性,以避免评估中的偏差;其次,保持1-RDM模型线性的必要性。这两种情况都不可避免地导致原子位移参数存在很大差异,但允许对模型的稳定性进行可靠评估。此外,我们有充分的理由相信,在考虑实际实验数据时,使用非线性优化版本,包括两个中心温度系数和更好的基组,将大大提高性能。

当前的1-RDM重建方法本质上是一种统计推断过程。因此,其结果的质量不仅取决于数据分布,还取决于模型的先验分布。在现阶段,使用了统一的先验,这意味着不假设先验知识。未来,人们可以考虑一个更明智的先验,例如,以低水平理论计算为中心的高斯分布。使用额外的先验值将有助于模型的性能,尤其是在数据质量较差的情况下。

最后,我们的结果表明,即使在动量空间信息非常有限的情况下,通过X射线SF和DCP测量,对于中等大小的系统,也可以实现1-RDM重建。在下一步中,这种方法可以很容易地应用于实际的实验数据。

支持信息


致谢

作者感谢Devinder Sivia、Pietro Cortona和Julie McDonald的深刻评论和讨论。其中一些计算是在巴黎萨克利大学的集群上进行的,对此我们深表感谢。

资金筹措信息

SY感谢中国奖学金委员会(奖学金编号:202106020087)的资助。

工具书类

第一次引用Becke,A.D.(1993)。化学杂志。物理学。 98, 5648–5652. 交叉参考 中国科学院 科学网 谷歌学者
第一次引用Birkedal,H.、Madsen,D.、Mathiesen,R.H.、Knudsen,K.、Weber,H.P.、Pattison,P.和Schwarzenbach,D.(2004)。《水晶学报》。A类60, 371–381. 科学网 CSD公司 交叉参考 中国科学院 IUCr日志 谷歌学者
第一次引用Boyd,S.P.和Vandenberghe,L.(2004)。凸优化。剑桥大学出版社。 谷歌学者
第一次引用Cassidy,C.、Halbout,J.、Donaldson,W.和Tang,C.(1979年)。选择。公社。 29, 243–246. 交叉参考 中国科学院 科学网 谷歌学者
第一次引用Chakraborty,R.&Mazziotti,D.A.(2015年)。国际量子化学杂志。 115, 1305–1310. 科学网 交叉参考 中国科学院 谷歌学者
第一次引用克林顿,W.L.,加利,A.J.,亨德森,G.A.,拉默斯,G.B.,马萨,L.J.&Zarur,J.(1969年).物理学。版次。 177, 27–33. 交叉参考 中国科学院 科学网 谷歌学者
第一次引用克林顿·W·L、加利·A·J和马萨·L·J(1969)b条).物理学。版次。 177, 7–13. 交叉参考 中国科学院 科学网 谷歌学者
第一次引用克林顿·W·L、亨德森·G·A和普雷斯蒂亚·J·V(1969)c(c)).物理学。版次。 177, 13–18. 交叉参考 中国科学院 科学网 谷歌学者
第一次引用克林顿,W.L.和拉默斯,G.B.(1969年)。物理学。版次。 177, 19–27. 交叉参考 中国科学院 科学网 谷歌学者
第一次引用Clinton,W.L.、Nakhleh,J.和Wunderlich,F.(1969年d日).物理学。版次。 177, 1–6. 交叉参考 中国科学院 科学网 谷歌学者
第一次引用Coulson,C.A.(1960年)。修订版Mod。物理学。 32, 170–177. 交叉参考 中国科学院 科学网 谷歌学者
第一次引用De Bruyne,B.和Gillet,J.-M.(2020年)。《水晶学报》。A类76, 1–6. 科学网 交叉参考 IUCr日志 谷歌学者
第一次引用Diamond,S.&Boyd,S.(2016)。J.马赫。学习。物件。 17, 1–5. 谷歌学者
第一次引用Dovesi,R.、Orlando,R.,Erba,A.、Zicovich–Wilson,C.M.、Civalleri,B.、Casassa,S.、Maschio,L.、Ferrabone,M.、De La Pierre,M.,D'Arco,P.、NoöL,Y.、Causá,M..、Rérat,M.&Kirtman,B.(2014)。国际量子化学杂志。 114, 1287–1317. 科学网 交叉参考 中国科学院 谷歌学者
第一次引用Dugdale,S.&Jarlborg,T.(1998年)。固态通讯。 105, 283–287. 科学网 交叉参考 中国科学院 谷歌学者
第一次引用Erba,A.、Ferrabone,M.、Orlando,R.和Dovesi,R.(2013)。J.计算。化学。 34, 346–354. 科学网 交叉参考 中国科学院 公共医学 谷歌学者
第一次引用Foley,J.J.和Mazziotti,D.A.(2012年)。物理学。版次A86, 012512. 科学网 交叉参考 谷歌学者
第一次引用Gatti,C.&Macchi,P.(2012年)。编辑。现代电荷密度分析。多德雷赫特:施普林格荷兰。 谷歌学者
第一次引用Gueddida,S.、Yan,Z.和Gillet,J.-M.(2018年).《水晶学报》。A类74, 131–142. 科学网 交叉参考 IUCr日志 谷歌学者
第一次引用Gueddida,S.、Yan,Z.、Kibalin,I.、Voufack,A.B.、Claiser,N.、Souhassou,M.、Lecomte,C.、Gillon,B.和Gillet,J.-M.(2018年b条).化学杂志。物理学。 148, 164106. 科学网 交叉参考 公共医学 谷歌学者
第一次引用Hansen,N.K.和Coppens,P.(1978)。《水晶学报》。A类34, 909–921. 交叉参考 中国科学院 IUCr日志 科学网 谷歌学者
第一次引用Hupf,E.,Kleemis,F.,Borrmann,T.,Pal,R.,Krzeszczakowska,J.M.,Woin-ska,M.,Jayatilaka,D.,Genoni,A.&Grabowsky,S.(2023年)。化学杂志。物理学。 158, 124103. 科学网 CSD公司 交叉参考 公共医学 谷歌学者
第一次引用Launay,Y.和Gillet,J.-M.(2021年)。《水晶学报》。B类77, 683–694. 科学网 交叉参考 IUCr日志 谷歌学者
第一次引用Liu,Y.K.,Christandl,M.和Verstraete,F.(2007)。物理学。修订稿。 98, 110503. 科学网 交叉参考 公共医学 谷歌学者
第一次引用Löwdin,P.-O.(1955年)。物理学。版次。 97,1474年至1489年谷歌学者
第一次引用Matsuda,K.、Kimura,K.,Hagiya,T.、Kajihara,Y.、Inui,M.、Hiraoka,N.、Tamura,K和Sakurai,Y.(2020年)。物理学。状态Solidi B257, 2000187. 科学网 交叉参考 谷歌学者
第一次引用Mazziotti,D.A.(2007年)。降低密度矩阵力学:在许多电子原子和分子中的应用,第134卷。威利在线图书馆。 谷歌学者
第一次引用Peintinger,M.F.、Oliveira,D.V.和Bredow,T.(2013)。J.计算。化学。 34, 451–459. 科学网 交叉参考 中国科学院 公共医学 谷歌学者
第一次引用Phillips,W.C.和Weiss,R.J.(1968年)。物理学。版次。 171, 790–800. 交叉参考 中国科学院 科学网 谷歌学者
第一次引用Schmider,H.(1996)。化学杂志。物理学。 105, 3627–3635. 交叉参考 中国科学院 科学网 谷歌学者
第一次引用Schmider,H.&Smith,V.H.Jr(1993)。Z.Naturforsch公司。A类48, 221–226.  交叉参考 中国科学院 科学网 谷歌学者
第一次引用Schmider,H.、Smith,V.H.Jr和Weyrich,W.(1992年)。化学杂志。物理学。 96, 8986–8994. 交叉参考 中国科学院 科学网 谷歌学者
第一次引用Schmider,H.、Smith,V.H.Jr和Weyrich,W.(1993)。Z.Naturforsch公司。A类48, 211–220.  交叉参考 中国科学院 谷歌学者
第一次引用Schwarz,W.H.E.、Langenbach,A.和Birlenbach,L.(1994)。西奥。蜂鸣器。学报88, 437–445. 交叉参考 中国科学院 科学网 谷歌学者
第一次引用Shukla,A.、Isaacs,E.D.、Hamann,D.R.和Platzman,P.M.(2001)。物理学。版本B64, 052101. 科学网 交叉参考 谷歌学者
第一次引用Sternemann,C.、Döring,G.、Wittkop,C.、Schülke,W.、Shukla,A.、Buslaps,T.和Suortti,P.(2000)。《物理学杂志》。化学。固体61, 379–382. 科学网 交叉参考 中国科学院 谷歌学者
第一次引用Stevens,E.D.、Rys,J.和Coppens,P.(1977年)。《水晶学报》。A类33, 333–338. 交叉参考 中国科学院 IUCr日志 科学网 谷歌学者
第一次引用West,A.C.、Schmidt,M.W.、Gordon,M.S.和Ruedenberg,K.(2015)。《物理学杂志》。化学。A类119, 10368–10375. 科学网 交叉参考 中国科学院 公共医学 谷歌学者
第一次引用Weyrich,W.(1996)。单电子密度矩阵及相关观测值第245-272页。柏林:斯普林格。 谷歌学者
第一次引用Wolfram研究(2023)。数学软件第13.3版。美国伊利诺伊州香槟市谷歌学者
第一次引用Worsham,J.E.、Levy,H.A.和Peterson,S.W.(1957年)。《水晶学报》。 10,319–323。 CSD公司 交叉参考 IUCr日志 科学网 谷歌学者
第一次引用Zavodnik,V.、Stash,A.、Tsirelson,V.和de Vries,R.&Feil,D.(1999)。《水晶学报》。B类55,45–54科学网 CSD公司 交叉参考 中国科学院 IUCr日志 谷歌学者

这是一篇开放获取的文章,根据知识共享署名(CC-BY)许可证它允许在任何介质中不受限制地使用、分发和复制,前提是引用了原始作者和来源。

期刊徽标基础
进展
国际标准编号:2053-2733