摘要

随着弱透镜测量的深入,它们揭示了收敛场的更多非高斯方面,而这些方面只能使用功率谱以外的统计信息来提取。在一篇配套论文中,我们表明散射变换是一种借用卷积神经网络数学概念的新统计,是非高斯状态下宇宙学参数估计的有力工具。在这里,我们通过弱透镜测量扩展了该分析,以探索其对暗能量和中微子质量参数的敏感性。我们首先使用图像合成直观地表明,与功率谱和双谱相比,散射变换提供了更好的统计词汇来表征透镜质量图的感知特性。然后,我们表明,它也更适合于参数推断:(i)它在无噪声情况下提供了更高的灵敏度,以及(ii)在鲁宾类测量的噪声水平下,尽管约束条件没有比双谱严格得多,但散射系数具有更高斯的采样分布,这是似然参数化和精确宇宙学推断的一个重要性质。我们认为,考虑到约束能力和似然特性,散射系数是首选统计量。

1简介

我们宇宙中物质密度分布的统计特性携带着有关其成分和进化历史的信息。在晚期宇宙中,通过弱引力透镜畸变或宇宙切变探测(参见Bartelmann和Schneider2001; 基尔宾格2015,供审查),结构的非线性增长在小尺度上印记了非高斯性。因此,宇宙学信息开始避开高斯统计,如功率谱和相关函数(Rimes&Hamilton2005,2006; Neyrinck、Szapudi和Rimes2006; Neyrinck&Szapudi公司2007). 为了提取更多信息,一些非高斯统计,如双谱(Fu et al。2014),峰值计数(Liu等人。2015年a,b条; Kacprzak等人。2016; Martinet等人。2018; Shan等人。2018)和Minkowski泛函(Petri等人。2015)已应用于现有的弱透镜数据。更深入的持续调查和未来调查,如Hyper Suprime Cam调查(Aihara等人。2018年a,b条)鲁宾天文台调查(前LSST,LSST科学合作2009),欧几里得(Laureijs等人。2011)和罗马太空望远镜勘测(之前为WFIRST、Spergel等人。2015)可以使用更小的比例,因此使用适当的统计数据来捕获透镜映射中的非高斯信息变得越来越重要(参见,例如Martinet et al。2021以及其中的参考)。

In Cheng等人。(2020),我们建议使用一种宇宙学中新颖的非高斯统计工具:散射变换。1我们通过将其应用于模拟的弱透镜映射来约束Ω和σ8宇宙学参数。在这篇配套论文中,我们将我们的分析扩展到其他宇宙学依赖关系:暗能量状态方程w个0,w个和中微子质量总和M(M)ν。约束这些参数是即将到来的弱透镜调查的关键目标之一,它们通常用于比较不同的调查策略。

散射变换,由(Mallat)引入2012)在信号处理文献中,使用卷积神经网络(CNN)中的概念,但它不需要训练:与传统的统计估值器类似,它生成一组摘要统计信息,有效地刻画了各种尺度下的复杂非高斯性。为了可视化散射系数的威力,我们将首先说明,可以使用它们生成纹理与真实透镜贴图非常相似的随机图像,达到传统基于矩的统计(如功率谱和双谱)无法达到的水平。然后,我们将通过使用模拟透镜映射进行预测,给出散射系数对暗能量参数和中微子质量的约束能力。

2散射变换

散射变换(Mallat2012; 布鲁纳和马拉特2013)最初是在计算机视觉信号处理的背景下开发的(参见,例如Sifre和Mallat2013; Andén&Mallat公司2014; 布鲁纳、马拉特和巴克利2015). 在天体物理学中,它被用于宇宙学中的参数推断(Cheng等人。2020)和星际介质分析(Allys等人。2019; Regaldo-Saint Blancard等人。2020; Saydjari等人。2020).

散射变换与CNN和N个-以理想的方式实现点相关函数:它在从复杂的非高斯场中提取信息方面功能强大,但它具有确定性、可解释性,并且不需要任何训练。由于它与小波的关系,它将信息压缩成一组相对较小的系数,并且它是一个“一阶”统计,即它不使用输入场的更高幂,这使得散射系数具有稳健的统计特性。

一方面,散射变换可以理解为具有预定的、不可训练的核的CNN。它继承了CNN提取空间模式的方法,包括局部卷积、非放大非线性操作和多层,但它放弃了使CNN不太可控或可解释的学习能力。

另一方面,如Cheng等人。(2020),散射变换也类似于N个-点函数在宽的、对数空间的箱中求平均值,但存在基本差异。散射变换不使用场强乘法,而是使用“低阶”非线性操作将场起伏转换为强度。因此,散射变换不会放大潜在分布函数的尾部,从而缓解相应的信息丢失问题(Carron2011,2012; Carron&Neyrinck公司2012)高阶统计量。我们将在即将发表的论文中对高阶矩和散射统计进行更深入的比较(Cheng&Ménard,in prep)。

2.1配方

在Mallat中引入了散射变换的数学(2012)和Bruna&Mallat(2013). 在这里,我们按照我们第一篇论文中的注释(Cheng et al。2020). 简而言之,散射变换通过应用以下操作从场中提取信息:

  • 小波卷积+模

  • 层次结构

  • 空间平均值

它可以以递归的方式形式化,如图所示1:
$$\开始{eqnarray*}I_0\,\,&\等式\文本{输入字段}\结束{eqnarray*}$$
(1)
$$\开始{eqnarray*}I_n^{j,l}&\equiv\left|I_{n-1}\star\psi^{j、l}\right|\,\text{(散射操作)}\结束{eqnarray*}$$
(2)
$$\开始{eqnarray*}S_n&\equiv\langle I_n\rangle\,\结束{eqnarray*}$$
(3)
其中ψj、 我表示按尺度索引的小波j个和方向.
散射变换的结构。通过迭代散射操作,从输入场生成一棵中间场树,然后将这些场的空间平均值作为平移-变散射系数。散射运算由小波卷积和像素线性模组成。
图1。

散射变换的结构。通过迭代散射操作,从输入场生成一棵中间场树,然后将这些场的空间平均值作为平移-变散射系数。散射运算由小波卷积和像素线性模组成。

散射操作由小波卷积和逐像素模数组成。卷积ψ的函数j、 我将波动分为不同的尺度;模量的函数是将选定的涨落转换为其局部强度。随后,散射运算的成功应用形成树状结构,即具有各种散射场的平面多层网络n个在其节点处。每个n个是上一阶场中特定尺度波动的强度图n个− 1它也可以理解为输入图像中特定图案的非线性强度图0.

最后,平移-变散射系数S公司定义为每个散射图像的空间平均值,类似于CNN中的池操作。这样,可以将0、1和2阶散射系数明确写成:
$$\开始{eqnarray*}S_0&\equiv\langle I_0范围\结束{eqnarray*}$$
(4)
$$\开始{eqnarray*}S_1^{j_1,l_1}&\equiv\left\langle I_1^{j_1,l_1}~~~~~~\right\langle=\left\langle\left|I_0\star \psi^{j_1,l_1}\right|\right\langle\结束{eqnarray*}$$
(5)
$$\开始{eqnarray*}S_2^{j_1,l_1,j_2,l_2}&\equiv\left\langle I_2^{j_1,l_1,j_2,l_2}\right\rangle=\left\slangle\left||I_0\star\psi^{j.1,l_1}|\star\psi ^{j_2,l _2}\reight|\right\ rangle\。\结束{eqnarray*}$$
(6)

分离尺度并测量波动强度的散射操作在性质上类似于功率谱分析。实际上,如果我们替换方程中的模量(2)通过模量平方,散射系数S公司n个将精确地变为平均值2n个-由一系列小波加权的点函数。然而,模数而不是模数平方使得从场概率分布函数(PDF)的尾部提取信息更加有效。

散射系数的数量S公司n个由使用的不同小波数决定。使用J型天平和方向,2阶系数的总数为1+JL公司+J型(J型− 1)2/2.如果定向没有提供很多相关信息,可以对定向指数求平均值:
$$\开始{eqnarray*}s_n&\equiv\langle s_n\rangle_{l_1,…,l_n},\结束{eqnarray*}$$
(7)
从而将系数的数量减少到1+J型+J型(J型−1)/2,直到第二个订单。例如,当使用二进小波时,512×512像素的图像具有8个小波尺度(J型=8),仅对应37个简化散射系数。

为了更直观地理解散射变换和系数,我们请读者参阅Cheng等人。(2020); 关于更多数学性质,我们请读者参考Mallat(2012)和Bruna等人。(2015).

2.2基于散射系数的图像生成

为了比较不同统计数据在描述随机场方面的性能,可以通过它们的图像合成功能进行比较。在这里,我们将关注三个统计数据:功率谱、双谱和弱透镜会聚图中的散射系数。合成的思想是随机生成与目标图像具有相同摘要统计信息的新图像(或者,换句话说,从图像集合中采样),然后目视检查纹理生成图像的2019; Allys等人。2020).

为了实现它,我们从一个随机图像开始并对其进行修改,以最小化生成的图像和目标图像之间的摘要统计信息差异。技术上,我们从与目标图像具有相同功率谱的高斯随机场开始,然后在蟒蛇包裹torch.optim公司以最小化根据生成的图像和目标图像之间的汇总统计差异定义的损失函数。在散射系数和双谱情况下,我们还最小化了它们之间的差异1范数,并为所有像素设置下限。我们的图像生成代码可以在线获得。2

在图中2,我们使用功率谱显示生成的图像,双谱B类,以及散射系数S公司对于每组统计数据,显示了四种实现方式来说明采样方差。与功率谱和双谱相比,散射系数的结果看起来更像真实的透镜会聚图(目标图像),特别是在所有尺度上由光晕创建的纹理中。

使用选定的汇总统计数据集生成的图像,包括功率谱、双谱和散射系数(S1、S2),表明散射系数更好地描述了场。由于图像生成是随机的,因此应该在输入和生成的贴图之间比较纹理,而不是特征的确切位置。
图2。

使用选定的汇总统计数据集生成的图像,包括功率谱、双谱和散射系数(S公司1,S公司2),表明散射系数更好地表征了场。由于图像生成是随机的,因此应该在输入和生成的贴图之间比较纹理,而不是特征的确切位置。

关于图像合成,有几个注意事项需要记住。例如,图像质量在某种程度上取决于初始条件和损失函数的选择。更重要的是,信息的概念必须始终与特定任务相关。在图像合成的情况下,这项任务是“根据人眼和大脑的度量来区分场”,这可能不同于宇宙学参数推断任务中的Fisher信息。然而,目标和使用散射系数生成的图像之间惊人的视觉相似性证明了它们具有表征透镜贴图纹理的能力。

3宇宙学预测

为了探索散射系数对宇宙学参数的约束能力,我们计算了Fisher预测(Fisher1935; Vogeley&Szalay公司1996; Tegmark,Taylor&Heavens律师事务所1997)以及宇宙学参数的贝叶斯后验。

3.1模拟透镜映射

为了探索暗能量和中微子质量对透镜散射系数的影响,我们使用了哥伦比亚透镜团队慷慨提供的两组模拟收敛图。这两个数据集都是为探测弱透镜宇宙学中的非高斯信息而设计的。会聚图是通过光线追踪生成的N个-使用透镜工具蟒蛇包(Petri2016). 所有的宇宙在空间上都是平坦的。第一个数据集,在Petri中描述(2016),Zorrilla Matilla等人。(2016),和Liu等人。(2016),改变暗能量属性和物质密度(w个0,w个、和Ω). 收敛被追踪到一个源红移(z(z) = 2). 第二个数据集,MassiveNuS公司(Liu等人。2018),改变中微子质量、物质密度和原始涨落幅度(M(M)ν, Ω、和A类,相当于M(M)ν, Ω和σ8),并且收敛被追踪到五个源红移(z(z)=0.5、1、1.5、2和2.5)。这两个数据集都包含多个宇宙学中收敛映射的多重实现,具有3.5×3.5度2视野(非线性引力演化变得重要)和512×512像素分辨率。因此,这些图涵盖了多极矩从100到大约30000。下面我们将更详细地描述这些数据集。

3.1.1暗能量模拟

此数据集包含7个仿真w个0w个具有不同暗能量特性的CDM宇宙学,包括当前的暗能量密度|$\欧米茄_\兰姆达$|和状态指数的暗能量方程w个(),由参数化w个0w个通过w个() =w个0+ (1 −)w个(谢瓦利埃和波拉斯基2001). 每个模拟都是在240Mpc中运行的/小时带有512的框粒子,用于生成1024个3.5×3.5 deg的模拟收敛映射2视野。透镜光源设置为红移z(z) = 2. 我们减少了2048年的原始样本2像素映射到5122通过平均相邻像素,分辨率为每像素0.41弧分。除了暗能量特性外,其他宇宙学参数是固定的:重子密度Ωb条=0.046,哈勃常数小时=0.72,标量光谱指数n个=0.96,波动幅度标准化σ8=0.8,相对论自由度的有效数n个效率=3.04,中微子总质量M(M)ν=0.0,宇宙微波背景温度T型招商银行=2.725 K。暗物质密度的设定使宇宙在空间上是平坦的,即Ω = |$1-\Omega_\Lambda$|美元.管道N个-在Petri中描述了人体模拟和光线跟踪(2016),Zorrilla Matilla等人。(2016),和Liu等人。(2016). 哥伦比亚透镜团队的网站上也列出了模拟的规格。

3.1.2中微子质量模拟(MassiveNuS公司)

由Liu等人生成。(2018),该数据集包含从101∧νCDM模拟中创建的几个源红移的收敛图M(M)ν, Ω、和A类(相当于M(M)ν, Ω和σ8). 其他宇宙学参数是固定的:Ωb条 = 0.046,小时 = 0.70,n个=0.97,以及w个 = –1. 每个模拟都是在512 Mpc中运行的/小时1024个框粒子,用于生成3.5×3.5度的10000个收敛映射2视野和5122-像素分辨率。基准宇宙学有参数(M(M)ν, Ω,A类)=(0.1 eV,0.3,2.1×10−9). 无质量中微子宇宙学(M(M)ν, Ω,A类)=(0电子伏,0.3,2.1×10−9)用于计算汇总统计的协方差矩阵。在本研究中,我们将使用5个源红移的收敛图(z(z)=0.5、1.0、1.5、2.0和2.5),在28个接近基准宇宙学的宇宙学中,即在A类∈ [1.8, 2.7] × 10−9,M(M)ν∈[0.06,0.60]eV和Ω∈ [0.28, 0.32]. 在鲁宾天文台式的观测中,这一参数范围足以估算散射系数对宇宙学参数的约束能力。

在实际的透镜测量中,星系形状的噪声将在小尺度上稀释宇宙学信息,起到尺度切割的作用。为了简单起见,我们在收敛映射上用高斯白噪声近似这种噪声(van Waerbeke2000),|$\sigma_\text{noise}^2=\langle\sigma_\epsilon^2\rangle/n_text{gal}A_\text}pix$|,其中A类像素是像素区域。我们采用平均椭圆度平方|$\langle\sigma_\epsilon^2\rangle=0.3^2$|和背景星系的密度n个女孩每弧最小442模拟鲁宾天文台(LSST科学合作组织)的弱透镜测量2009). 的多个源红移MassiveNuS公司会聚图还允许我们探索从红移层析成像中获得的信息。我们考虑两种情况:(1)只有源红移的收敛映射z(z)=1,与n个女孩=44每弧分2; (2) 使用了五个源红移的收敛映射n个女孩=8.83、13.25、11.15、7.36和4.26每弧分2分别是。源密度由鲁宾天文台调查的预期源红移分布得出:n个(z(z)) ∝ z(z)2经验(-2z(z))标准化为每弧502(LSST科学合作2009). 我们通过将z=0.25到2.75的分布与Δ的步长积分来计算每个基准红移箱中的星系数密度z(z)=0.5作为箱子宽度。对于有噪映射,我们还使用高斯核σ=1 arcmin进行平滑。最后,剪切-收敛转换中遮罩和缺陷的影响(例如Kaiser和Squires1993; Jeffrey等人。2020; Pires等人。2020)这是弱透镜宇宙学的重要实际问题,在本分析中没有考虑。我们的主要目标只是比较不同估值器的统计特性。

3.2汇总统计

我们从模拟的透镜会聚图中计算出三组汇总统计数据:

  • 30箱功率谱P()我们用线性刻度箱进行采样,

  • 125装箱双谱B(12)每个样品在10个线性箱中取样1,2、和在双谱单极子B中(1,2,)、和

  • 36降低散射系数|$s_1^{j}$||$s_2^{j_1,j_2}$|.

对于散射系数,我们使用与Cheng等人所述相同的Morlet小波。(2020),具有4个方位角(=4)和8个并矢标度(J型 = 8). 刻度对应于8个对数箱=100至37000,如图所示.以下方程式(7),我们平均方位角方向,并使用36个简化散射系数12。在嘈杂的地图上-j个(小规模,高-)散射系数主要由噪声决定,我们验证了放弃较小的-j个系数不会改变宇宙学推断的精度。因此,噪声地图上的信息散射系数集比无噪声地图上更为紧凑,这对于推理分析是很理想的。由于这些散射系数是非负的,所以我们考虑它们的对数。这一步有助于对PDF进行高斯化,这是似然推理所需的属性。我们还检查了这种变换对宇宙学参数推断的影响可以忽略不计。在本文的其余部分,我们将始终考虑系数的对数,但为了简洁起见,我们将其简单地称为散射系数。我们指出,对数变换不能应用于双谱系数,双谱系数可以是正值也可以是负值。

散射变换使用的小波的尺度覆盖。我们还显示了1 arcmin Gaussian滤波器在频率空间中的轮廓,以进行比较。
图3。

散射变换使用的小波的尺度覆盖。我们还显示了1 arcmin Gaussian滤波器在频率空间中的轮廓,以进行比较。

总之,每3.5×3.5度2通过透镜映射,我们计算了36个散射系数、30个binned功率谱系数和125个binned-bispectrum系数,用于宇宙学参数推断。我们开发了一个蟒蛇3在速度上进行优化以计算平移不变散射系数的程序包。该软件包以及计算双谱的代码都可以在线获得。4我们使用透镜工具蟒蛇包装(培养基2016).

3.3可能性和参数推断

参数推断需要似然函数|$p(\boldsymbol{x}|\boldsymbol{theta})$|。我们首先假设其函数形式为高斯,即汇总统计的PDF|$\粗体符号{x}$|是给定宇宙学的多元高斯分布|$\boldsymbol{\theta}$|我们还假设高斯PDF平均向量的宇宙学相关性可以用感兴趣范围内的光滑函数近似。对于暗能量数据集,我们使用线性相关性,因为只有7个宇宙学。对于MassiveNuS公司数据集,我们使用二阶多项式。我们将协方差矩阵设置为独立于宇宙学。后一种假设是保守的,但在可能性不完全为高斯时是稳健的(Carron2013). 利用模拟的收敛映射估计了平均向量和协方差矩阵的宇宙学相关性。

考虑到这种可能性,我们使用Fisher矩阵和贝叶斯后验来量化透镜散射系数对宇宙学参数的约束能力。推理框架的数学公式见附录B类费舍尔矩阵允许我们仅使用似然性的局部宇宙学依赖性来预测约束功率。对于无噪声情况,我们在本文中考虑,它提供了与后验结果几乎相同的结果。然而,随着噪声级的增加,差异可能变得不可忽略。因此,我们将使用贝叶斯后验来处理含噪数据的结果。

4结果

4.1汇总统计的抽样分布

在探索宇宙参数的约束力量之前,我们首先提出了使用散射系数的一个关键优势,即其PDF或采样分布是很好的高斯化。

对于许多宇宙学研究,典型的推理框架假设统计估计值为高斯PDF。这就是所谓的高斯似然假设,虽然严格来说,似然是|$p(\boldsymbol{x}|\boldsymbol{theta})$|使用数据|$\粗体符号{x}$|固定,而在实践中,通常会对PDF进行参数化和拟合(与模型参数的表达式相同|$\粗体符号{\ theta}$|固定)到模拟。所以我们称之为高斯PDF假设。当视野趋于无穷大时,这个假设来自中心极限定理。然而,对于有限视野,无法保证高斯PDF(例如Sellentin&Heavens2018; Hahn等人。2019; 迪亚兹·里韦罗和德沃金2020; 杰弗里、阿尔辛和拉努斯2021),并且用高斯PDF近似非高斯PDF可能会给参数推断带来偏差和/或低估不确定性。因此,快速高斯化的汇总统计数据受到青睐。请注意,字段的非高斯性与汇总统计的非高斯度不同。由于中心极限定理,高度非高斯场的一些统计可以近似高斯分布。另一方面,高斯随机场的统计数据可以具有非高斯采样分布。例如,每个傅里叶模式的功率预计会有一个χ2分配。

偏离高斯PDF近似对推断有害,其中最有问题的是存在重尾。为了量化这种影响,我们将考虑一维边缘分布的偏度和峰度参数。更准确地说:我们使用基准宇宙学计算无噪和有噪地图的这些参数MassiveNuS公司源红移模拟z(z) = 1. 偏斜度定义为|$\langle(压裂{x-\mu_{x}}{\sigma_{x{}})^3\rangle$|对于每个汇总统计x个,其中μ和σ是从10000次变现中计算出的样本平均值和标准偏差。它测量单变量PDF的不对称性和尾重,这是高斯分布的一个可能偏差。散射系数5具有比双谱系数低得多的偏度。我们在图中显示了其偏度参数的直方图4类似地,我们测量定义为|$\langle(\frac{x-\mu_{x}}{\sigma_{x{}})^4\rangle-3$|,对尾部重量更敏感。对于一维高斯分布,给定样本大小,偏度和峰度应分别为0±0.03和0±0.05。散射系数的测量值确实比从双谱获得的值更接近这些期望值,在某些情况下,双谱超过上限两个数量级以上。还检查了全局白化的效果(使用主成分分析消除维度之间的相关性)。在所有这些度量下,散射系数显示出较低的非高斯性。相反,双谱数据向量的许多维度是不对称的或重尾的,即使在场本身更为高斯的噪声地图上也是如此。这如表所示1其中,我们给出了每个估计量超过给定偏度或峰度阈值的系数数。使用95%(另一种测量尾部重量的方法)进行的测试显示了类似的结果。可以从多个角度评估高维空间中参数的非高斯性。例如,Sellentin&Heavens(2018)建议使用所有对的2D边缘PDF。这些测试在未来旨在推断宇宙学参数的研究中将很有价值。

(对数)散射和(装箱)双谱系数的偏态分布,从MassiveNuS模拟集基准宇宙学的10000个收敛图实现中测量。如果这些统计系数的PDF为高斯,则偏度应为零。
图4。

(对数)散射和(装箱)双谱系数的偏态分布,从MassiveNuS模拟集基准宇宙学的10000个收敛图实现中测量。如果这些统计系数的PDF是高斯的,那么偏度应该是零。

表1。

摘要统计的高维PDF中显著非高斯的方向数。括号外和括号内的值分别用于无噪贴图和有噪贴图。行是识别非高斯性的不同标准,系统地表明散射系数具有近似高斯PDF,而双谱系数没有。

摘要统计信息对数散射系数装箱双谱
系数的数量36125
|倾斜度|>0.50 (0)87 (49)
|倾斜度|>10 (0)45 (22)
峰度>0.51 (1)120 (78)
峰度>10 (0)111 (49)
变白,|偏斜度|>0.50 (0)18 (4)
变白,|偏斜度|>10 (0)9 (2)
变白,峰度>0.50 (0)124 (25)
变白,峰度>10 (0)119 (11)
摘要统计信息对数散射系数装箱双谱
系数的数量36125
|倾斜度|>0.50 (0)87 (49)
|倾斜度|>10 (0)45 (22)
峰度>0.51 (1)120 (78)
峰度>10 (0)111 (49)
变白,|偏斜度|>0.50 (0)18 (4)
变白,|偏斜度|>10 (0)9 (2)
变白,峰度>0.50 (0)124 (25)
变白,峰度>10 (0)119 (11)
表1。

摘要统计的高维PDF中显著非高斯的方向数。括号外和括号内的值分别用于无噪贴图和有噪贴图。行是识别非高斯性的不同标准,系统地表明散射系数具有近似高斯PDF,而双谱系数没有。

摘要统计信息对数散射系数装箱双谱
系数的数量36125
|倾斜度|>0.50 (0)87 (49)
|倾斜度|>10 (0)45 (22)
峰度>0.51 (1)120 (78)
峰度>10 (0)111 (49)
变白,|偏斜度|>0.50 (0)18 (4)
变白,|偏斜度|>10 (0)9 (2)
变白,峰度>0.50 (0)124 (25)
变白,峰度>10 (0)119 (11)
摘要统计信息对数散射系数装箱双谱
系数的数量36125
|倾斜度|>0.50 (0)87 (49)
|倾斜度|>10 (0)45 (22)
峰度>0.51 (1)120 (78)
峰度>10 (0)111 (49)
变白,|偏斜度|>0.50 (0)18 (4)
变白,|偏斜度|>10 (0)9 (2)
变白,峰度>0.50 (0)124 (25)
变白,峰度>10 (0)119 (11)

散射系数和双谱系数分布类型的差异可以从各自的设计中理解。双谱系数是三个随机变量的乘积。一般来说,乘法产生的分布尾部比原始变量重。相反,散射变换使用“一阶”模量,该模量不会放大尾部。因此,随着视场的增加,中心极限定理高斯化散射系数的速度比双谱系数快得多。此外,通过小波对尺度进行对数装箱,结合了更多的傅里叶模式,这也有助于高斯化过程。

总之,我们发现散射系数的高斯化特别好,这对于精确的宇宙学推断是可取的和必要的。

4.2约束宇宙学参数

在检查了散射系数的高斯PDF假设后,现在我们比较了不同汇总统计获得的宇宙学约束。这些约束是根据具有不同宇宙学参数的模拟收敛图以及1000(对于暗能量模拟集)或10000(对于中微子质量模拟集)获得的MassiveNuS公司)每个宇宙学的实现。

由于收敛映射具有长尾PDF(近似对数正态),我们确实希望散射系数比双谱提取更多信息。事实上,我们发现使用无噪贴图上的散射系数(当所有都很高时-包括模式)。在图中5我们使用无噪声收敛图展示了费希尔对宇宙学参数的预测,它对应于从100到大约30000。为了简单起见,我们只显示了每个数据集的两个参数平面。在图的两个面板中5边缘椭圆是三参数Fisher椭球在平面上的投影,而条件椭圆是它们的横截面。

Fisher使用无噪音κ图进行预测(95%置信椭圆)。散射系数对宇宙学参数具有非常高的约束能力。左图:预测暗能量状态方程指数w(a)=w0+(1−a)wa,从20000 deg2的无噪声映射,l名义上高达约30000,源红移z=2。右图:中微子质量Mν的预测,根据20000度无噪声图,源红移z=1。
图5。

Fisher使用无噪音κ图进行预测(95%置信椭圆)。散射系数对宇宙学参数具有很高的约束能力。左侧:暗能量状态方程指数的预测w个() =w个0+ (1 −)w个,从20000度2无噪音地图名义上高达约30000和源红移z(z) = 2.正确的:中微子质量预测M(M)ν,从20000度2源红移的无噪地图z(z) = 1.

对于暗能量参数(左侧面板),功率谱约束w个0好吧,什么时候w个已知(有条件),但如果w个也将受到约束(边缘化),这意味着w个0w个与双谱相比,双谱部分打破了这种简并性(Takada&Jain2003)在无噪声的情况下,散射系数几乎消除了它。在弱透镜宇宙学中,Ω之间还有另一个众所周知的简并和σ8散射系数也可以打破(Cheng等人。2020). 然而,本研究中使用的暗能量数据集具有固定的σ8值。因此,散射系数能否同时打破这两种简并,还有待研究。

在无噪声图上,散射系数也对中微子质量和提供了更严格的约束M(M)ν功率谱和双谱(参见图的右侧面板5). 在由Ω跨越的参数空间中, σ8,M(M)ν,功率谱的约束功率主要来自其整体振幅,这导致了一个盘状Fisher椭球体。添加双谱可以通过部分破坏Ω来减小光盘的面积–σ8简并,而增加散射系数几乎消除了它,将其降为一维而不是二维简并。这与图中所示的结果一致5Cheng等人。(2020). 三参数Fisher椭球体的体积比(即协方差矩阵行列式的平方根)如图右侧所示5大约是20:4:1。

当考虑到星系形状噪声时,由于小尺度(高尺度)的损失,所有汇总统计的约束能力减弱-)信息。在图中6我们展示了中微子质量和的预测(M(M)ν)对于类似鲁宾天文台的调查,使用基准宇宙学的贝叶斯后验(M(M)ν, Ω,A类)=(0.1 eV,0.3,2.1×10−9). 尽管有噪声,透镜会聚图中仍然存在大量非高斯结构,因此散射系数仍然设置了更严格的宇宙学约束(在M(M)ν)而不是仅仅使用功率谱。在这种噪声情况下,双谱和功率谱的组合设置了与散射系数和功率谱组合类似的约束(尽管图中未显示)。6还显示了红移层析成像的效果。五元红移层析成像改进了散射系数对M(M)ν约40%。

预测20 000度视场的鲁宾天文台类测量的宇宙学参数(95%置信等高线),并限制Mν、ΩM和As(或σ8)。颜色表示透镜会聚(κ)的不同汇总统计结果。还显示了添加红移层析成像的改进。
图6。

20 000度鲁宾天文台类测量的宇宙学参数预测(95%置信等高线)2视野,具有M(M)ν, Ω、和A类(或σ8)受到约束。颜色表示透镜会聚(κ)的不同汇总统计结果。还显示了添加红移层析成像的改进。

使用相同的数据集(MassiveNuS公司),对其他非高斯统计进行了类似的探索,包括PDF(Liu和Madhavacheril2019; Boyle等人。2021),双谱(Coulton等人。2019),峰值计数(Li等人。2019),小星峰值计数(Ajani等人。2020),最小计数(Coulton等人。2020)Minkowski功能(Marques等人。2019)和starlet1-标准(亚贾尼、斯塔克和佩托利诺2021). 他们都发现在各自的汇总统计数据中,红移断层扫描也有类似的改善。

5个结论

在宇宙学中,大量信息存储在小尺度的非高斯结构中,这需要功率谱以外的统计信息来提取。受正在进行和即将进行的深入调查的启发,我们探索了一种新型且强大的非高斯统计(称为散射变换)的弱透镜应用。我们扩展了Ω的约束预测和σ8Cheng等人。(2020)更多的宇宙学参数,包括暗能量参数w个0,w个和中微子质量M(M)ν为此,我们使用两个公开可用的模拟套件(暗能量和MassiveNuS公司布景)由哥伦比亚伦辛团队制作。

我们首先表明,使用散射系数可以生成纹理非常接近模拟透镜映射的随机图像,而这是使用功率谱和双谱系数无法实现的。然后,我们表明散射系数为暗能量参数提供了更好的约束w个0,w个和中微子质量M(M)ν而不仅仅是使用功率谱。

对于无噪贴图(高时-模式是可访问的),散射变换也优于双谱和功率谱。这一结果可以用散射系数的“一阶”性质来解释,散射系数与场强成正比,而高阶统计则放大了分布尾部。这个低阶大自然和小波加权策略有效地将宇宙学信息集中到一组紧凑的散射系数中。此外低阶大自然使散射系数的分布比高阶统计量更具高斯性和鲁棒性,这对于准确的似然参数化和参数推断至关重要。

我们还提供了以下预测M(M)ν在鲁宾天文台调查的噪声水平下,散射系数设置了比单独使用功率谱更严格的2倍约束,红移层析成像将约束额外提高了40%。由于模拟会聚图的红移限制,对暗能量参数的类似预测仍有待进一步研究。对于含噪地图,尽管散射系数的约束能力没有明显优于双谱和功率谱的组合,但我们认为散射系数仍然是首选的,因为散射系数的PDF比双谱系数更高斯。

散射变换生成一组紧凑的低阶用于描述非高斯结构的稳定、强大和有效的汇总统计信息。与Cheng等人。(2020)我们已经表明,散射变换在观测宇宙学中具有很大的潜力,可以用作非高斯摘要统计。

致谢

我们感谢哥伦比亚透镜集团(http://columbialensing.org)通过授予AST-120877和XSEDE分配AST-140041,使其模拟透镜映射套件公开可用,并由NSF支持创建这些映射。我们感谢袁森婷在图像合成方面的帮助,感谢道格拉斯·芬克贝纳指出本文第一版中的错误。S.C.感谢姚思玉不断的鼓舞和鼓励。

数据可用性

本文所依据的数据来自哥伦比亚·朗兴集团(http://columbialensing.org). 本研究中产生的衍生数据将根据合理要求共享给相应作者。

脚注

1

据我们所知,散射变换与粒子物理学中的散射过程无关。

5

我们指出,即使不取散射系数的对数,“原始”散射系数的偏度值仍然相对较小,通常在0到1之间。

参考文献

艾哈拉
小时。
,
2018年a
,
出版物。阿童木。Soc.日本
,
70
,
S4系列

艾哈拉
小时。
,
2018年b
,
出版物。阿童木。Soc.日本
,
70
,
第8节

亚贾尼语
五、。
,
剥离
答:。
,
佩托里诺
五、。
,
斯塔克
J.-L.公司。
,
Z.公司。
,
线路接口单元
J。
,
2020
,
物理学。版次。D类
,
102
,
103531

亚贾尼语
五、。
,
斯塔克
J.-L.公司。
,
佩托里诺
五、。
,
2021
,
A&A公司
,
645
,
L11级

盟友
E.公司。
,
列弗里尔
F。
,
美国。
,
科林
C、。
,
雷加多-圣布兰卡
B。
,
布朗格
F、。
,
Hennebelle公司
第页。
,
马拉特
美国。
,
2019
,
A&A公司
,
629
,
A115号机组

盟友
E.公司。
,
马尔坎德
T。
,
卡多佐
J.F.公司。
,
维亚莱斯库斯·纳瓦罗
F、。
,
美国。
,
马拉特
美国。
,
2020
,
物理学。版次。D类
,
102
,
103506

安迪(Andén)
J。
,
马拉特
美国。
,
2014
,
IEEE传输。信号处理。
,
62
,
4114

巴特尔曼
M。
,
施耐德
第页。
,
2001
,
物理学。代表。
,
340
,
291

波义耳
答:。
,
乌勒曼
C、。
,
弗里德里希
O。
,
巴泰勒米
答:。
,
科迪斯
美国。
,
贝尔纳多
F、。
,
焦科利
C、。
,
巴尔迪
M。
,
2021
,
MNRAS公司
.
505
,:
2886

布吕纳
J。
,
马拉特
美国。
,
2013
,
IEEE传输。模式分析。机器。智力。
,
35
,
1872
数字对象标识:

布吕纳
J。
,
马拉特
美国。
,
2019
,
数学。统计。学习。
,
1
,
257

布吕纳
J。
,
马拉特
美国。
,
巴克里
E.J.-F.M.公司。
,
2015
,
安。统计。
,
43
,
323

卡隆
J。
,
2011
,
亚太及日本
,
738
,
86

卡隆
J。
,
2012
,
物理学。版次。莱特。
,
108
,
071301

卡隆
J。
,
2013
,
A&A公司
,
551
,
A88型

胡萝卜
J。
,
内林克
M.C.公司。
,
2012
,
亚太及日本
,
750
,
28

美国。
,
叮叮声
Y.-S.公司。
,
梅纳德
B。
,
布吕纳
J。
,
2020
,
MNRAS公司
,
499
,
5902

谢瓦利埃
M。
,
波拉斯基
D。
,
2001
,
国际期刊修订版。物理学。D类
,
10
,
213

库尔顿
W.R.公司。
,
线路接口单元
J。
,
马达瓦切里尔
医学硕士。
,
博姆
五、。
,
斯佩格
D.编号。
,
2019
,
J.Cosmol公司。Astropart。物理学。
,
2019
,
043

库尔顿
W.R.公司。
,
线路接口单元
J。
,
麦卡锡
I.G.公司。
,
奥萨托
英国。
,
2020
,
MNRAS公司
,
495
,
2531

迪亚兹·里韦罗
答:。
,
德沃金
C、。
,
2020
,
物理学。版次。D类
,
102
,
103507

费希尔
注册会计师。
,
1935
,
J.R.法律总汇。
,
98
,
39

马奇领班
D。
,
霍格
D.W.公司。
,
冗长的
D。
,
古德曼
J。
,
2013
,
PASP公司
,
125
,
306

L。
,
2014
,
MNRAS公司
,
441
,
2725

哈恩
C、。
,
贝特勒
F、。
,
辛哈
M。
,
柏林
答:。
,
美国。
,
霍格
D.W.公司。
,
2019
,
MNRAS公司
,
485
,
2956

哈特拉普
J。
,
西蒙
第页。
,
施耐德
第页。
,
2007
,
A&A公司
,
464
,
399

杰弗里
N。
,
拉努塞
F。
,
拉哈夫
O。
,
斯塔克
J.-L.公司。
,
2020
,
MNRAS公司
,
492
,
5023

杰弗里
N。
,
阿尔辛
J。
,
拉努塞
F、。
,
2021
,
MNRAS公司
,
501
,
954

卡普扎克
T。
,
2016
,
MNRAS公司
,
463
,
3653

凯撒
N。
,
斯奎尔斯
G.公司。
,
1993
,
亚太及日本
,
404
,
441

基尔宾格
M。
,
2015
,
代表程序。物理学。
,
78
,
086901

劳雷伊斯
R。
,
2011
,
预印本(arXiv:1110.3193)

Z.公司。
,
线路接口单元
J。
,
马蒂利亚
J·M·Z。
,
库尔顿
W.R.公司。
,
2019
,
物理学。版次。D类
,
99
,
063527

线路接口单元
十、。
,
2015年b
,
MNRAS公司
,
450
,
2888

线路接口单元
J。
,
马达瓦切里尔
医学硕士。
,
2019
,
物理学。版次。D类
,
99
,
083508

线路接口单元
J。
,
佩特里
答:。
,
海曼
Z.公司。
,
回族
L。
,
克拉托奇维尔
J·M·。
,
五月
M。
,
2015年a
,
物理学。版次。D类
,
91
,
063507

线路接口单元
J。
,
希尔
J.C.公司。
,
谢尔文
出生日期。
,
佩特里
答:。
,
伯恩
五、。
,
海曼
Z.公司。
,
2016
,
物理学。版次。D类
,
94
,
103501

线路接口单元
J。
,
美国。
,
佐里拉·马蒂拉
J·M·。
,
希尔
J.C.公司。
,
海曼
Z.公司。
,
马达瓦切里尔
医学硕士。
,
佩特里
答:。
,
斯佩格
D.编号。
,
2018
,
J.Cosmol公司。Astropart。物理学。
,
2018
,
049

LSST科学合作
,
2009
,
预印本(arXiv:0912.0201)

马拉特
美国。
,
2012
,
Commun公司。纯应用程序。数学。
,
65
,
1331

马尔克斯
总会计师。
,
线路接口单元
J。
,
佐里拉·马蒂拉
J·M·。
,
海曼
Z.公司。
,
伯努伊
答:。
,
诺瓦埃斯
C.P.公司。
,
2019
,
J.Cosmol公司。Astropart。物理学。
,
2019
,
019

马丁内特
N。
,
2018
,
MNRAS公司
,
474
,
712

马丁内特
N。
,
哈诺伊斯·德拉普斯
J。
,
朱洛
E.公司。
,
施耐德
第页。
,
2021
,
A&A公司
,
646
,
A62型

内林克
M.C.公司。
,
萨普迪
一、。
,
2007
,
MNRAS公司
,
375
,
第51页

内林克
M.C.公司。
,
萨普迪
一、。
,
轮辋
C.D.公司。
,
2006
,
MNRAS公司
,
370
,
L66型

佩特里
答:。
,
2016
,
阿童木。计算。
,
17
,
73

佩特里
答:。
,
线路接口单元
J。
,
海曼
Z.公司。
,
五月
M。
,
回族
L。
,
克拉托奇维尔
J·M·。
,
2015
,
物理学。版次。D类
,
91
,
103511

皮雷
美国。
,
2020
,
A&A公司
,
638
,
A141型

雷加多-圣布兰卡
B。
,
列弗里尔
F、。
,
盟友
E.公司。
,
贝洛米
E.公司。
,
布朗格
F、。
,
2020
,
A&A公司
,
642
,
A217型

轮辋
C.D.公司。
,
汉密尔顿
A.J.S.公司。
,
2005
,
MNRAS公司
,
360
,
L82号

轮辋
C.D.公司。
,
汉密尔顿
A.J.S.公司。
,
2006
,
MNRAS公司
,
371
,
1205

赛义贾里
答:K。
,
波蒂略
S.K.N.公司。
,
斯莱宾
Z.公司。
,
卡勒曼
美国。
,
伯克哈特
B。
,
芬克拜纳
D.P.公司。
,
2020
,
天体物理学。J。
,
910
,
122

泽伦廷
E.公司。
,
天啊
A.F.公司。
,
2018
,
MNRAS公司
,
473
,
2355

掸邦
小时。
,
2018
,
MNRAS公司
,
474
,
1116

西弗雷
L。
,
马拉特
美国。
,
2013
,
IEEE计算机视觉和模式识别会议记录
,第页。
1233

斯佩格
D。
,
2015
,
预印本(arXiv:1503.03757)

高田
M。
,
耆那教
B。
,
2003
,
亚太地区
,
583
,
L49层

特格马克
M。
,
泰勒
答:N。
,
天啊
A.F.公司。
,
1997
,
亚太及日本
,
480
,
22

范·沃贝克
L。
,
2000
,
MNRAS公司
,
313
,
524

沃格利
医学硕士。
,
绍洛伊
A.S.公司。
,
1996
,
亚太及日本
,
465
,
34

佐里拉·马蒂拉
J·M·。
,
海曼
Z.公司。
,
D。
,
古普塔
答:。
,
佩特里
答:。
,
2016
,
物理学。修订版。D类
,
94
,
083506

附录A:绑定双谱

这里我们描述了装箱双谱的公式。双谱是三个傅里叶系数的乘积,
$$\开始{eqnarray*}B(粗体符号{k} _1个,\粗体符号{k} _2,\粗体符号{k} _3个)\equiv\langle\tilde{I}(粗体符号{k} _1个)\波浪线{I}(\粗体符号{k} _2)\波浪号{I}(\粗体符号{k} _3个)\范围\结束{eqnarray*}$$
(A1)
由于对称性,仅考虑以下情况就足够了k个1<k个2<k个在统计均匀性下,系数消失,除非|$\粗体符号{k} _1个+\粗体符号{k} _2+\粗体符号{k} _3个=0$|⁠为了减少系数的数量,可以使用binned双谱单极,它根据k个1,k个2、和k个
$$\开始{eqnarray*}B_{i,j,k}&=&\ int _{k_{i}}^{k_{i+1}}\ mathrm{d}\粗体符号{k} _1个\int_{k{j}}^{k{j+1}}\mathrm{d}\boldsymbol{k} _2\int_{k_{k}}^{k{k+1}}\mathrm{d}\boldsymbol{k} 3个\n数字\\&&(2\pi)^2\delta^{(2)}(粗体符号{k} _1个+\粗体符号{k} _2+\粗体符号{k} _3个)\ cdot\波浪线{I}(\粗体符号{k} _1个)\波浪线{I}(\粗体符号{k} _2)\波浪线{I}(\粗体符号{k} _3个)\结束{eqnarray*}$$
(A2)
选择不方便|$\delta(\boldsymbol{k} _1个+\粗体符号{k} _2+\粗体符号{k} _3个)$|每个箱子中有三个。幸运的是,扩展了等式的右侧(A2类)在实际空间中会简化被积函数,
$$\开始{eqnarray*}B_{i,j,k}=langle(i\star f_i)(i\sart f_j)(i\star f_k)等级,\结束{eqnarray*}$$
(A3)
哪里|$f_i(\boldsymbol{x})=\int_{k_i}^{k_{i+1}}e^{i\boldsymbol{k}\cdot\boldsembol{x}}\mathrm{d}\boldsimbol{k}$|是装箱、傅里叶空间中的环形和实际空间中的类波剖面的傅里叶逆变换。这种形式的表达式与散射系数类似,意味着双谱(和其他N个-点函数)也可以表示为输入场的一些非线性变换的空间平均值,尽管它具有与散射不同的性质。

附录B:宇宙学推理框架

对于可观测的统计模型|$\粗体符号{x}$|,Cramér–Rao不等式设置了从可观测值中获得的模型参数的任何无偏估计的下限,因此它可以用于量化参数推断的不确定性。
$$\开始{eqnarray*}\文本{cov}(\hat{\boldsymbol{\theta}})\ge\bf{I}(\ boldsympol{\heta})^{-1}\,\结束{eqnarray*}$$
(B1)
哪里|$\bf{I}(\boldsymbol{\theta})$|是费希尔信息矩阵,其元素定义为
$$\开始{eqnarray*}I_{m,n}(\boldsymbol{\theta})\equiv-\left\langle\frac{\partial\text{ln}\,p(\bolssymbol{x}|\boldsymbol{\theta})}{\partic\text{n}\,p(\bodsymbol{x}|\bolsymboldsyMBol{\teta}){\parial\theta_n}\right\rangle\。\结束{eqnarray*}$$
(B2)
在我们的案例中,|$\boldsymbol{\theta}$|是宇宙学参数,以及|$\粗体符号{x}$|是汇总统计的向量,例如散射系数。假设PDF为高斯,
$$\开始{eqnarray*}p(\boldsymbol{x}|\boldsymbol{theta})\proto\frac{1}{\sqrt{|\bf{C}|}}}\text{exp}\left[-\frac{1}{2}(\boldsymbol{x}-\粗体符号{\mu})^T\bf{C}^{-1}(\boldsymbol{x}-\粗体符号{\mu})\right]\,\结束{eqnarray*}$$
(B3)
哪里|$\bf{C}(\boldsymbol{\theta})$|是汇总统计的协方差矩阵。我们进一步假设|$\bf{C}(\boldsymbol{\theta})$|与宇宙学无关。因此,Fisher矩阵变成
$$\开始{eqnarray*}I_{m,n}=\frac{\partial\boldsymbol{\mu}^T}{\paratil\theta_m}\bf{C}^{-1}\frac{\ partial\ boldsympol{\mo}}{\protial\theta _n}\。\结束{eqnarray*}$$
(B4)
我们使用线性或二阶多项式来拟合平均向量的宇宙学相关性|$\boldsymbol{\mu}(\boldsymbol{\theta})$|,并使用样本协方差矩阵|$\widehat{\bf{C}}$|根据基准宇宙学的模拟估计(Ω = 0.26,w个0 = –1,w个=0(对于暗能量数据集)和Ω = 0.3,M(M)ν = 0,A类 = 2.1 × 10−9对于MassiveNuS公司数据集)估计协方差矩阵的逆(Hartlap、Simon和Schneider2007):
$$\开始{eqnarray*}\widehat{\bf{C}^{-1}}=\frac{N-D-2}{N-1}\widehat{\bf{C}}^{-1-}\,\结束{eqnarray*}$$
(B5)
哪里|$\widehat{\bf{C}^{-1}}$|是一个无偏估计量,N个是用于估计的独立样本数(1000用于暗能量数据集,10000用于MassiveNuS公司数据集),D类是散射系数、binned功率谱和binned双谱分别使用的汇总统计数,即每红移bin 36、30和125。协方差矩阵|$\bf{C}$|从3.5×3.5度测量总统计数2地图。预测20000度的鲁宾式调查2,我们简单地将协方差矩阵按3.5×3.5/20000的因子进行缩放,这相当于假设每3.5×3.5度2补丁是独立的。虽然不完全正确,但这仍然是一种常用的近似方法,可以在不运行多个全天空模拟的情况下获得快速预测(例如,Coulton et al。2019; Li等人。2019; Liu和Madhavacheril2019).
贝叶斯后验是量化模型参数推断不确定性的另一种方法。考虑到可能性|$p(\boldsymbol{x}|\boldsymbol{theta})$|,模型参数的后验概率分布为
$$\开始{eqnarray*}p(\boldsymbol{\theta}|\boldsymbol{x},\结束{eqnarray*}$$
(B6)
哪里|$p(\boldsymbol{\theta})$||$\boldsymbol{\theta}$|.对于有噪音的情况MassiveNuS公司,我们在Ω中使用平坦先验∈ [0.28, 0.32],M(M)ν∈[0.06,0.6]eV,以及A类∈ [1.8, 2.7] × 10−9以避免推断。然后使用主持人(Foreman-Mackey等人。2013),马尔可夫链蒙特卡罗采样器。我们使用了32个步行者,跑了1000步来完成训练,然后跑了10000步来完成后面的测试。检查链内和链间的采样收敛性。对于图中使用的所有汇总统计组合6,当距离超过100步时,链的自相关性被测量为在±2%以内。
本文根据牛津大学出版社标准期刊出版模式的条款出版和发行(https://academic.oup.com/journals/pages/open_access/funder_policies/chorus/standard_publication_model)