保存此搜索
研究论文 2024年3月 数据流撤销和垃圾收集 数据流反转是源转换反向算法微分(reverse ST-AD)的核心,可以说是获得数值模型梯度的最有效方法。 然而,当模型实现语言使用垃圾时。。。 研究论文 2023年12月 Geomstats包的参数化信息几何 我们介绍了Python包Geomstats的信息几何模块。 该模块首先实现了广泛使用的概率分布参数族的Fisher–Rao-Riemannian流形,如正态分布、伽马分布、β分布、Dirichlet分布等,。。。 研究论文 2023年12月 流形.jl:用于流形数据分析的可扩展Julia框架 我们提供了Julia包Manifolds.jl,它提供了一个快速且易于使用的黎曼流形和李群库。 这个包可以处理黎曼流形上定义的数据,例如圆、球面、对称正。。。 研究论文 2023年9月 阵列感知匹配:降低大规模仿真模型的复杂性 基于方程的建模是解决大规模仿真问题复杂性的有力方法。 基于等式的工具会自动将模型转换为命令式语言。 然而,当面对当今的问题时,经过良好评估的模型。。。 CPFloat:一个模拟低精度算法的C库 通过在硬件中执行每个算术运算,然后将结果舍入到所需的有效位数,可以通过软件模拟低精度浮点运算。 对于符合IEEE标准的格式,舍入只需要标准。。。 -
研究论文 2022年9月 线性代数映射问题。 线性代数语言和库的现状 我们观察到线性代数库的开发人员和最终用户之间存在脱节。 一方面,开发人员在创建复杂的数字内核方面投入了大量精力。 另一方面,最终用户越来越不可能去。。。 研究论文 2022年9月 HIFIR:预处理非条件和奇异系统的混合不完全因子分解与迭代求精 我们引入了一个名为 带迭代求精的混合不完全因子分解(HIFIR) 用于预处理稀疏、非对称、ill-条件和潜在奇异系统。 HIFIR计算 混合不完全因子分解 (高强度聚焦) , ... 研究论文 2022年2月 OpenMP并行循环的源到源自动微分 本文介绍了我们在正向和反向模式下为正确高效地自动区分OpenMP并行工作共享循环所做的工作。 自动微分是获得数值程序梯度的一种方法,它在数值计算中起着至关重要的作用。。。 研究论文 2021年9月 Irksome:有限元方法的Runge–Kutta时间步长自动化 虽然隐式Runge–Kutta(RK)方法具有高精度和重要的稳定性,但实现困难以及在每个时间步长求解耦合代数系统的高昂费用经常被认为是障碍。 我们。。。 研究论文 2021年6月 林内亚 :高效线性代数程序的自动生成 将线性代数计算转换为有效的库调用序列是一项非平凡的任务,需要线性代数和高性能计算方面的专业知识。 几乎所有用于矩阵的高级语言和库。。。 研究论文 2021年6月 PLANC公司 :具有非负约束的并行低秩近似 例如,我们考虑大规模密集非负张量数据的低阶近似问题,以发现视频和成像应用中的潜在模式。 随着数据集规模的增长,单个工作站在这两方面都遇到了瓶颈。。。 研究论文 2020年12月 现代建筑中高性能间断Galerkin方法的代码自动生成 SIMD矢量化最近已成为高性能计算中的一个关键挑战。 然而,手写的显式矢量化代码往往会对软件的可持续性构成威胁。 在本出版物中,我们解决了可持续性和性能问题。。。 研究论文 2020年10月 不连续伽辽金方法的另一个张量工具箱及其应用 偏微分方程的数值解是超级计算中许多重大挑战的核心。 基于高阶间断Galerkin(DG)离散化的解算器在大型超级计算机上具有良好的可扩展性。。。 研究论文 2020年7月 SODECL公司 :用于并行计算随机微分方程组的多轨道的开源库 随机微分方程(SDE)被广泛用于建模受随机过程影响的系统。 通常,SDE模型的分析需要在多个参数组合上多次生成数值解。 然而,这。。。 研究论文 2020年4月 自动模板计算系统Devito的体系结构和性能 法比奥·卢波里尼 , 马蒂亚斯·卢布托 , 迈克尔·兰格 , 纳夫霍特·库克雷加(Navjot Kukreja) , 菲利普·维特 , 扬·胡克尔海姆 , 查尔斯·尤特 , 保罗·H·J·凯利 , 费利克斯·J·埃尔曼 , 杰拉德·J·戈尔曼
模板计算是许多高性能计算应用程序的关键部分,例如图像处理、卷积神经网络和偏微分方程的有限差分求解器。 Devito是一个能够生成。。。 研究论文 2020年3月 算法1005 :BLAS矩阵运算反模式算法微分的Fortran子程序 提出了一组用于基本线性代数子程序(BLAS)的逆模式算法(或自动)微分的Fortran子程序。 在此之前,对用于获得这些公式的数学工具进行了描述。。。 研究论文 2019年12月 一般映射有限元的代码生成 许多经典的有限元,如Argyris和Bell单元,在高级PDE软件中长期缺失。 基于最近的理论工作,我们描述了如何在FInAT中实现非常通用的有限元变换,因此。。。 研究论文 2019年5月 非结构网格计算的自动平铺及其在地震建模中的应用 稀疏平铺是一种融合访问公共数据的循环的技术,从而增加数据的局部性。 与传统的循环融合或分块不同,循环可能具有不同的迭代空间,并通过间接内存访问共享数据集。。。 研究论文 2019年4月 中国科学院 Hermitian特征值问题序列的Chebyshev加速子空间迭代特征解 用直接求解器求解排列在序列中的稠密厄米特特征问题,无法利用与整个序列相关的谱特性,而不仅仅是单个问题。 当这些特征以……的形式出现时。。。