https://www.jstatsoft.org/index.php/jss/issue/feed 统计软件杂志 2024-02-18T22:58:37+00:00 编辑部 editor@jstatsoft.org编辑 开放式日志系统 《统计软件杂志》(Journal of Statistical Software)发表关于统计软件的文章,以及软件本身的源代码和所有实证结果的复制代码。 https://www.jstatsoft.org/index.php/jss/article/view/v108i01 R包技巧:绘制单位区间比例和指标的工具 2023-01-14T05:39:03+00:00 西尔维娅·德尼科洛 silvia.denicolo@unibo.it 阿尔多·加迪尼 aldo.gardini@unibo.it <p>tipsae包实现了一组小面积估算工具,用于映射单位间隔上定义的比例和指标。它提供了在区域级别定义的小区域模型,包括经典贝塔回归、零膨胀和/或单膨胀贝塔和灵活贝塔模型,可能会考虑空间和/或时间依赖结构。这些模型是在贝叶斯框架内开发的,通过Stan语言进行估计,可以进行快速估计和定制的并行计算。tipsae软件包的附加功能,如诊断、可视化和导出功能,以及方差平滑和基准测试功能,在整个评估、验证和结果展示过程中改善了用户体验。具有用户友好界面的闪亮应用程序进一步简化了用于小区域分析的贝叶斯模型的实现</p>(第页) 2024-03-27T00:00:00+00:00 版权所有(c)2024 Silvia De Nicoló,Aldo Gardini https://www.jstatsoft.org/index.php/jss/article/view/v108i02 R包市场:均衡和非均衡市场的估计方法 2023-01-16T18:47:28+00:00 Pantelis卡拉帕纳神经炎 karapanagiotis@ebs.edu <p>市场模型是商业、产业组织和宏观经济决策实证应用的重要基石。计量经济学文献提出了各种均衡市场的估计方法,其中包括基于结构短期规则描述的市场清理结构条件和非均衡。尽管如此,此类模型的最大似然估计需要计算,并且提供简单、现成方法进行估计的软件很少。因此,应用程序依赖于特定项目的实施来评估这些模型,这阻碍了研究的再现性和结果的可比性。本文介绍了R包市场,它提供了一个具有通用功能的通用接口,简化了均衡和非均衡市场模型的估计。该软件包专门用于估计需求、供应和合计市场数量以及绝对、标准化和相对市场短缺。它的功能通过一个使用美国住房开工信贷经典数据集的实证应用进行了例证。此外,本文详细介绍了实现的范围和设计,并提供了通过大规模基准测试模拟收集的评估功能的计算性能的统计度量。市场包是在Expat许可下作为R软件生态系统的一部分分发的自由软件。它包括一组估算和分析工具,这些工具不是直接从备选R包或其他统计软件项目中获得的</p>(第页) 2024-02-18T00:00:00+00:00 版权所有(c)2024 Pantelis Karapanagiotis https://www.jstatsoft.org/index.php/jss/article/view/v108i03 DoubleML:R中双机器学习的面向对象实现 2021-08-05T21:20:01+00:00 菲利普·巴赫 菲律宾bach@uni-hamburg.de 马尔特·S·库尔兹 malte.kurz@tum.de 威克特·切诺祝可夫 vchern@mit.edu公司 马丁·斯宾德勒 martin.spindler@uni-hamburg.de 斯文·克拉森 sven.klaassen@uni-hamburg.de <p>R包DoubleML实现了Chernozhukov、Chetverikov、Demirer、Duflo、Hansen、Newey和Robins(2018年)的双/减元机器学习框架。它提供了基于机器学习方法估计因果模型中参数的功能。双机器学习框架由三个关键成分组成:内曼正交性、高质量机器学习估计和样本分割。可通过mlr3生态系统中可用的各种最先进的机器学习方法来评估有害成分。DoubleML可以在各种因果模型中进行推理,包括部分线性和交互式回归模型及其对工具变量估计的扩展。DoubleML的面向对象实现为模型规范提供了高度的灵活性,并使其易于扩展。本文介绍了双机器学习框架和R包DoubleML。在具有模拟和实际数据集的可再现代码示例中,我们演示了DoubleML用户如何基于机器学习方法执行有效推理</p>(第页) 2024-02-18T00:00:00+00:00 版权所有(c)2024 Philipp Bach、Malte S.Kurz、Victor Chernozhukov、Martin Spindler、Sven Klaassen https://www.jstatsoft.org/index.php/jss/article/view/v108i04 gcimpute:缺失数据插补包 2023-02-28T14:19:11+00:00 赵宇轩 yz2295@cornell.edu 马德琳·乌德尔 udell@stanford.edu <p>本文介绍了用于缺失数据插补的Python包gcimpute。通过将数据建模为高斯copula模型的样本,包gcimpute可以用许多不同的变量类型来插补缺失数据,包括连续、二进制、序数、计数和截断值。该半参数模型学习每个变量的边际分布,以匹配经验分布,同时使用联合高斯描述变量之间的相互作用,从而实现快速推断、置信区间插补和多重插补。该软件包还提供了专门的扩展,用于处理大型数据集(复杂度与观测数呈线性关系)和流数据集(具有在线插补)。本文描述了底层方法并演示了如何使用软件包</p>(第页) 2024-02-18T00:00:00+00:00 版权所有(c)2024 Yuxuan Zhao,Madeline Udell https://www.jstatsoft.org/index.php/jss/article/view/v108i05 熔化:R中的多重经验似然检验 2022-11-16T16:02:45+00:00 金恩索普 kim.7302@osu.edu 史蒂文·N·麦克伊切恩 snm@stat.osu.edu公司 马里奥·佩鲁贾 peruggia@stat.osu.edu <p>经验似然能够实现非参数的、似然驱动的推理风格,而不依赖于参数模型中经常做出的假设。基于经验的相似性检验是渐近关键的,因此避免了显式的研究。本文介绍了R软件包熔体,它为使用经验似然法进行数据分析提供了一个统一的框架。一组函数可用于对R中的线性和广义线性模型进行多个经验似然检验。该软件包在指定假设和校准方法方面提供了易于使用的界面和灵活性,将框架扩展到了同时推断。假设检验使用投影梯度算法来解决约束经验似然优化问题。核心计算例程用C++实现,OpenMP用于并行计算</p>(第页) 2024-02-18T00:00:00+00:00 版权所有(c)2024 Eunseop Kim,Steven N.MacEachern,Mario Peruggia https://www.jstatsoft.org/index.php/jss/article/view/v108i06 PUMP:在多水平实验中调整多个结果时估计功率、最小可检测效应大小和样本大小 2023-01-30 T18:24:09+00:00 克里斯汀·亨特 kristen.hunter@unsw.edu.au 卢克·米拉特里克斯 lmiratrix@g.harvard.edu 克里斯汀·波特 kristin.porter@keporterconsulting.com <p>对于单次干预对多个结果的影响进行测量的随机对照试验(RCT),研究人员通常采用多重测试程序(如Bonferroni或Benjamini-Hochberg)来调整p值。这样的调整减少了虚假发现的可能性,但也改变了统计能力,有时甚至是实质性的。功率降低意味着当效应确实存在时,检测到效应的概率降低。在典型的功率分析中,这种考虑经常被忽略,因为现有的工具不容易适应多种测试程序的使用。我们引入了PUMP(Power Under Multiplicity Project)R包,作为分析员评估统计能力、最小可检测效应大小和多结果多级随机对照试验样本大小要求的工具。PUMP使用基于模拟的方法灵活估计各种实验设计、结果数量、多种测试程序和其他用户选择的功率。通过假设线性混合效应模型,我们可以直接从测试统计数据在结果之间的联合分布中得出结果,从而通过模拟来估计功效。PUMP的主要创新之一是适应多种结果,这些结果有两种解释。首先,PUMP的功率估计正确地解释了应用多重测试程序时p值的调整。其次,当考虑多个结果而不是单个结果时,会出现不同的统计权力定义。PUMP允许研究人员考虑各种权力定义,以便为其研究目标选择最合适的权力类型。该软件包支持各种常用的频率学家多级RCT设计和线性混合效应模型。除了估算功率、最小可检测效应大小和样本大小要求的主要功能外,该软件包还允许用户轻松探索这些量对基本假设变化的敏感性</p>(第页) 2024-03-18T00:00:00+00:00 版权所有(c)2024 Kristen B.Hunter,Luke Miratix,Kristin Porter https://www.jstatsoft.org/index.php/jss/article/view/v108i07 整体广义线性模型 2022-09-15T11:40:42+00:00 本杰明·施文丁格 benjaminschwe@gmail.com 弗洛里安·施温丁格 FlorianSchwendinger@gmx.at 劳拉·瓦纳 laura.vana.guer@tuwien.ac.at地址: <p>整体线性回归通过添加额外的约束来改进模型质量,从而扩展了经典的最佳子集选择问题。这些约束包括稀疏性诱导约束、符号相干约束和线性约束。R包holiglm提供了建模和拟合整体广义线性模型的功能。通过使用最先进的混合积分二次曲线解算器,该软件包可以可靠地求解具有多种整体约束的高斯、二项式和泊松响应的广义线性模型。高级接口简化了约束规范,可以用作stats::glm()函数的下拉替换</p>(第页) 2024-02-18T00:00:00+00:00 版权所有(c)2024 Benjamin Schwendinger,Florian Schwending er,Laura Vana https://www.jstatsoft.org/index.php/jss/article/view/v108i08 鲑鱼:Python的符号线性回归包 2022-08-04T00:28:05+00:00 亚历克斯·博伊德 alexjb@uci.edu 丹尼斯·L·孙 dsun09@calpoly.edu <p>R最吸引人的特性之一是其线性建模功能。我们描述了一个Python包,即鲑鱼,它通过提供用于指定和拟合线性模型的可组合对象,以Pythonic的方式将R的线性建模功能的最好部分带给Python。这种面向对象的设计还支持其他增强易用性的功能,例如自动可视化和智能模型构建</p>(第页) 2024-03-28T00:00:00+00:00 版权所有(c)2024 Alex Boyd,Dennis L.Sun https://www.jstatsoft.org/index.php/jss/article/view/v108i09 基于R包tvgarch的非平稳金融波动建模 2023-02-12T20:57:48+00:00 苏珊娜·坎波斯-马丁斯 scmartins@ucp.pt 杰纳罗·苏卡拉特 genaro.sucarrat@bi.no <p>某些事件会使金融收益的波动性结构发生变化,使其非平稳。时变条件方差模型,如广义自回归条件异方差(GARCH)模型通常假设平稳。然而,这种假设可能是不恰当的,在无条件方差存在结构性变化的情况下,波动率预测可能会失败。为了克服这个问题,在时变(TV-)GARCH模型中,通过假设条件方差和无条件方差都是时变的,允许GARCH参数随时间平滑变化。在本文中,我们展示了R包tvgarch(Campos-Martins和Sucarrat 2023)对金融实证应用中的非平稳波动建模的有用性。用于模拟、测试和估计TV-GARCH-X模型的功能,其中可以包括额外的协变量,可在单变量和多变量设置中实现</p>(第页) 2024-04-08T00:00:00+00:00 版权所有(c)2024 Susana Campos Martins,Genaro Sucarrat https://www.jstatsoft.org/index.php/jss/article/view/v108i10 使用FRK建模大型、异构、非高斯空间和时空数据 2022-11-22T11:56:16+00:00 马修·桑斯伯里·戴尔 msdale@uow.edu.au 安德鲁·扎米特·曼吉 azm@uow.edu.au 诺埃尔·克雷西 ncressie@uow.edu.au <p>非高斯空间和时空数据越来越普遍,各种学科都需要对其进行分析。FRK是一个R包,用于空间和时空建模和预测,具有非常大的数据集,到目前为止,该数据集仅支持线性过程模型和高斯数据模型。在本文中,我们描述了对FRK的一次重大升级,该升级允许在广义线性混合模型框架中分析非高斯数据。这些更通用的空间和时空模型通过软件TMB使用拉普拉斯近似进行拟合。FRK的现有功能在非高斯模型中得到了保留;特别是,它允许自动构建基本函数,可以同时处理点参考数据和面数据,并且可以根据这些数据预测任何空间支持下的过程值。这种新版本的FRK还允许在建模空间过程时使用大量的基函数,因此它通常能够在高斯设置下实现比以前版本包更准确的预测。我们展示了FRK新版本中的创新功能,强调了其易用性,并使用模拟和实际数据集将其与替代软件包进行了比较</p>(第页) 2024-04-08T00:00:00+00:00 版权所有(c)2024 Matthew Sainsbury-Dale,Andrew Zammit-Magion,Noel Cressie https://www.jstatsoft.org/index.php/jss/article/view/v108c01 CRTFASTGEEPWR:一个SAS宏,用于广义估计方程的幂分析,多周期聚类随机试验,并应用于阶梯楔形设计 2023-01-04T18:27:55+00:00 张颖(音) zyingunc@gmail.com 约翰·普雷瑟 jpreisse@bios.unc.edu 范丽 fan.f.li@yale.edu 伊丽莎白·L·特纳 liz.turner@duke.edu 保罗·拉特霍兹 paul.rathouz@austin.utexas.edu <p>多期分组随机试验(CRT)越来越多地用于评估在群体层面上实施的干预措施。虽然广义估计方程(GEE)通常用于在CRT中提供人口平均推断,但基于多参数的功率计算的通用方法和统计软件工具仍存在差距,适用于多周期CRT的簇内相关结构,可适应完整和不完整设计。描述了一种用于确定统计能力的计算快速非模拟程序,用于对完整和不完整的多周期分组随机试验进行GEE分析。该过程通过SAS宏CRTFASTGEEPWR实现,该宏适用于多周期CRT中的二进制、计数和连续响应以及几种相关结构。在不同规格的边际均值模型和簇内相关结构下,SAS宏在两个完全和两个不完全阶梯楔形簇随机试验场景的功率计算中得到了说明。建议的GEE功率方法非常通用,如SAS宏中所示,具有许多输入选项。除了横断面和封闭队列阶梯试验外,权力程序和宏观也可用于平行和交叉CRT的规划</p>(第页) 2024-03-27T00:00:00+00:00 版权所有(c)2024 Ying Zhang,John S.Preisser,Fan Li,Elizabeth L.Turner,Paul J.Rathouz