摘要

模型验证通常是测试模型预测与一组独立观测值的匹配程度。有人会认为,证明的责任应该由模型承担,以迫使它表明它可以做出准确的预测。此外,有人会认为,增加样本量应该会提高模型证明其效用的能力。传统的统计工具不适合这样做,因为它们默认模型和数据没有差异,并且它们检测差异的能力随样本大小而增加。这些传统工具进行了优化,以检测差异,而不是相似性。我们提出了一种基于回归和等效性统计测试的模型验证替代策略。等价性测试推翻了通常的零假设:他们假设被比较的人群不同,并用数据证明相反。从这个意义上说,等价性测试是集总测试,而传统的统计测试是分裂测试。迄今为止,等效测试的模型验证侧重于平均值的比较。我们提出的测试不仅检查平均值的相似性,还检查单个预测和观测值之间的相似性。使用三个不同建模目标和不同样本大小的案例研究来演示该策略。提出的策略提供了一种正式的模型验证方法,在每种情况下都优于传统的统计测试。

此内容仅以PDF格式提供。