×

具有相关预测因子的贝叶斯变量选择。 (英语) Zbl 0849.62032号

摘要:在具有多个预测因子的数据集中,通常会使用识别良好预测因子子集的算法。大多数此类算法不允许预测值之间存在任何关系。例如,逐步回归可以选择包含交互作用(AB)但不包含主效应(a)或(B)的模型。本文开发了预测因子之间这种关系和其他关系的数学表示,然后可以将其纳入模型选择过程。
采用了一种超越变量选择标准独立性先验的贝叶斯方法,对某些模型的偏好被解释为先验信息。发展了与任意交互作用和多项式相关的先验知识、分类因子的虚拟变量、竞争预测因子以及模型大小的限制。由于所建立的关系是针对先验的,因此可以将其纳入任何类型线性模型的任何贝叶斯变量选择算法中。本文通过的随机搜索变量选择算法说明了这些方法的应用E.I.乔治R.E.McCulloch公司[J.Am.Stat.Assoc.88,881-889(1993)],对其进行了修改,以利用新的优先权。通过两个构造的示例和一个计算机性能数据集说明了该方法的性能。

MSC公司:

62J05型 线性回归;混合模型
2015年1月62日 贝叶斯推断
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Box,《无重复分数阶乘分析》,Technometrics 28 pp 11–(1986)·Zbl 0586.62168号
[2] Chipman,贝叶斯变量选择及相关预测(1994年)·Zbl 0849.62032号
[3] Clyde,M.A.和Parmigiani,G.(1995年)。蛋白质结构存储:贝叶斯变量选择和混合预测。出现在《生物制药统计杂志》上·Zbl 0957.62099号
[4] Friedman,多元自适应回归样条曲线(带讨论),Ann.Statist。第19页第1页–(1991年)·Zbl 0765.62064号
[5] Geman,随机松弛,Gibbs分布,图像的贝叶斯恢复,IEEE Trans。模式分析和机器智能6 pp 721–(1984)·Zbl 0573.62030号
[6] George,Gibbs抽样变量选择,J.Amer。统计师。协会88第881页–(1993)
[7] Hamada,《复杂混叠设计实验分析》,J.Quality Technol。第24页130–(1992)
[8] Kraght,Van Nostrand的科学百科全书(1976年)
[9] Lauritzen,图形结构概率的局部计算及其在专家系统中的应用(讨论),J.Roy。统计师。Soc.序列号。B 50第157页–(1988年)·Zbl 0684.68106号
[10] McCullagh,广义线性模型(1989)·Zbl 0588.62104号 ·doi:10.1007/978-1-4899-3242-6
[11] Peikoto,多项式回归模型中的层次变量选择,美国医学会。统计师。第41页,第311页–(1987年)
[12] Peixoto,公式化多项式回归模型的一个性质,Amer。统计师。第44页第26页–(1990年)
[13] Raftery,线性回归模型中模型选择和模型不确定性的解释(1993)
[14] 史密斯,通过吉布斯采样器的贝叶斯计算和相关的马尔可夫链蒙特卡罗方法,J.罗伊。统计师。Soc.序列号。B 55第3页–(1993年)·Zbl 0779.62030号
[15] Venables,《现代应用统计学与S-Plus》(1994年)·doi:10.1007/9781-4899-2819-1
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。