×

细菌分类中的贝叶斯预测性、交换性和充分性。 (英语) Zbl 1003.62023号

小结:我们提出了一种细菌分类和预测识别的理论。细菌菌株以二元载体为特征,通过在每个载体上附加标签来指定分类。该理论是从两个基本假设发展而来的,即特征向量对和附加标签的序列被判断为(无限)可交换且可预测充分。我们推导了训练误差和识别误差概率的表达式,并证明后者是前者的仿射函数。我们证明了包含细菌数据基本信息的识别矩阵的大数定律。我们证明了该理论给出的预测识别规则的贝叶斯风险一致性,并表明训练误差是泛化误差的一致估计。

MSC公司:

62英尺15英寸 贝叶斯推断
62页第10页 统计学在生物学和医学中的应用;元分析
62H30型 分类和区分;聚类分析(统计方面)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Gilmour,J.S.L.,《分类问题》,《自然》,1341040(1937)
[2] 比尔斯,R.J。;洛克哈特,W.R.,计算机分类学实验方法,普通微生物学杂志。,28, 633 (1962)
[3] Liston,J。;Wiebe,W.J。;Colwell,R.R.,《细菌生物定量研究方法》,《细菌学杂志》。,85, 1061 (1963)
[4] Paynes,L.C.,走向医疗自动化,世界医疗电子。,2, 6 (1963)
[5] Sneath,P.H.A.,细菌分类学的新方法:计算机的使用,微生物学报。,18, 335 (1964)
[6] Dybowski,W。;Franklin,D.A.,条件概率与细菌鉴定,普通微生物学杂志。,54, 215 (1968)
[7] Gyllenberg,H.G.,《随机收集微生物分离物的测定方案的通用方法》,美国科学院。科学芬恩。,序列号。A、 IV,生物。,69, 1 (1963)
[8] Gyllenberg,H.G.,《细菌临床分离株自动鉴定参考系统的开发》,Archiv。免疫学。治疗。专家。,24, 1 (1976)
[9] Gyllenberg,H.G。;Niemelä,T.K.,《计算机辅助鉴定微生物的基本原理》(Hedén,C.-G.;Illéni,T.,《鉴定微生物的新方法》(1975年),威利:威利纽约),第201页
[10] Hill,L.R.,《数值识别的理论方面》,国际期刊系统。细菌学。,24, 494 (1974)
[11] 拉佩奇,S.P。;Bascomb,S。;Willcox,W.R。;柯蒂斯,M.A.,《计算机识别细菌:一般方面和观点》,《普通微生物学杂志》。,77, 291 (1973)
[12] Pankhurst,R.J.,《实用分类计算》(1991),剑桥大学:剑桥大学·兹比尔0519.92003
[13] Sneath,P.H.A.,根据阳性特征百分比的识别矩阵,利用存在-缺失数据识别未知物的BASIC程序,计算机地球科学。,5, 195 (1979)
[14] Sneath,P.H.A.,BASIC程序,用于从最典型的示例中确定最佳识别分数,与阳性特征百分比的识别矩阵进行比较,计算机地理科学。,6, 27 (1979)
[15] Gyllenberg,H.G.,识别矩阵的连续累积,Helsingin Ylioportin Mikrobiologian Laitoksen Julkaisuja,20,1(1981)
[16] Gyllenberg,M。;Koski,T。;Lund,T。;Gyllenberg,H.G.,细菌的贝叶斯预测识别和累积分类,Bull。数学。生物学,61,85(1999)·Zbl 1323.92009年
[17] Gyllenberg,H.G。;Gyllenberg,M。;Koski,T。;伦德,T。;Schindler,J.,《累积分类评估》,Quant。微生物。,1, 7 (1999)
[18] Bender,E.A.,《人工智能中的数学方法》(1996),IEEE计算机学会:IEEE计算机协会,加利福尼亚州洛斯阿拉米托斯·Zbl 0896.68113号
[19] 吉伦伯格,M。;Koski,T.,《细菌分类的概率模型》,《国际统计评论》,69,249(2001)·Zbl 1180.92004年
[20] Sneath,P.H.A.,系统学中数值概念的历史和未来潜力:H.G.Gylenberg的贡献,Binary,7,32(1995)
[21] Sneath,P.H.A.,数值分类学三十年,系统。《生物学》,44281(1995)
[22] Willcox,W.R。;拉佩奇,S.P。;霍姆斯,B.,《细菌鉴定中的数值方法综述》,安东尼·范·列文虎克,46,233(1980)
[23] 拉佩奇,S.P。;Bascomb,S。;Willcox,W.R。;Curtis,M.A.,细菌的计算机识别,(Baillie,A.;Baillee,R.J.,微生物学中的自动化、机械化和数据处理(1970),学术出版社:纽约学术出版社),第1页
[24] Bascomb,S。;拉佩奇,S.P。;医学硕士柯蒂斯。;Willcox,W.R.,《计算机识别细菌:参考菌株的识别》,《普通微生物学杂志》。,77, 291 (1973)
[25] 威尔科克斯,W.R。;拉佩奇,S.P。;Bascomb,S。;柯蒂斯,M.A.,《通过计算机、理论和程序识别细菌》,《普通微生物学杂志》。,77, 317 (1973)
[26] 杜达,R.O。;Hart,P.E.,《模式分类和场景分析》(1973年),威利出版社:威利纽约·Zbl 0277.68056号
[27] Patrick,E.A.,《模式识别基础》(1972),《普伦蒂斯·霍尔:普伦蒂斯霍尔·恩格尔伍德悬崖》·Zbl 0253.68023号
[28] Young,T.Y。;Calvert,T.W.,分类、估计和模式识别(1974),美国爱思唯尔:美国爱思惟尔纽约·Zbl 0185.47903号
[29] 阿玛里,S.I。;Murata,N.,熵损失准则下学习曲线的统计理论,神经计算。,5, 140 (1993)
[30] Haussler博士。;卡恩斯,M。;Schapire,R.E.,《利用信息理论和VC维度对贝叶斯学习的样本复杂性进行限制》,《机器学习》。,14, 83 (1994) ·Zbl 0798.68145号
[31] Vapnik,V.N.,《统计学习理论的本质》(1995),施普林格出版社:纽约施普林格出版社·Zbl 0934.62009号
[32] Bock,H.-H.,《划分聚类分析中的概率模型和假设检验》(Arabie,P.;Huber,L.J.;De Soete,G.,《聚类和分类》(1996),《世界科学:新泽西州世界科学河边》),第377页·Zbl 1031.62504号
[33] de Finetti,B.(《概率论》,第2卷(1975年),威利出版社:威利纽约)·Zbl 0328.60003号
[34] Diaconis,P。;Zabell,S.L.,更新主观概率,《美国统计协会期刊》,77,822(1982)·Zbl 0504.62004号
[35] Anoulova,S。;Fischer等人。;Pölt,S。;西蒙,美国,可能几乎是贝叶斯决策,Infn。计算。,129, 63 (1996) ·Zbl 0864.68086号
[36] 伯纳多,J.M。;史密斯,A.F.M.,贝叶斯理论(1994),威利:威利奇切斯特·Zbl 0796.6202号
[37] Devroye,L.公司。;Györfi,L。;Lugosi,G.,模式识别的概率理论(1996),Springer:Springer纽约·Zbl 0853.68150号
[38] Haussler,D.,具有有界Vapnik-Chervonenkis维数的布尔超立方体子集的球面包装数,J.Combin.理论A,69,217(1995)·兹比尔0818.60005
[39] 李,M。;Vitányi,P.M.B.,归纳推理和Kolmogorov复杂性,J.Compute。系统。科学。,44, 343 (1992) ·Zbl 0755.68079号
[40] 梅尔,R。;Merhav,N.,《关于学习可实现和不可实现规则的随机复杂性》,《机器学习》。,19, 241 (1995) ·Zbl 0830.68109号
[41] Opper,M。;Haussler,D.,监督学习统计力学中预测误差的界限,物理学。修订稿。,75, 3772 (1995)
[42] Ripley,B.D.,模式识别和神经网络(1996),剑桥大学:剑桥大学·Zbl 0853.62046号
[43] Cheeseman,P.,《计算机理解探究》,《计算机》。智力。,4, 58 (1988)
[44] Heckerman,D.,《信念更新的公理框架》(Lemmer,J.F.;Kanal,L.N.,Uncert.Artific.Intell.,vol.2(1988),Elsevier:Elsevier New York),第11页·兹比尔0649.68093
[45] 巴尔迪,P。;Brunak,S.,《生物信息学》。《机器学习方法》(1998),麻省理工学院:麻省理学院剑桥分校·Zbl 0992.92024号
[46] Fortuner,R.,《系统生物学的计算机方法进展:人工智能、数据库、计算机视觉》(1993年),约翰·霍普金斯大学:巴尔的摩约翰·霍普金斯大学·Zbl 0850.92002号
[47] Zabell,S.L.,《继承规则》,埃尔肯尼斯,31283(1989)
[48] Pitman,J.,可交换和部分可交换随机分区,Probab。理论关联。菲尔德,102145(1995)·Zbl 0821.60047号
[49] Zabell,S.L.,《预测不可预测性》,Synthese,90,205(1992)·Zbl 0757.62006号
[50] Baron,E.J。;彼得森,L.R。;Finegold,S.M.,Bailey and Scott’S Diagnostic Microbiology,第9版(1994),莫斯比:密苏里州莫斯比圣路易斯
[51] Lindley,D.V.,《贝叶斯方法》,Scand。J.Stat.,9,45(1978)·Zbl 0432.62003号
[52] Lindley,D.V。;Novick,M.R.,《可交换性在推理中的作用》,《Ann.Stat.》,9,45(1981)·Zbl 0473.62005号
[53] 希尔,B.M。;莱恩,D。;Sudderth,W.,可交换的Urn过程,年鉴Probab。,15, 1586 (1987) ·Zbl 0629.60044号
[54] Johnson,W.E.,《概率:演绎和归纳问题》,Mind XLI,164,27(1932)·Zbl 0005.25401号
[55] Good,I.J.,《多项式分布的贝叶斯显著性检验》,J.Royal Stat.Soc.Ser。B、 29399(1967)·Zbl 0162.21701号
[56] Zabell,S.L.,W.E.Johnson的“充分性”假设,《美国统计年鉴》,第10卷,第1091页(1982年)·Zbl 0512.62007号
[57] Schervish,M.J.,《统计学理论》(1995),Springer:Springer New York·Zbl 0834.62002号
[58] Wilks,S.S.,《数理统计》(1962年),Wiley:Wiley纽约·Zbl 0173.45805号
[59] Kingman,J.F.C.,随机离散分布,J.Royal Stat.Soc.B,37,1(1975)·Zbl 0331.62019号
[60] Good,I.J.,《概率估计》(1965年),麻省理工学院:麻省理学院剑桥分校·Zbl 0168.39603号
[61] Dawid,A.P.,《序贯分析、随机复杂性和贝叶斯推断》(Prequential analysis,random complexity and Bayesian inference),(Bernardo,J.M.;Berger,J.O.;Dawid;Smith,A.F.M.,Bayesia Statistics,vol.4(1992),牛津大学:牛津大学),第109页·Zbl 0800.62028号
[62] Rissanen,J.,随机复杂性(带讨论),J.Royal Stat.Soc.B,49223(1987)·Zbl 0654.62008号
[63] Gyllenberg,M。;Koski,T。;Verlaan,M.,《二元向量的随机复杂性分类》,J.Multivar。分析。,63, 47 (1997) ·Zbl 1090.62542号
[64] Gyllenberg,H.G。;Gyllenberg,M。;Koski,T。;Lund,T。;辛德勒,J。;Verlaan,M.,通过最小化随机复杂性对肠杆菌科进行分类,微生物学,143,721(1997)
[65] Gyllenberg,H.G。;Gyllenberg,M。;Koski,T。;Lund,T.,作为分类工具的随机复杂性,计算。方法。生物识别程序。,56,11(1998年)
[66] Gyllenberg,H.G。;Gyllenberg,M。;Koski,T.,《微生物分类学意义:将随机复杂性最小化作为一种客观分类工具》,《最新研究进展》。微生物。,5, 211 (2001)
[67] Gyllenberg,H.G。;Gyllenberg,M。;Koski,T。;Lund,T。;Schindler,J.,通过最小化随机复杂性实现肠杆菌科分类,Quant。微生物。,1, 157 (1999)
[68] Rissanen,J.,Fisher信息和随机复杂性,IEEE Trans。信息。理论,42,40(1996)·Zbl 0856.94006号
[69] Rissanen,J.,随机复杂性与学习,J.计算机系统。科学。,55, 89 (1997) ·Zbl 0887.68039号
[70] Davidson,L.D.,《通用无噪声编码》,IEEE Trans。信息。理论,IT-19783(1973)·Zbl 0283.94005号
[71] Gilbert,E.N.,《基于不准确信源概率的代码》,IEEE Trans。信息。理论,IT-18304(1971)·Zbl 0222.94018号
[72] Krichevsky,R.E。;Trofimov,V.K.,《通用编码的性能》,IEEE Trans。信息。理论,IT-27199(1981)·Zbl 0469.94004号
[73] 克拉克,B.S。;Barron,A.R.,Jeffreys先验在熵风险下渐近最不利,J.Stat.Plan。推断。,41, 37 (1994) ·Zbl 0820.62006号
[74] E.S.Ristad,《继承的自然法则》,研究报告,普林斯顿大学计算机科学系CS-TR 496-95,1995年;E.S.Ristad,《继承的自然法则》,研究报告,普林斯顿大学计算机科学系CS-TR 496-95,1995年
[75] Geisser,S.,《预测性歧视》(Krishnaiah,P.R.,多元分析,1966年),学术出版社:纽约学术出版社,第149页·兹标0216.48001
[76] Bahadur,R.R.,《n个二分项目反应的联合分布表示法》(Solomon,H.,项目分析和预测研究(1961),斯坦福大学:斯坦福大学),第158页·Zbl 0103.36701号
[77] Sneath,P.H.A.,《试验再现性》,国际期刊系统。细菌学。,24, 508 (1974)
[78] Gyllenberg,M。;Gyllenberg,H.G。;Koski,T。;Schindler,J.,《数值分类结构的非唯一性》,Binary,5,138(1993)
[79] D.J.Aldous,可交换性和相关主题,收录于:P.L.Hennequin(编辑),Es cole D’ete de probabilityés de Saint-Flour,XIII-1983,数学课堂笔记,1117,Springer,Berlin,1985,第1页;D.J.Aldous,可交换性和相关主题,收录于:P.L.Hennequin(编辑),Es cole D’ete de probabilityés de Saint-Flour,XIII-1983,数学课堂讲稿,1117,Springer,Berlin,1985,第1页·Zbl 0549.00022号
[80] Olshen,R.,关于可交换序列的注记,Z.Wahrscheinlichkeits theori.verwandte Geb。,28, 317 (1974) ·兹比尔0265.60006
[81] Kingman,J.F.C.,《互换性的使用》,Ann.Probab。,6, 183 (1978) ·Zbl 0374.60064号
[82] Glick,N.,概率估计和密度估计积分的一致性条件,Util。马瑟马特。,6, 61 (1974) ·Zbl 0295.62045号
[83] Pearson,K.,《实用统计学的基本问题》,《生物统计学》,13,1(1920)
[84] Farmer III,J.J。;B.R.戴维斯。;希克曼·布伦纳(F.W.Hickman-Brenner)。;麦克沃特,A。;亨特利·卡特,G.P。;硕士阿斯伯里。;Riddle,C。;Wathen-Grady,H.G。;Elias,C。;范宁,G.R。;斯泰格沃特,A.G。;O'Hara,C.M。;莫里斯,G.K。;史密斯,P.B。;Brenner,D.J.,从临床标本中分离的肠杆菌科新物种和生物群的生化鉴定,J.Clinic。微生物。,21, 46 (1985)
[85] Hintikka,J.,《未知概率、贝叶斯主义和德菲内蒂表示定理》,波士顿哲学研究所。科学。,八、 325(1971)
[86] Dawid,A.P.,《统计理论中的条件独立性》,J.Royal Stat.Soc.B,41,1(1979)·Zbl 0408.62004号
[87] Berger,S.A.,《商业识别系统缺乏准确性:使用贝叶斯分析进行修正》,J.Appl。细菌学。,68, 285 (1990)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。