×

追踪概率真理:统计学习的逻辑。 (英语) Zbl 1529.03167号

小结:我们提出了一个新的模型来形成和修正关于未知概率的信念。超越已知,代表代理人信仰关于概率,我们考虑一个似然图,将每个可能的分布关联到似然排名。信仰在信仰修正理论中被定义为最可信世界中的真理(或者更广泛地说,所有可信世界中足够可信的真理)。我们考虑两种形式的条件反射或信念更新,对应于两类信息的获取:(1)学习从未知分布中重复采样获得的可观察证据;(2)学习关于分布的高阶信息。第一种方法只改变似然图(通过贝叶斯规则的“似然”版本),但使给定的一组可能的分布基本不变;第二种方法排除了一些分布,从而缩小了可能性集,而不改变其合理性排序。我们研究了在这两种学习类型下信念的稳定性,定义了两个相关的概念(安全信念和统计知识),以及对给定合理性模型逼真度的度量。我们证明了一些收敛结果,显示了代理的信念如何在重复采样后跟踪真实概率,以及她如何最终从某种意义上(统计)获得真实概率的知识。最后,我们勾勒出统计学习的动态多沙性逻辑的轮廓。

MSC公司:

03B48号 概率和归纳逻辑
03B42号 知识和信念的逻辑(包括信念变化)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 行政长官Alchourrón;Gärdefors,P。;Makinson,D.,《论理论变化的逻辑:部分满足收缩和修正函数》,《符号逻辑杂志》,50,510-530(1985)·Zbl 0578.03011号
[2] Al-Najjar,N.,《决策者作为统计学家:多样性、模糊性和学习》,《计量经济学》,第77、5、1339-1369页(2009年)·Zbl 1183.91030号
[3] Baltag,A.、Gierasimczuk,N.、ØzgüN,A.、Vargas Sandoval,A.L.和Smets,S.(2019b)。学习理论的动态逻辑。程序设计中的逻辑和代数方法杂志,109·Zbl 1435.68310号
[4] Baltag,A.、Gierasimczuk,N.和Smets,S.(2016年)。归纳问题的可解性:认知拓扑学研究。《理性与知识的理论方面第15次会议论文集》(TARK 2015),ENTCS 215,第81-98页·Zbl 1483.68367号
[5] Baltag,A.、Gierasimczuk,N.和Smets,S.(2019a)。通过信念修正追踪真相。Studia Logica,107,917-947·Zbl 1439.03039号
[6] 巴尔塔格,A。;Moss,LS,《认知程序的逻辑》,Synthese,139,2,165-224(2004)·Zbl 1100.03010号
[7] Baltag,A.、Moss,L.S.和Solecki,S.(1998年)。公开声明、常识和私人怀疑的逻辑。I.Gilboa(Ed.),《第七届理性与知识理论方面会议记录》(TARK 98),第43-56页·Zbl 1386.03019号
[8] Baltag,A.,Rafiee Rad,S.&Smets,S.(2019年)。学习概率:走向统计学习的逻辑。《第十七届理性与知识理论方面会议论文集》(TARK 17),EPTCS 297,第35-49页·Zbl 07450019号
[9] Baltag,A.和Renne,B.(2016年)。动态认识逻辑。斯坦福大学哲学百科全书。
[10] Baltag,A.和Smets,S.(2008a)。条件性强词夺理行动的逻辑。《逻辑与游戏文本》,游戏与互动新视角专刊(第4卷,第9-31页),阿姆斯特丹大学出版社·Zbl 1377.03006号
[11] Baltag,A.和Smets,S.(2008b)。动态交互信念修正的定性理论。《逻辑与游戏文本》(第3卷,第9-58页),阿姆斯特丹大学出版社·Zbl 1261.03077号
[12] Baltag,A.和Smets,S.(2008c)。概率动态信念修正。合成,165(2),179-202·Zbl 1169.03015号
[13] Board,O.,动态交互认识论,游戏与经济行为,49,49-80(2004)·Zbl 1068.91071号
[14] R.展位。;Meyer,T.,可接受和限制修订,《人工智能研究杂志》,26,127-151(2006)·Zbl 1182.68284号
[15] 布拉德利,R。;Drechsler,M.,《不确定性的类型》,Erkentnis,79,1225-1248(2014)
[16] 布拉德利,S。;Steele,K.,《不确定性、学习和膨胀的“问题”》,埃尔肯尼斯,79,1287-1303(2014)·Zbl 1329.03035号
[17] Cerreia-Vioglio,S。;马切罗尼,F。;Marinacci,M。;Montrucchio,L.,歧义与稳健统计,《经济学理论杂志》,148974-1049(2013)·Zbl 1285.91030号
[18] Chandler,J.,主观概率不需要很高,Erkenntnis,791273-1286(2014)·Zbl 1329.03036号
[19] Darwiche,A。;Pearl,J.,《论迭代信念修正的逻辑》,人工智能,89,1-2,1-29(1997)·Zbl 1018.03012号
[20] Denoeux,T.,使用模糊值信念结构对模糊信念进行建模,模糊集和系统,116,26167-199(2000)·Zbl 1054.68676号
[21] Doob,JL,什么是鞅?,《美国数学月刊》,78,451-462(1971)·Zbl 0215.25801号
[22] Earman,J.(1992)。贝叶斯或半身像:对贝叶斯确认理论的批判性检验,麻省理工学院出版社。
[23] 爱德华兹。;林德曼,R。;Savage,LJ,心理学研究的贝叶斯统计推断,《心理学评论》,70193-242(1963)·Zbl 0173.2004号
[24] Elkin,L。;Wheeler,G.,《通过不精确概率解决同行分歧》,Nous,52,2,260-278(2018)·Zbl 1436.03085号
[25] Gaifman,H.(2016)。高阶概率理论。H.Arlo-Costa、V.F.Hendricks和J.van Benthem(编辑),《形式认知学阅读》(第1卷,第91-106页),斯普林格出版社·Zbl 1384.03113号
[26] Gaifman,H。;Snir,M.,《富语的概率》,《符号逻辑杂志》,47495-548(1982)·Zbl 0501.60006号
[27] 吉尔博亚,I。;Schmeidler,D.,具有非唯一先验的Maxmin期望效用,《数学经济学杂志》,第18期,第141-153页(1989年)·Zbl 0675.90012号
[28] Gold,EM,限额内的语言识别,信息与控制,10,5,447-474(1967)·Zbl 0259.68032号
[29] 格罗夫,A.,《理论变化的两种模型》,《哲学逻辑杂志》,第17、2、157-170页(1988年)·Zbl 0639.03025号
[30] Hájek,A.(2019年)。概率的解释。在斯坦福大学哲学百科全书中。
[31] 哈耶克,A。;Smithson,M.,《理性与不确定性概率》,Synthese,187,33-48(2012)·Zbl 1275.91023号
[32] Halpern,JY,《关于不确定性的推理》(2003),马萨诸塞州剑桥:麻省理工学院出版社·兹比尔1090.68105
[33] PJ Huber;斯特拉森,V.,容量的最小极大检验和内曼-皮尔逊引理,《统计年鉴》,1251-263(1973)·Zbl 0259.62008年
[34] Hunter,J.K.(2012)。真正的肛门介绍ysishttps://www.math.ucdavis.edu/亨特/m125a/intro_analysis.pdf。
[35] Huntley,N.、Hable,R.和Troffaes,M.(2014)。决策。在T.Augustin、F.P.A.Coolen、G.de Cooman和M.C.M.Troffaes(编辑)《不精确概率导论》中·Zbl 1298.91075号
[36] Kelly,K.T.(1998)。信念修正的学习力。在《TARK’98:理性和知识的理论方面第七次会议论文集》(第111-124页)中,摩根·考夫曼出版社。
[37] Kelly、KT、Ockham剃刀、真相和信息。《信息哲学手册》,多德雷赫特(2008),阿姆斯特丹:爱思唯尔出版社
[38] Kelly,K.T.(2014)。归纳经验知识的计算学习语义。A.Baltag&S.Smets(编辑),《对逻辑的杰出贡献:约翰·范·本特姆关于逻辑和信息动力学》(第5卷,第289-338页),斯普林格·Zbl 1408.03010号
[39] Kelly,K.T.、Schulte,O.和Hendricks,V.(1995)。可靠信念修正。《第十届国际逻辑、方法论和科学哲学大会论文集》(第383-398页),Kluwer学术出版社·Zbl 0899.03008号
[40] 克利巴诺夫,P。;Marinacci,M。;Mukerji,S.,《模糊性下决策的平滑模型》,《计量经济学》,731849-1892(2005)·Zbl 1151.91372号
[41] 科尼奇尼,S。;Perez,RP,《迭代修订的框架》,《应用非经典逻辑杂志》,10,3-4,339-367(2000)·Zbl 1033.03506号
[42] Kuipers,TAF,什么更接近现实?《科学和人文哲学中的波兹南研究:真实性的方法游行》(1987年),阿姆斯特丹:罗德比
[43] Lehrer,K.,《知识理论》(1990),伦敦:劳特利奇出版社,伦敦
[44] Leitgeb,H.,《信念的稳定性》。《理性信念如何与概率相一致》(2017),牛津:牛津大学出版社,牛津
[45] 列维,I.,概率判断中的不确定性和不确定性,科学哲学,52,390-409(1985)
[46] Lewis,D.(2000年)。《反事实》,威利,1973年第1版,第2版。
[47] 梅奥·威尔逊,C。;惠勒,G.,《评分不精确的可信度:一个适度不礼貌的提议》,《哲学与现象学研究》,93,1,55-78(2016)
[48] Miller,D.,《波普尔的定性逼真理论》,《英国科学哲学杂志》,251661-177(1974)·Zbl 0377.02007
[49] AC Nayak,《基于认知巩固的反复信念改变》,Erkentnis,41353-390(1994)
[50] Niiniluoto,I.,Truthlikeness(1987),《多德雷赫特:雷德尔,多德雷希特》
[51] 尼尼洛托,I.,《真实性:第三阶段》,《英国科学哲学杂志》,49,1,1-29(1998)·兹比尔0948.03507
[52] 巴黎,JB,《不确定推理者的伴侣:数学观点》(1994),剑桥:剑桥大学出版社,剑桥·Zbl 0838.68104号
[53] 巴黎,JB,《你所见即所得》,《熵》,16,6186-6194(2014)
[54] Paris,J.&Rad,S.R.(2008)。量化谓词知识的推理过程。W.Hodges&R.de Queiroz(编辑),《逻辑、语言、信息和计算》,Springer LNAI(第5110卷,第249-259页)·Zbl 1155.03301号
[55] Paris,J.&Rad,S.R.(2010年)。关于一个理论的信息最少的模型的注释。F.Ferreira、B.Lowe、E.Mayordomo和L.Mendes Gomes(编辑),《程序、证明、过程》,CiE 2010,Springer LNCS(第6158卷,第342-351页)·Zbl 1286.03090号
[56] 巴黎,JB;Vencovska,A.,为最大熵推理过程辩护,国际近似推理杂志,17,1,77-103(1997)·Zbl 0939.68118号
[57] 波普尔,KR,《逼真性注释》,《英国科学哲学杂志》,27,2,147-159(1976)·Zbl 0377.02010
[58] Rad,S.R.(2017)。一阶语言的模糊公理。Studia Logica,105(21)·Zbl 1417.03173号
[59] 罗梅因,J-W;Roy,O.,《激进的不确定性:超越信念的概率模型》,Erkentnis,79,6,1221-1223(2014)·Zbl 1329.03009号
[60] Rott,H.,《稳定性、力量和敏感性:将信念转化为知识》,Erkentnis,61,2-3,469-493(2004)·Zbl 1062.03506号
[61] Rudin,W.(1953年)。数学分析原理,McGraw-Hill公司·Zbl 0052.05301号
[62] 萨维奇,LJ,《统计学基础》(1954),纽约:威利,纽约·Zbl 0055.12604号
[63] Schmeidler,D.(1986)。无可加性的积分表示。美国数学学会学报,97(2)·Zbl 0687.28008号
[64] Schmeidler,D.,无可加性的主观概率和预期效用,计量经济学,57,3571-587(1989)·Zbl 0672.90011号
[65] Seidenfeld,T.,用于概率(凸)集的两种决策规则之间的对比:伽马最大值与E-可容许性,Synthese,140,69-88(2004)
[66] 塞登菲尔德,T。;MJ Schervish;Kadane,JB,不确定性下的相干选择函数,Synthese,172157-176(2010)·兹比尔1183.91037
[67] Skyrms,B.(2011年)。弹性、倾向和因果必然性。在A.Eagle(编辑),《概率哲学:当代阅读》,Routledge。
[68] 斯波恩,W.(2016)。排名理论综述。H.Arlo-Costa、V.F.Hendricks和J.van Benthem(编辑),《形式认知学阅读》(第1卷,第303-350页),斯普林格出版社·Zbl 1384.03108号
[69] Stalnaker,R.,《游戏中的知识、信念和反事实推理》,《经济学与哲学》,第12期,第133-163页(1996年)
[70] Tichy,P.,《论波普尔对逼真性的定义》,《英国科学哲学杂志》,25,2155-160(1974)·Zbl 0377.02005
[71] Troffesin,CM,《使用不精确概率进行不确定性决策》,《国际近似推理杂志》,45,17-29(2007)·Zbl 1119.91028号
[72] van Benthem,J.,信念修正的动态逻辑,应用非经典逻辑杂志,17,2,129-155(2007)·Zbl 1186.03033号
[73] van Benthem,J.,《信息和交互的逻辑动力学》(2011),剑桥:剑桥大学出版社,剑桥·兹比尔1251.03003
[74] van Ditmarsch,H。;范德霍克,W。;Kooi,B.,《动态认知逻辑》(2007),多德雷赫特:施普林格·Zbl 1156.03320号
[75] Walley,P.,《从多核数据推断:了解一袋弹珠》,《皇家统计学会期刊B辑》,58,3-57(1996)·Zbl 0834.62004号
[76] Walley,P.,《走向不精确概率的统一理论》,《国际近似推理杂志》,24,2,125-148(2000)·Zbl 1007.28015号
[77] Williamson,J.,《客观贝叶斯概率逻辑》,《认知、信息学和逻辑算法杂志》,63,167-183(2008)·Zbl 1151.03014号
[78] Williamson,J.,《为客观贝叶斯主义辩护》(2010),牛津:牛津大学出版社,牛津·Zbl 1196.00021号
[79] Williamson,J.(2013)。从贝叶斯认识论到归纳逻辑。应用逻辑杂志,2·Zbl 1284.03166号
[80] 威廉姆斯,J。;Robert,G.,《不确定性下的决策》,《哲学家的印象》,14,1-34(2014)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。