×

开放世界概率数据库:语义、算法、复杂性。 (英语) Zbl 1519.68068号

摘要:大规模概率知识库在学术界和工业界越来越重要。它们不断被新数据扩展,这些数据由现代信息提取工具提供支持,这些工具将概率与知识库事实相关联。存储和处理此类数据的最新技术建立在概率数据库上。然而,许多基于概率数据库的系统仍然存在某些语义缺陷,这限制了它们的潜在应用。我们重新审视了概率数据库的语义,并认为封闭世界假设概率数据库,即假设数据库中未出现的事实具有概率与大规模概率知识库的日常使用相冲突。为了解决这一差异,我们建议开放世界概率数据库作为一种新的概率数据模型。在这个新的数据模型中,未知事实的概率,也称为公开的事实,可以从默认概率区间中分配任何概率值。我们的分析需要我们的模型与许多现实世界的任务更好地结合,例如问答,关系学习,知识库完成、和规则挖掘我们做出了各种技术贡献。我们证明了数据复杂性二分法在多项式时间和之间,为了评估概率数据库上的联合查询,可以将其提升到我们的开放世界模型中。这个结果得到了一个计算所谓的安全的高效查询。基于该算法,我们证明了评估安全查询是在线性时间对于概率数据库,在合理的假设下。在开放世界概率数据库中,对于更受限制的安全查询类,这一点仍然适用。我们将数据复杂性分析扩展到联合查询之外,并获得了经典和开放世界概率数据库的大量复杂性结果。我们通过深入调查组合复杂性在各个模型中。

MSC公司:

第68页,共15页 数据库理论
68立方英尺 知识表示
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] 米切尔,T。;科恩,W。;赫鲁晓卡,E。;Talukdar,P。;Betteridge,J。;卡尔森,A。;Dalvi,B。;加德纳,M。;基西尔,B。;克里希纳穆尔西,J。;老挝,N。;Mazaitis,K。;Mohamed,T。;Nakashole,N。;Platanios,E。;里特,A。;萨马迪,M。;沉降,B。;王,R。;维贾亚,D。;古普塔,A。;陈,X。;Saparov,A。;格里夫斯,M。;Welling,J.,《永无止境的学习》,(第29届AAAI人工智能会议论文集(AAAI-15)(2015),AAAI出版社),2302-2310
[2] Shin,J。;Wu,S。;Wang,F。;德萨,C。;张,C。;Ré,C.,《使用深度挖掘的增量知识库构建》,Proc。荷兰VLDB。,8, 11, 1310-1321 (2015)
[3] Fader,A。;Soderland,S。;Etzioni,O.,《识别开放信息提取的关系》,(自然语言处理经验方法会议论文集(EMNLP-11)(2011),计算语言学协会),1535-1545
[4] 霍法特,J。;Suchanek,F.M。;小檗属,K。;Weikum,G.,Yago2:来自维基百科的空间和时间增强的知识库,Artif。智力。,194, 28-61 (2013) ·Zbl 1270.68303号
[5] Wu,W。;李,H。;Wang,H。;Zhu,K.Q.,Probase:文本理解的概率分类法,(2012年ACM SIGMOD国际数据管理会议论文集(2012),计算机协会),481-492
[6] Dong,X。;加布里洛维奇,E。;海茨,G。;霍恩,W。;老挝,N。;墨菲,K。;斯特罗曼,T。;Sun,S。;Zhang,W.,《知识库:概率知识融合的网络规模方法》,(第20届ACM SIGKDD国际知识发现和数据挖掘会议论文集(2014),计算机械协会),601-610
[7] Ku,J.P。;希克斯,J.L。;哈斯蒂,T。;Leskovec,J。;Ré,C。;Delp,S.L.,《动员中心:NIH大数据到知识中心,以推进人类运动研究和提高流动性》,J.Am.Med.Inform。协会,2211120-1125(2015)
[8] 彼得斯,S.E。;张,C。;利夫尼,M。;Ré,C.,用于组装合成古生物数据库的机器读取系统,《公共科学图书馆·综合》,第9期,第12期(2014年)
[9] 明茨,M。;比尔,S。;斯诺,R。;Jurafsky,D.,《无标记数据关系提取的远程监督》,(美国计算语言学协会第47届ACL年会和第4届AFNLP自然语言处理国际联合会议论文集(2009)),1003-1011
[10] Bordes,A。;韦斯顿,J。;科洛伯特,R。;Bengio,Y.,《知识库的学习结构化嵌入》(Burgard,W.;Roth,D.,《第25届AAAI人工智能会议论文集》(AAAI-11)(2011),AAAI出版社),301-306
[11] Socher,R。;陈,D。;曼宁,C.D。;Ng,A.,用神经张量网络进行推理以完成知识库,(第26届神经信息处理系统国际会议论文集(2013),Curran Associates,Inc.),926-934
[12] Wang,W.Y。;Mazaitis,K。;Cohen,W.W.,《使用个性化pagerank进行编程:一种本地可依据的一阶概率逻辑》,(第22届ACM信息与知识管理国际会议论文集(CIKM-13)(2013),计算机协会),2129-2138
[13] De Raedt,L。;德里斯,A。;Thon,I。;Van den Broeck,G。;韦贝克,M.,《从概率示例中归纳概率关系规则》,(《第24届国际人工智能联合会议论文集》(IJCAI-15)(2015),AAAI出版社),1835-1843
[14] 苏秋(D.Suciu)。;奥尔特阿努,D。;Ré,C。;Koch,C.,《概率数据库》,第3卷(2011年),Morgan&Claypool出版社·Zbl 1237.68012号
[15] Galárraga,L。;拉兹涅夫斯基,S。;阿马里利,A。;Suchanek,F.M.,预测知识库的完整性,(第十届ACM网络搜索和数据挖掘国际会议论文集(WSDM-17)(2017),计算机械协会),375-383
[16] Reiter,R.,《封闭世界数据库》,55-76(1978),美国施普林格出版社
[17] Bishop,C.M.,模式识别和机器学习(2006),Springer-Verlag·Zbl 1107.68072号
[18] 列维,I.,《知识的企业:关于知识、诚信概率和机会的论文》(1980),麻省理工学院出版社
[19] 伊利诺伊州塞兰。;Darwiche,A。;Van den Broeck,G.,《开放世界概率数据库》(《第十五届知识表示与推理原则国际会议论文集》(KR-16)(2016),AAAI出版社),339-348
[20] 伊利诺伊州塞兰。;达尔文,A。;Van den Broeck,G.,《开放世界概率数据库:简略报告》,(第26届国际人工智能联合会议(IJCAI-17)(2017)),4796-4800
[21] 伊利诺伊州塞兰。,概率数据和知识库中的问答(2017),德累斯顿大学博士论文
[22] Hinrichs,T。;Genesereth,M.,Herbrand logic(2006),斯坦福大学,技术代表LG-2006-02
[23] Codd,E.F.,《数据库子语言的关系完整性》(1972),IBM Corporation
[24] (Abiteboul,S.;Hull,R.;Vianu,V.,《数据库基础:逻辑层》(1995),Addison-Wesley Longman Publishing Co.,Inc.)·Zbl 0848.68031号
[25] Libkin,L.,《有限模型理论的要素》(2004),Springer-Verlag·Zbl 1060.03002号
[26] Sipser,M.,《计算理论导论》(1996),国际汤姆森出版社
[27] Valiant,L.G.,计算永久性的复杂性,Theor。计算。科学。,8, 2, 189-201 (1979) ·Zbl 0415.68008号
[28] Gill,J.T.,概率图灵机的计算复杂性,SIAM J.Compute。,6,4675-695(1977年)·Zbl 0366.02024号
[29] 利特曼,M.L。;Majercik,S.M。;Pitassi,T.,随机布尔可满足性,J.自动机。原因。,27, 3, 251-296 (2001) ·Zbl 0988.68189号
[30] 贝格尔,R。;莱因戈尔德,N。;Spielman,D.,PP在交叉点下闭合,J.Compute。系统。科学。,50, 2, 191-202 (1995) ·Zbl 0827.68040号
[31] 托达,S。;Watanabe,O.,多项式时间1-Turing从#PH减少到#P,Theor。计算。科学。,100, 1, 205-221 (1992) ·Zbl 0779.68037号
[32] Toda,S.,《关于pp和+p的计算能力》,(第30届计算机科学基础年会论文集(1989)),514-519
[33] Wagner,K.W.,《具有简洁输入表示的组合问题的复杂性》,《信息学报》。,23, 3, 325-356 (1986) ·Zbl 0621.68032号
[34] 利特曼,M.L。;戈德史密斯,J。;Mundhenk,M.,《概率规划的计算复杂性》,J.Artif。智力。决议,9,1-36(1998年)·Zbl 0903.68100号
[35] Park,J.D。;Darwiche,A.,MAP解释的复杂性结果和近似策略,J.Artif。智力。第21号、第1号、第101-133号决议(2004年)·Zbl 1080.68689号
[36] Cook,S.A.,定理证明过程的复杂性,(第三届美国计算机学会计算理论年度研讨会论文集(STOC-71)(1971年),计算机械协会),151-158·Zbl 0253.68020号
[37] Vardi,M.Y.,关系查询语言的复杂性,(Lewis,H.R.;Simons,B.B.;Burkhard,W.A.;Landweber,L.H.,第14届ACM计算理论研讨会论文集(STOC-82)(1982),计算机协会),137-146
[38] Van den Broeck,G。;Suciu,D.,《概率数据的查询处理:一项调查》,Found。趋势®数据库,7,3/4,197-341(2017)·Zbl 1373.68014号
[39] 格里布科夫,E。;Suciu,D.,SlimShot:知识库的数据库内概率推理,Proc。荷兰VLDB。,9, 7, 552-563 (2016)
[40] 博格沃德,S。;伊利诺伊州塞兰。;Lukasiewicz,T.,基于对数线性概率数据的Ontology-mediated查询应答,(第33届AAAI人工智能会议论文集(AAAI-19)(2019)),2711-2718
[41] Sato,T.,《具有分布语义的逻辑程序的统计学习方法》,(第十二届逻辑程序设计国际会议论文集(ICLP-95)(1995),麻省理工学院出版社),715-729
[42] Poole,D.,《不确定性下多个代理建模的独立选择逻辑》,Artif。智力。,94,1-2,7-56(1997)·Zbl 0902.03017号
[43] De Raedt,L。;Kimmig,A。;Toivonen,H.,ProbLog:概率序言及其在链路发现中的应用,(第20届国际人工智能联合会议论文集(IJCAI-07)(2007),Morgan Kaufmann),2468-2473
[44] 萨顿,C。;McCallum,A.,《条件随机场导论》,马赫。学习。,4, 4, 267-373 (2011) ·Zbl 1253.68001号
[45] 洛杉矶加拉拉加。;特弗卢迪,C。;软管,K。;Suchanek Amie,F.,本体知识库中不完全证据下的关联规则挖掘,(第22届万维网国际会议论文集(WWW-13)(2013),计算机协会),413-422
[46] Munroe,R.,谷歌穿孔卡片数据中心(2015)
[47] Halpern,J.Y.,《关于不确定性的推理》(2003),麻省理工学院出版社·Zbl 1090.68105号
[48] Cozman,F.G.,Credal networks,Artif。智力。,120,2199-233(2000年)·Zbl 0945.68163号
[49] Reiter,R.,默认推理逻辑,Artif。智力。,13, 1, 81-132 (1980) ·Zbl 0435.68069号
[50] Dalvi,N。;Suciu,D.,合取查询联合的概率推理二分法,J.ACM,59,6,1-87(2012)·Zbl 1281.68095号
[51] Dalvi,N。;Suciu,D.,概率数据库的高效查询评估,VLDB J.,16,4,523-544(2007)
[52] 格里布科夫,E。;Van den Broeck,G。;Suciu,D.,《理解提升推理和非对称加权模型计数的复杂性》,(《第30届人工智能不确定性年会论文集》(UAI-14)(2014),美国人工智能出版社),280-289
[53] 萨吉夫,Y。;Yannakakis,M.,关系表达式与并和差算子的等价性,J.ACM,27,4,633-655(1980)·Zbl 0456.68123号
[54] De Campos,C.P。;Cozman,F.G.,《贝叶斯网络和信念网络的推理复杂性》,(第19届国际人工智能联合会议论文集(IJCAI-05)(2005)),1313-1318
[55] Darwiche,A.,《贝叶斯网络建模与推理》(2009),剑桥大学出版社·Zbl 1231.68003号
[56] 芬克·R。;Olteanu,D.,概率数据库中带否定查询的二分法,ACM Trans。数据库系统。,41, 1, 4:1-4:47 (2016) ·Zbl 1474.68098号
[57] 阿马里利,A。;莫奈,M。;Senellart,P.,概率图上的连接查询:组合复杂性,(第36届ACM SIGMOD-SIGACT-SIGAI数据库系统原理研讨会论文集(PODS-17)(2017),计算机协会),217-232
[58] Gottlob,G。;塞拉利昂,北。;Scarcello,F.,《非循环连接查询的复杂性》,J.ACM,48,3,431-498(2001)·Zbl 1323.68250号
[59] 伊米林斯基,T。;Lipski,W.,《关系数据库中的不完整信息》(Mylopolous,J.;Brodie,M.,《人工智能和数据库阅读》(1989),Morgan Kaufmann),342-360
[60] 富尔,N。;Rölleke,T.,信息检索和数据库系统集成的概率关系代数,ACM Trans。信息系统。,15, 1, 32-66 (1997)
[61] 博格沃德,S。;伊利诺伊州塞兰。;Lukasiewicz,T.,《查询概率知识库的最新进展》,(第27届国际人工智能联合会议论文集(IJCAI-18)(2018)),5420-5426
[62] Grädel,E。;古雷维奇,Y。;Hirsch,C.,查询可靠性的复杂性,(第17届ACM SIGMOD-SIGACT-SIGAI数据库系统原理研讨会论文集(PODS-98)(1998),计算机械协会),227-234
[63] 芬克·R。;奥尔特阿努,D。;Rath,S.,《在概率数据库中为全关系代数提供支持》,(第27届国际数据工程会议论文集(ICDE-11)(2011年),315-326
[64] 奥尔特阿努,D。;Huang,J.,使用obdds对概率数据库进行有效的查询评估,(第二届可扩展不确定性管理国际会议论文集(SUM-08)。《第二届可扩展不确定性管理国际会议论文集》(SUM-08),《计算机科学讲义》,第5291卷(2008年),施普林格出版社,326-340
[65] 奥尔特阿努,D。;Huang,J.,带不等式的联合查询的二级存储置信度计算,(2009年ACM SIGMOD国际数据管理会议论文集(2009年),计算机协会),389-402
[66] Ré,C。;Suciu,D.,《概率数据库查询的三分法》,VLDB J.,18,5,1091-1116(2009)
[67] 阿马里利,A。;伊利诺伊州塞兰。,概率图上同态闭查询的二分法,(Lutz,C.,第23届国际数据库理论会议论文集(ICDT-20)(2020),Schloss Dagstuhl-Leibniz Zentrum fuer Informatik)·Zbl 07650983号
[68] (Baader,F.;Calvanee,D.;McGuinness,D.;Nardi,D.;Patel-Schneider,P.F.,《描述逻辑手册:理论、实现和应用》(2007),剑桥大学出版社)·Zbl 1132.68055号
[69] 卡尔?,A。;Gottlob,G。;Lukasiewicz,T.,基于数据日志的通用框架,用于在本体上进行易处理的查询应答,J.Web Semant。,14, 57-83 (2012)
[70] Bienvenu,M。;Cate,B.T。;卢茨,C。;Wolter,F.,《基于本体论的数据访问:通过析取数据日志、csp和mmsnp进行的研究》,ACM Trans。数据库系统。,39, 4, 1-44 (2014) ·Zbl 1474.68082号
[71] Jung,J.C。;Lutz,C.,基于本体的概率数据访问与owl-ql,(第十一届语义网络国际会议论文集-第一卷(2012),Springer-Verlag),182-197
[72] 伊利诺伊州塞兰。;Peñaloza,R.,贝叶斯描述逻辑BEL中的概率查询回答,第九届可扩展不确定性管理国际会议论文集(SUM-15),第9310卷,21-35(2015),Springer-Verlag
[73] Gottlob,G。;卢卡塞维奇,T。;马丁内斯,M.V。;Simari,G.I.,《数据日志+/-本体论中概率不确定性下的查询应答》,《数学年鉴》。Artif公司。智力。,69, 1, 37-72 (2013) ·Zbl 1308.68113号
[74] 伊利诺伊州塞兰。;Lukasiewicz,T。;Peñaloza,R.,《概率数据日志的复杂性结果》,《第28届欧洲人工智能会议论文集》(ECAI-16),第285卷,第1414-1422页(2016年),IOS出版社·Zbl 1403.68050号
[75] 博格沃德,S。;伊利诺伊州塞兰。;Lukasiewicz,T.,以Ontology为中介的概率数据库查询,(第31届AAAI人工智能会议论文集(AAAI-17)(2017),AAAI出版社),1063-1069
[76] Poole,D.,一阶概率推断,(第18届国际人工智能联合会议论文集(IJCAI-03),第3卷(2003)),985-991
[77] Cozman,F.G。;Mauá,D.D.,《概率逻辑程序的语义和复杂性》,J.Artif。智力。决议,60,1,221-262(2017)·Zbl 1418.68027号
[78] 弗里德曼,T。;Van den Broeck,G.,《受限开放世界概率数据库》(第28届国际人工智能联合会议(IJCAI-19)(2019)),5722-5729
[79] 格罗,M。;Lindner,P.,无限开放世界假设下的概率数据库,(第38届ACM SIGMOD-SIGACT-SIGAI数据库系统原理研讨会论文集(PODS-19)(2019)),17-31
[80] 戈麦斯,C.P。;Sabharwal,A。;Selman,B.,模型计算,(《可满足性手册》(2009),IOS出版社)
[81] 查维拉,M。;Darwiche,A.,《通过加权模型计数进行概率推断》,Artif。智力。,172, 6-7, 772-799 (2008) ·Zbl 1182.68297号
[82] 卡多利,M。;Donini,F.,《知识汇编调查》,AI Commun。,10,3-4137-150(1997年)
[83] Darwiche,A。;Marquis,P.,《知识汇编地图》,J.Artif。智力。决议,17,1,229-264(2002)·Zbl 1045.68131号
[84] Jha,A。;Suciu,D.,知识汇编符合数据库理论:将查询汇编到决策图,理论计算。系统。,52, 3, 403-440 (2013) ·Zbl 1270.68297号
[85] 卡普·R·M。;鲁比,M。;Madras,N.,枚举问题的蒙特卡罗近似算法,J.algorithms,10,3,429-448(1989)·Zbl 0678.65001号
[86] Meel,K.S。;Shrotri,A.A。;Vardi,M.Y.,《基于散列的近似DNF计数方法》,(第37届IARCS软件技术和理论计算机科学基础年会论文集,(FSTTCS-17)(2017)),1-14·Zbl 1491.68193号
[87] Abboud,R。;伊利诺伊州塞兰。;Lukasiewicz,T.,《学习推理:利用神经网络进行DNF近似计数》,(第34届AAAI人工智能会议论文集(AAAI-20)(2020),AAAI出版社)
[88] 布洛斯,J。;Dalvi,N。;Mandhani,B。;马图尔,S。;Ré,C。;Suciu,D.,Mystiq:一个使用概率寻找更多答案的系统,(2005年ACM SIGMOD国际数据管理会议记录(2005),计算机协会),891-893
[89] 芬克·R。;Hogue,A。;奥尔特阿努,D。;Rath,S.,Sprout^2:不确定网络数据的平方查询引擎(2011),计算机协会,1299-1302
[90] 牛,F。;Ré,C。;Doan,A。;Shavlik,J.W.,Tuffy:使用RDBMS扩大马尔可夫逻辑网络中的统计推断,Proc。荷兰VLDB。,4, 6, 373-384 (2011)
[91] Tseitin,G.S.,《论命题演算中推导的复杂性》(1983),Springer-Verlag,466-483
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。