×

查询近似的贝叶斯方法。 (英文) Zbl 1511.62457号

摘要:本研究提出了统计技术,以获得聚合多元物化视图的局部近似查询答案,从而消除了重复扫描源数据的需要。在广泛分布的管理信息系统中,详细数据不一定与决策者位于同一物理位置;因此,需要根据查询需求扫描源数据。决策、商业智能和数据分析可能涉及多个数据源、数据多样性、聚合和大量数据。管理层经常面临从远程站点获取信息的延迟。管理决策通常涉及需要最准确的可用汇总数据的分析。这些摘要可从数据仓库中随时获得,并可用于估计或近似数据,以换取更快的响应。提出了一种支持聚集物化视图管理的方法,该方法在具有多项式似然的对数线性模型中基于充分统计的后验参数估计局部重建数据集。

MSC公司:

第60页 统计学在工程和工业中的应用;控制图
2015年1月62日 贝叶斯推断
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Acharya,S.、Gibbons,P.B.、Poosala,V.和Ramaswamy,S..加入近似查询回答的摘要。论文发表于1999年ACM SIGMOD国际数据管理会议。宾夕法尼亚州费城
[2] Agresti,A.1990年。分类数据分析,纽约:威利·Zbl 0716.62001号
[3] Barbará,D.,DuMouchel,W.,Faloutsos,C.,Haas,P.J.,Hellerstein,J.M.,Ioanidis,Y.,Jagadish,H.V.,Johnson,T.,Ng,R.,Poosala,V.,Ross,K.A.和Sevcik,K.C.,1997年。新泽西州数据缩减报告。牛市。技术通信数据工程, 20: 3-45.
[4] Barbará,D.和Sullivan,M.1998年。“准立方体:支持近似多维数据库的一种节省空间的方法”。弗吉尼亚州费尔法克斯:乔治·梅森大学信息技术与工程学院。技术代表编号:ISSE-TR-98-03
[5] Barbará,D.和Wu,X.,2001年。基于对数线性的准立方体。J.智力。信息系统, 16: 255-276. ·Zbl 0994.68058号 ·doi:10.1023/A:1011224019249
[6] Bishop,Y.M.M.、Fienberg,S.E.和Holland,P.W.1975年。离散多元分析:理论与实践马萨诸塞州剑桥:麻省理工学院出版社·Zbl 0332.62039号
[7] Carlin,B.P.和Louis,T.A.,2000年。数据分析的贝叶斯和经验贝叶斯方法2,纽约:查普曼和霍尔出版社·Zbl 1017.62005年 ·doi:10.1201/9781420057669
[8] Deming,W.E.和Stephan,F.F.1940年。当预期边际总和已知时,对采样频率表进行最小二乘调整。安。数学。统计师。, 11: 427-444. ·Zbl 0024.05502号 ·doi:10.1214/aoms/1177731829
[9] Faloutsos,C.、Jagadish,H.V.和Sidiropoulos,N.D.从汇总数据中恢复信息。在希腊雅典举行的第23届超大数据库国际会议上提交的论文。
[10] 费希尔,R.B。核密度估计器,CVonline可在http://homepages.inf.ed.ac.uk/rbf/COnline/LOCAL_COPIES/AV0405/MISHRA/kde.html(2008年7月15日访问)
[11] Gelman,A.、Carlin,J.B.、Stern,H.S.和Rubin,D.B.,1995年。贝叶斯数据分析纽约:Chapman&Hall/CRC。 ·doi:10.1201/9780429258411
[12] Geyer,C.J.1992年。实用马尔可夫链蒙特卡罗法。统计师。科学。, 7: 473-511. ·Zbl 0085.18501号 ·doi:10.1214/ss/117701137
[13] Geyer,C.J.和Thompson,E.A.1992年。相关数据的约束蒙特卡罗最大似然(带讨论)。J.罗伊。统计师。Soc.序列号。B(方法学), 54: 657-699.
[14] Gibbons,P.B.和Matias,Y。改进近似查询答案的新抽样汇总统计。1998年ACM SIGMOD国际数据管理会议上提交的论文。美国华盛顿州西雅图。
[15] Hellerstein,J.M.、Haas,P.J.和Wang,H.J.在线聚合。在ACM SIGMOD管理数据国际会议上提交的论文。美国亚利桑那州图森。
[16] Kennedy,P.1998年。计量经济学指南马萨诸塞州剑桥:麻省理工学院出版社。
[17] Palpanas,T.和Koudas,N.基于熵的数据立方体近似查询和探索。在第十三届国际科学和统计数据库管理会议记录上提交的论文。美国弗吉尼亚州费尔法克斯:乔治·梅森大学。
[18] Raftery,A.E.和Lewis,S.吉布斯采样器中有多少次迭代?。在巴伦西亚贝叶斯统计国际会议上提交的论文。西班牙巴伦西亚。
[19] Schafer,J.L.1997年。不完全多元数据分析,佛罗里达州博卡拉顿:查普曼和霍尔/CRC。 ·doi:10.1201/9781439821862
[20] 汤姆森,E.2002。OLAP解决方案:构建多维信息系统2,纽约:威利。
[21] B.A.Wichmann和I.D.Hill,1982年。算法AS 183:一种高效的便携式伪随机数生成器。申请。统计师。, 31: 188-190. ·doi:10.2307/2347988
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。