奥列格·塞莱兹涅夫;伯恩哈德·塔勒海姆 数据库问题的平均案例分析。 (英语) Zbl 1045.62124号 Methodol公司。计算。申请。普罗巴伯。 5,第4期,395-418(2003). 摘要:在从环境和健康科学到生物信息学的各种应用中,必须随机生成大型数据库中收集的数据。这为统计学和计算机科学提出了新的定性问题。也就是说,对于许多标准数据库问题,需要进行平均案例分析,而不是确定性(通常是最坏的情况)分析。由于同时使用了随机方法和确定性方法以及符号,这给此类问题的研究和结果的说明带来了额外的困难。我们考虑了一类通用的数据库概率模型,并在概率框架中研究了几个问题。为了演示通用方法,我们更详细地研究了数据库约束系统(密钥、功能依赖和相关)的问题。因此,我们的方法基于使用Rényi熵作为分布不确定性的主要特征和相应概率的泊松近似(Stein-Chen技术)。 引用于6文件 MSC公司: 62页99 统计学的应用 62B10型 信息论主题的统计学方面 94甲17 信息的度量,熵 关键词:随机数据库;测验;钥匙;极值;Rényi熵;泊松(斯坦因-陈)近似 PDF格式BibTeX公司 XML格式引用 \textit{O.Seleznjev}和\textit{B.Thalheim},Methodol。计算。申请。普罗巴伯。5,第4号,395--418(2003;Zbl 1045.62124) 全文: 内政部