连续随机变量样本范围的分布

正在初始化实时版本

下载到桌面

让, …,是来自连续分布的随机样本。让和是样本中最小和最大的值。样本范围是，即最大值和最小值之间的差值。样本范围是对样本变化的粗略测量。此演示显示了从一些已知的连续分布中提取样本时样本范围的分布。

贡献者：Heikki Ruskeepää （2014年6月）
开放内容授权于抄送BY-NC-SA

快照

细节

快照1：样本取自标准均匀分布；蓝线是均匀分布的概率分布函数（PDF）。每个红色曲线都是一个样本范围的PDF：当只有两个观测值时，暗红色曲线是样本范围的PDF。当有3到10个观察值时，浅红色曲线是样本范围的PDF。绿色垂直线是按照深红色PDF的预期绘制的。当均匀分布有两个观测值时，样本范围呈现接近零的小值，概率高于接近一的大值；期望是。对于三个观测值的样本，范围具有较高概率的中间值；期望是。对于四个观测值的样本，范围的期望值为。平均而言，观察次数越多，样本范围的值就越大。例如，对于10个观察值的样本，样本范围很有可能从间隔中获取值，例如，; 期望是.

快照2：样本取自平均值为1的指数分布。两次观测的样本范围分布与原始指数分布相同（蓝线位于暗红色曲线后面）。对于10个观测值的样本，样本范围很有可能采用的值来自于，例如，; 预期为2.83。

快照3：样本来自标准正态分布。两次观测的样本范围分布具有很高的概率值，例如，; 预期为1.13。对于10个观测值的样本，样本范围很有可能采用的值来自于，例如，; 预期为3.08。

演示中考虑的分布如下（如下数学软件输入）：

均匀分布[{0,1}] 贝塔分布[2,1] 指数分布[1] 伽马分布[2,1] 正态分布[0,1] 物流配送[0,1] 极值分布[0,1]

假设样本变量的累积分布函数（CDF）和概率密度函数（PDF）是和分别为。样本范围的CDF对于大小的样本是[1，第31页]

该公式用于推导演示中的CDF（变量代码中）。PDF（变量（代码中）是通过区分CDF得出的。然而，对于正态分布无法计算，因此我们使用插值函数近似样本范围的CDF(函数插值). 然后通过微分插值函数计算PDF；演示代码包含InputForm中生成的插值函数。

期望值是以通常的方式精确计算的（精确值可以从代码中找到；在演示中，我们只显示十进制值）。然而，对于正态分布的期望值，我们只使用插值函数和N集成.

参考

[1] B.C.Arnold、N.Balakrishnan和H.N.Nagaraja，订单统计第一课程，费城：SIAM，2008年。

永久引文

Heikki Ruskeepää “连续随机变量样本范围的分布”
http://demonstrations.wolfram.com/DistributionOfTheSampleRangeOfContinuousRandomVariables/
Wolfram示范项目
发布日期：2014年6月24日


反馈（必填字段）

电子邮件（必填字段）	姓名

职业	组织

注意：您的信息和联系信息可能会与您提供反馈的任何特定演示的作者共享。发送

连续随机变量样本范围的分布

快照

细节

相关链接

永久引文