$\开始组$

设$[n]:=\{1,\dots,n\}$和$0\leqp_n\leqn$。使用$p_n$元素修复$[n]$的任何子集$A_n$。$[n]$中具有$p_n$元素且与$A$不相交的子集$B$的数量是$\binom{n-p_n}{p_n}$,因此具有$p-n$元素且和$A$有非空交集的子集$B的数量由$\binom{n}给出{p_n}-\binom{n-pn}{pn}$,其渐近行为类似于$\binom{n}{pn{$if$\sqrt{n}\llpn$。精确地说:$$\lim_{n\to\infty}\frac{\binom{n}{序号}-\binom{n-pn}{pn}}{\binom{n}{pn{}}=\begin{案例}1&\text{if}\sqrt{n}\ll p_n\\0&\text{if}p_n\ll\sqrt{n}\\e^{-a^2}&\text{if}\lim_{n\to\infty}\frac{p_n}{\sqrt{n}}=a\end{cases}$$换言之,如果$p_n$的增长速度超过$\sqrt{n}$,则$[n]$与$p_n$elements的任何两个子集通常具有非空交集。

现在,如果$p_n$的增长速度比$\sqrt{n}$快,我对它们交集中的典型元素数感兴趣。我的感觉是,这个数字也会随着$n$而增长。确切地说,我相信(数字支持这一点),如果$q_n$的增长速度慢于$p_n/\sqrt{n}$,那么最终所有设置$A_n$、$B_n$的$p_n$元素每个都共享至少$q_n$elements。把它放在公式中,如果$A_n$是任何带有$p_n$元素的集合,那么$$\lim_{n\To\infty}\frac{\lvert\{B_n\subset[n]~\lvert~~\lvert B_n\lvert=p_n\text{和}\lvert A_n\cap B_n\lfert\geq q_n\}\rvert}{\binom{n}{p_n}=1$$

由于给定大小的$B_n$与一些固定集共享至少$q_n$个元素,因此没有确切的组合计数(仅根据广义超几何函数),我需要它的一些好的下界。有人见过这些渐近线吗?欢迎提供任何参考。

$\端组$
  • $\开始组$ 这些细节比我现在花的时间要长,但通过查看随机集和使用测量浓度,您应该能够得到一些参数范围的好答案。 $\端组$ 评论 2014年6月18日11:21
  • $\开始组$ 注意,在$j$元素中与$A$相交的集合$B$的数量是$\binom{p_n}{j}\binom}n-p_n}}{p_n-j}$。根据这个可以计算出你想要什么。交集中元素的数量近似分布,就像带有参数$p_n^2/n$的泊松随机变量。 $\端组$
    – 露西亚
    评论 2014年6月18日15:35
  • $\开始组$ 谢谢你的评论!我认为对于$\sum_{j=q_n}^{p_n}\binom{p_n{j}\binom{n-p_n}{p_nj}$?,没有一个简单的(没有超几何函数的)表达式?!我如何得到这个量的近似值?你能详细说明一下泊松分布是如何产生的吗? $\端组$
    – 为什么
    评论 2014年6月18日16:41

2个答案2

重置为默认值
4
$\开始组$

为了避免下标,我将只写$p$而不是$p_n$。我们假设$p$与$n$相比很小;当然要说3p<n$。给定基数$p$的$A$,大小为$p$且正好在$j$元素中与$A$相交的集合$B$的数量为$$ \binom{p}{j}\binom{n-p}{p-j}\le\frac{p^j}{j!}\Big(\frac}p}{n-2p}\Bigh)^j\binom}n-p}\le\ frac{1}{j。$$由于$(1-x)\lee^{-x}$,以上是$$ \le\frac{1}{j!}\Big(\frac{p^2}{n-2p}\Big)^j e ^{-p^2/n}\binom{n}{p}。$$ 因此,$B$与$A$正好在$j$元素中相交的概率最多为$$ \frac{1}{j!}\大(\frac{p^2}{n-2p}\大)^je^{-p^2/n}。\标记{1}$$ (事实上,在很大范围内,这本质上是一个渐近过程,因此交集中的元素数本质上是带有参数$p^2/n$的泊松。)

但我们可以继续使用实际的不等式,而不是渐近的。考虑交叉口大小最多为$J$的概率(并假设$J\le p^2/(n-2p)$)。通过(1),该概率为$$ \lee^{-p^2/n}\sum_{j=0}^{j}\frac{1}{j!}\Big(\frac{p^2}{n-2p}\Bing)^j。$$对于任何$\alpha>0$,上述值为(因为$e^{\alpha(J-J)}\ge 1$代表$J\le J$,否则为非负值)$$ \lee^{-p^2/n}\sum_{j=0}^{\infty}e^{\alpha(j-j)}\frac{1}{j!}\Big(\frac}p^2}{n-2p}\ Big)^j=e^{/p^2/n{\exp\Big。$$选择最佳的$\alpha$,使$J=e^{-\alpha}(p^2/(n-2p))$,从而使上述估计变为$$ \lee^{-p^2/n}\exp\Big(J\大(1+\log\frac{p^2}{J(n-2p)}\大)\Big)。$$这是一个完全明确的界限,例如,表明交集最多为$p^2/(e(n-2p))$的概率最多为$$ \exp\Big(-\frac{p^2}{n}+\frac}2}{e}\frac[2}{n-2p}\Big)。$$ 显然,如果$p^2/n$较大,则此值很小,但与$n$相比,$p$较小。

$\端组$
2
$\开始组$

问题陈述与超几何分布的定义完全对应。有了这个关键词,很容易找到大量文献。从开始维基百科关于均值、方差、正态近似等基本内容。约翰逊、科茨和坎普的《单变量离散分布》一书包含了更多内容。最近漂亮的纸马修·斯卡拉对尾部不平等进行了调查。

$\端组$

你的答案

单击“发布您的答案”,表示您同意我们的服务条款并确认您已阅读我们的隐私政策.

不是你想要的答案吗?浏览标记的其他问题问你自己的问题.