在这一节中,我们介绍了所提出的球面Dirichlet分布、其矩和基本性质。
概率密度函数与归一化常数
通过将单纯形上的Dirichlet分布变换到超球面上相应的空间,得到球面上的Dilichlet分布。在本节中,我们推导了密度,并计算了归一化常数。让年在单纯形上具有Ingram所描述的Dirichlet分布(奥尔金和鲁宾1964).
$$\开始{array}{*{20} 我}f_text{Dir}}(\mathbf{y};\alpha)&=\frac{\Gamma(\alpha_{0})}_{i} -1个}\\&=\frac{\Gamma(\alpha_{0})}{{\prod_{i=1}^{m}\Gamma_{i} -1个}\左(1-\sum{i=1}^{m-1}年_{i} \右)^{(\alpha_{m} -1个)}\结束{数组}$$
(1)
哪里
$$\开始{array}{*{20} 我}在\Re^{+}中的\alpha_{i},\;\;\alpha{0}=:{\sum{i=1}^{m}{\alpha{i}},\;\;0\leqq y_{i}\leqq1,\;\;\sum{i=1}^{m}{y{i}}=1,\end{array}$$
将Dirichlet分布从单纯形变换为超球面的正正值(图1)
求平方根变换
$$\开始{array}{*{20} 我}x{i}=\sqrt{y{i}},\;\;y{i}={x{i}}^{2},\;\;\frac{\部分y{i}}{\部分x{i}{=2x{i{,\text{for}\;\;i=1,。。。。(m-1),\;\;x{m}=\sqrt{y{m}}。\结束{数组}$$
(2)
计算所有自变量的雅可比矩阵,如下所示
$$J=\left | \begin{array}{ccccc}\frac{\partial y_{1}}{\partial x_{1}}=2x_{1}&\frac{\partial y_{1}}{\partial x_{2}}=0&0&\dots&\\frac{\partial y_{2}}{\partial x_{2}}=2x_{2}&0&\dots&\\hdots for{5}\\0&0&dots&\frac{\partial y_{m-1}}{\partial x_{m-1}}=2x_{m-1}\end{array}\右|=\prod_{i=1}^{m-1}{2x{i}}=2^{m-1'$$
提议的转换(1)中的个结果
$$\开始{array}{*{20} 我}f_{\text{SDir}}(\mathbf{x};\alpha)&=\frac{2^{m-1}\Gamma(\alpha_{0})}{\prod_{i=1}^{m}\Gamma({\alpha_a{i})_{i} -1个}\cdot x{m}^{2\alpha_{m} -2个}\\&=\frac{2^{m-1}\Gamma(\alpha{0})}{{\prod_{i=1}^{m}\Garma({\alpha_{i}){}}\prod\i=1}^{m{{x{i}}^{2\alpha_{i} -1个}\cdot x{m}^{-1}\\&=\frac{2^{m-1}\Gamma(\alpha{0})}{{\prod_{i=1}^{m}\Gama({\alpha_{i}){}\prod\i=1}^{m-1}{x{i}}^{2\alpha_{i} -1个}\左(1-\sum{i=1}^{m-1}x_{i} ^{2}\right)^{(\alpha_{m} -1个)}\结束{数组}$$
(3)
哪里
$$\开始{array}{*{20} 我}\alpha_{0}=:{\sum_{i=1}^{m}{\alpha{i}},\;\;\字母{i}\在\Re^{+}中,\;\;0\leqq x_{i}\leqq1,\;\;\和{i=1}^{m}{x{i}^{2}}=1。\结束{数组}$$
我们指的是(三)作为球形Dirichlet分布(SDD)并写入x个∼S公司D类D类(α我). 我们介绍参数α我作为浓度参数,其方式与Dirichlet分布的相应参数类似。
力矩
在本节中,我们计算一阶和二阶矩、模态、标准差、方差和协方差及其相应的协方差矩阵。首先,我们计算其中一个变量的期望值,例如,让我们考虑x个1
$$\开始{array}{*{20} 我}E(x{1})&=\int\dots\int\frac{2^{m-1}\Gamma(\alpha{0})}{{\prod_{i=1}^{m}\Gamma({\alpha_{i}){}x{1{左(\prod\i=1}^{m{{x{i}}^{2\alpha_{i} -1个}\右)\cdot x{m}^{-1}{\mathrm{d} x个_{1} }\点{\mathrm{d} x个_{m} }\结束{数组}$$
(4)
$$\开始{array}{*{20} 我}&=\int\dots\int\frac{2^{m-1}\Gamma(\alpha{0})}{{\prod_{i=1}^{m}\Gamma({\alpha_{i}){}}{x{1}}^{2(\alfa_{1}+\ frac{1}{2})-1}\left(\prod\i=2}^m}{x}{i}}}}^2\alpha_{i} -1个}\右)\cdot x{m}^{-1}{\mathrm{d} x个_{1} }\dots{\mathrm{d} x个_{m} },\结束{数组}$$
(5)
其中,我们将积分内的表达式识别为带有新第一个参数的拟议SDD的核心\(\α{1}+\压裂{1}{2}\),然后我们可以立即将此表达式重写为
$$\开始{array}{*{20} 我}E(x{1})&=\frac{2^{m-1}\Gamma(\alpha_{0})}{\prod_{i=1}^{m}\Garma(\alpha_{i}){\frac}\Gamma\ left(\alfa_{1}+\ frac{1}{2}\right)\prod\i=2}^{m}\Gamm(\alba_{i{)}}{2^}m}\Gamma\ left \压裂{1}{2}}\右)}}\\&=\压裂{\Gamma,\结束{数组}$$
(6)
我们定义μ我作为,
$$\开始{array}{*{20} 我}\mu{i}=:\frac{\Gamma\left(\alpha_{i}+\frac}1}{2}\right)}{\Garma(\alfa_{i{)},\end{array}$$
(7)
来自的期望值(6)可以重写为,
$$\开始{array}{*{20} 我}E(x{i})=\frac{\mu{i}}{\mu_{0}}。\结束{数组}$$
(8)
向量一阶矩的通解x个={x个1,....x个米}T型带参数向量α={α1,.....α米}T型可以写为
$$\开始{array}{*{20} 我}E(\mathbf{x})=\frac{\Gamma(\alpha_{0})}{\Garma(\alpha_{0}+\frac}1}{2}){\left(\frac[\Gamma\left)({\alpha_1}+\frac{1}{2\right)}{\ Gamma \右)}{\Gamma(\alpha_{m-1})}\右)=\frac{1}{\mu_{0}}\frac}\Gamma\左({\boldsymbol\alpha+\frac{1}{2}}\right)}{\伽玛(\boldsymbol\alpha)},\结束{数组}$$
(9)
让
$$\开始{array}{*{20} 我}\boldsymbol{\mu}=:\frac{\Gamma\left({\boldsymbol\alpha+\frac}{2}}\right)}{\Garma(\boldsimbol\alpha)},\quad C=:\frac{|{\bolsymbol{\mu{}|}{\mu_0}},\ quad\bar{\bodsymboldsyMBol{\mo}=:\frac{\boltsymbol{\mu}{|{条{\boldsymbol{\mu}}\在\Omega_{m-1}中,\end{array}$$
(10)
那么,向量的期望值x个也可以写成
$$\开始{array}{*{20} 我}E(\mathbf{x})=\frac{\boldsymbol{\mu}}{\mu_{0}}=\frac{|{\bodsymbol{\mu{}}|}{\mu_{0{}\cdot\frac}\boldsymbol{\ mu}}{|{\ boldsympol{\mo}}||}=C\cdot\tar{\bolsymboldsyMBol{\mu}}}。\结束{数组}$$
(11)
类似地,我们计算\(x{1}^{2}\)作为
$$\开始{array}{*{20} 我}E(x_{1}^{2})&=\int\dots\int\frac{2^{m-1}\Gamma(\alpha_{0})}{\prod_{i=1}^{m}\Gamma({\alpha_{i})}}x_{1}^{2}\left(\prod_{i=1}^{m}{x__{i} -1个}\右)\cdot x{m}^{-1}{\mathrm{d} x个_{1} }\点{\mathrm{d} x个_{m} }\结束{数组}$$
(12)
$$\开始{array}{*{20} 我}&=\frac{2^{m-1}\Gamma(\alpha{0})}{{\prod_{i=1}^{m}\Garma({\alpha_{i}){}}\int\dots\intx{1}^{2(\alfa_{1}+1)-1}}\left(\prod\i=2}^{ms}{x{i}^{2\alpha_{i} -1个}\右)\cdot x{m}^{-1}{\mathrm{d} x个_{1} }\点{\mathrm{d} x个_{m} },\结束{array}$$
(13)
同样,我们可以使用新的第一个参数将积分中的表达式识别为所建议SDD的核心α1+1,即产生
$$\开始{array}{*{20} 我}E(x{1}^{2})&=\frac{2^{m-1}\Gamma(\alpha{0})}{{\prod_{i=1}^{m}\Gamma({\alpha_{i}){}\frac}\Garma(\alpha_{1}+1)\prod\i=2}^{m-1}\Gamm(\alba_{i{)}}\\&=\frac{\Gamma(\alpha_{0})}{\Garma(\alpha_{0}+1$$
(14)
这个结果可以推广到
$$\开始{array}{*{20} 我}E(x{i}^{2})=\frac{\alpha_{i}}{\alba_{0}}。\结束{数组}$$
(15)
此外,任何变量的方差x个我是
$$\开始{array}{*{20} 我}V(x{i})=\frac{\alpha{i}}{\alba{0}}-\frac}\mu{i}^{2}{\mu{0}^}},\end{array}$$
(16)
和协方差x个1,x个2可以写为
$$\开始{array}{*{20} 我}E(x{1}{\cdot}x{2})=\int\dots\int\frac{2^{m-1}\Gamma(\alpha{0}_{i} -1个}\右)\cdot x{m}^{-1}{\mathrm{d} x个_{1} }\点{\mathrm{d} x_{m} },\结束{数组}$$
(17)
经过一些安排后,我们可以使用前两个参数来确定所建议SDD的内核\(\α{1}+\压裂{1}{2}\)、和\(\alpha_{2}+\frac{1}{2}\),其中我们可以求解相应的积分,我们的结果采用以下形式
$$\开始{array}{*{20} 我}E(x{1}{\cdot}x{2})=\frac{\Gamma\left(\alpha{1}+\frac}{2}\right)\Gamma\ left(\ alpha{2}+\ frac{1}}{2{\right}。\结束{数组}$$
(18)
通常,对于任何一对变量(x个我,x个j个)我们可以写
$$\开始{array}{*{20} 我}E(x{i}{\cdot}x{j})=\delta{ij}\cdot\frac{\alpha{i}}{\alba{0}}+(1-\delta}i})\cdot\frac{\mu{i}\cdot \mu{j}}{\ alpha{0},\end{array}$$
(19)
哪里δij公司是delta Kronecker,我们也可以写出任何一对变量的协方差(x个我,x个j个)作为
$$\开始{array}{*{20} 我}COV(x{i},x{j})=\left(\frac{1}{\alpha{0}}-\frac}1}{\mu{0}^{2}}\right)\mu{i}\cdot\mu{j}\text{for}{i}\neq{j}。\结束{数组}$$
(20)
我们也可以写出任何一对变量的协方差(x个我,x个j个)作为
$$\开始{array}{*{20} 我}COV(x{i},x{j})=\delta_{ij}\cdot\left(\frac{\alpha_{i=j}}{\alba_{0}}-\frac}\mu_{i}^2}}{\mu_}0}^2{}\right)+(1-\delta{ij{)\cdot\ left{2}}\右)\mu{i}\cdot\mu{j},\end{array}$$
(21)
用矩阵表示法也可以写成
$$\boldsymbol{\Sigma}=\left[{\begin{array}{cccc}\frac{\alpha_{1}}{\alba_{0}}-\frac}\mu_{1{^{2}}{\mu_}0}^{2{}&\left(\ frac{1}{\alpha_{0{}-\frac{1{\mu_0}^2}\right \dots&\dots\\left(\frac{1}{\alpha{0}}-\frac}1}{\tu{0}^{2}}\right)\mu{2}\cdot\mu{1}&\frac\\alpha{2}{\阿尔法{0}{-\frac{\mu{2]^{2{{{0}}{4}\\dots\\hdots代表的是&\点\\dots&\点&\点$$
等效表达式为
$$\boldsymbol{\Sigma}=\frac{1}{\alpha_{0}}\left[{\begin{array}{cccc}\alpha_{1}-\mu_{1}^{2}&0&\点&\点\\0&\阿尔法_{2}-\mu{2}^{2}&\点\\dots\\hdots用于{4}\\dots&\点&\点_{米}-\mu_{m}^{2}\\end{array}}\\right]-\左(\frac{1}{\mu_{0}^{2]}-\ frac{1}{\alpha_{0{}\\right)\boldsymbol{\mu}\boldsymbol{\ mu}^{T}$$
类似地,我们让
$$\开始{array}{*{20} 我}\boldsymbol{\Sigma}=\frac{1}{\alpha_{0}}诊断(\boldsymbol{\salpha})-\frac}C^{2}\mu_{0{}}{\阿尔法{0}诊断\right)\bar{\boldsymbol{\mu}}\bar{\ boldsympol{\mo}}^{T},\end{array}$$
(22)
哪里
$$\开始{array}{*{20} 我}C=\frac{|{\boldsymbol{\mu}}||}{\mu_{0},\quad\bar{\bolsymbol{\mu{}}=\frac{\bodsymbol}{|{\ boldsympol{\mo}}|},\ quad\bar{\boltsymbol}\mu}}在\Omega_{m-1}中,\end{array}$$
(23)
它以简洁的形式总结了我们的结果。
模式和与平均值的关系
SDD的模式可以通过查找的值来确定α我这样可以最大化此函数,或者,我们也可以最大化该函数的日志,因为这是一个习惯性的过程,通常更容易实现。首先,获取SDD的自然日志并添加约束\(总和{i=1}^{m} x_{i} ^{2}=1\)为了使用拉格朗日乘数,我们得到
$$\开始{array}{*{20} 我}{ln}f_{text{SDir}}(\mathbf{x},\alpha)=\ln\left(\frac{2^{m-1}\Gamma(\alpha_{0})}{\prod_{i=1}^{m}\Garma(\alpha_{i}){\right)+\sum_{i=1{m}(2\alpha_{i} -1个)\在{x_{i}}_{米}-\λ\左(\sum_{i=1}^{m} x个_{我}^{2}-1\右),\结束{数组}$$
(24)
对……求导x个我并将其设置为零
$$\开始{数组}{*{20} 我}\frac{\partial{\ln}f_{\text{SDir}}}{\paratilx{i}}=(2\alpha_{i} -1个)\frac{1}{x{i}}-2{x{i}}\lambda=0\text{for}i<m,\end{array}$$
(25)
解决\(x{i}^{2}\),它产生
$$\开始{array}{*{20} 我}x{i}^{2}=\frac{2\alpha_{i} -1个}{2\lambda}\text{for}i<m,\end{array}$$
(26)
类似地,对x个米
$$\开始{array}{*{20} 我}frac{\partial{\ln}f_{\text{SDir}}}{\paratilx{m}}=(2\alpha_{m} -1个)\分形{1}{x{m}}-\分形{1{x{m}}-2{x{m2}\lambda=0\text{for}i=m,\end{array}$$
(27)
并解决x个米,我们有
$$\开始{array}{*{20} 我}x{m}^{2}=\frac{\alpha_{m} -1个}{\lambda}\text{for}\i=m,\end{array}$$
(28)
将这些结果代入约束条件,我们可以求解λ作为
$$\开始{array}{*{20} 我}\lambda=压裂{1}{2}(2\alpha_{0}-m-1),\结束{数组}$$
(29)
在那里我们可以获得模式x个我作为
$$\开始{array}{*{20} 我}\text{(模式)}x{i}=\sqrt{\frac{2\alpha_{i} -1个}{2\字母_{0}-m-1}}\text{for}\i<m,\end{array}$$
(30)
和用于x个米
$$\开始{array}{*{20} 我}\text{(模式)}x_{m}=\sqrt{\frac{2(\alpha_{m} -1个)}{2\字母_{0}-m-1}}\text{for}\i=m.\end{array}$$
(31)
考虑到对称SDD的特殊情况,我们设置α我=α对于我<米、和\(\alpha_{m}=\alpha+\frac{1}{2}\),两者都是(30)和(31)产量
$$\开始{array}{*{20} 我}\text{(模式)}x{i}=\sqrt{\frac{2\alpha-1}{m\cdot(2\alfa-1)}}=\frac{1}{\sqrt}}\text{for}\\alpha\neq\frac}1}{2}\text}for}\i\leq-m,\end{array}$$
(32)
对称SDD的平均值α我=α对于我<米、和\(\alpha_{m}=\alpha+\frac{1}{2}\),收益率
$$\开始{array}{*{20} 我}E(x{i})=\frac{\mu{i}}{\mu_{0}}=\frac{\Gamma\left(\alpha+\frac{1}{2}\right)}{\Garma(\alpha)}\cdot\frac}\Gamma(\alfa{0})}{\ Gamma\leaft{\right)}{\Gamma(\alpha)}\cdot\frac{\Gamma\left(m\alpha+\frac}{2}\right$$
(33)
我们可以看到,模式与对称SDD的预期值不匹配,但是,我们仍然可以使用Frame开发的表达式找到渐近关系(1949年框架),
$$\开始{array}{*{20} 我}{\lim}_{x\to\infty}f(x)=\frac{\Gamma(x+a)}{\Garma(x)}=x^{a},\end{array}$$
(34)
使用这个近似值,它会产生
$$\开始{数组}{*{20} 我}{\lim}_{\alpha\to\infty}E(x{i})=\左(\alpha^{\frac{1}{2}}\右)\cdot\frac}{(m\alpha)^{\frac{1{2}{}=\ frac{1\sqrt{m}},\end{array}$$
(35)
哪里
$$\alpha_{i}=\alpha\text{表示}i<m,\;\;\alpha_{m}=\alpha+\frac{1}{2}、\text{and}\alpha\neq\frac{1}{2}、$$
极限与模式匹配(32).