×

对观测值少于维数的高维平均向量进行推断。 (英语) Zbl 06124697号

小结:当样本量远小于维数时,我们着重于对高维平均向量的推断。这种数据情况出现在现代科学的许多领域,如基因微阵列、医学成像、文本识别、金融、化学计量学等。这种推断可以用作高维数据的变量选择。接下来,我们给出平均向量平方范数的一个给定宽度的置信区间。这种推断可用于高维数据的分类过程。为了确保预先指定的覆盖概率,我们提出了一种两阶段估计方法,并确定每个推理所需的样本大小。最后,我们通过使用微阵列数据集演示了新方法的性能。

MSC公司:

62升10 顺序统计分析
62升12 序贯估计
62层25 参数公差和置信区域
62H10型 统计的多元分布
62甲12 多元分析中的估计
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] Ahn J、Marron JS、Muller KM、Chi Y-Y(2007)高维、低样本几何表示在温和条件下成立。生物医学94:760–766·Zbl 1135.62039号 ·doi:10.1093/biomet/asm050
[2] Aosima M(2005)两阶段抽样的统计推断。泛美数学Soc 215:125–145·Zbl 1330.62223号
[3] Aosima M,Mukhopadhyay N(1998)几个组内相关模型中多正态平均值的固定宽度同时置信区间。多变量分析杂志66(1):46–63·Zbl 0961.62059号 ·doi:10.1006/jmva.1997.1734
[4] Aosima M,Takada Y(2004)正态平均向量线性函数多元两阶段估计的渐近二阶效率。序列分析23(3):333–353·Zbl 1146.62330号 ·doi:10.1081/SQA-200027050
[5] Aosima M,Takada Y,Srivastava MS(2002)协方差矩阵未知时估计k个正态均值向量线性函数的两阶段程序。J Stat Plan推断100:109–119·兹比尔0986.62039 ·doi:10.1016/S0378-3758(01)00126-4
[6] Aosima M,Yata K(2010)两阶段估计方法的渐近二阶一致性及其应用。Ann Inst统计数学62:571–600·Zbl 1440.62309号 ·doi:10.1007/s10463-008-0188-y
[7] Aosima M,Yata K(2011)高维数据的两阶段程序。Seq Ana(编辑特邀论文)即将发表·Zbl 1228.6206号
[8] Bai Z,Sarandasa H(1996)高维效应:通过两个样本问题的例子。统计Sin 6:311–329·Zbl 0848.62030号
[9] Bradley RC(2005)《强混合条件的基本特性》。调查和一些开放性问题。Probab Surv 2:107–144(电子版)·Zbl 1189.60077号
[10] Chiaretti S,Li X,Gentleman R,Vitale A,Vignetti M,Mandelli F,Ritz J,Foa R(2004)成人T细胞急性淋巴细胞白血病的基因表达谱确定了对治疗和生存有不同反应的不同患者亚群。血液103:2771–2778·doi:10.1182/bloud-2003-09-3243
[11] Ghosh M,Mukhopadhyay N,Sen PK(1997),序贯估计。纽约威利·Zbl 0953.62079号
[12] Hall P,Marron JS,Neeman A(2005)高维低样本数据的几何表示。J R Stat Soc序列B 67:427–444·Zbl 1069.62097号 ·doi:10.1111/j.1467-9868.2005.00510.x
[13] Kolmogorov AN,Rozanov YA(1960)关于平稳高斯过程的强混合条件。理论问题应用5:204–208·Zbl 0106.12005号 ·数字对象标识代码:10.1137/1105018
[14] Mukhopadhyay N,Duggan WT(1997),两阶段程序是否具有二阶性质?SankhyāSer系列A 59:435–448·Zbl 1081.62548号
[15] Mukhopadhyay N,Duggan WT(1999),关于应用中具有二阶特性的两阶段程序。Ann Inst统计数学51:621–636·Zbl 1037.62082号 ·doi:10.1023/A:1004074912105
[16] Pollard KS、Dudoit S、van der Laan MJ(2005)《多重测试程序:R多重测试包及其在基因组学中的应用》。发表于:Gentleman R、Carey V、Huber W、Irizarry R、Dudoit S(编辑)使用R和生物导体的生物信息学和计算生物学解决方案。纽约州施普林格,第249-271页
[17] Srivastava MS(2005)关于高维数据中协方差矩阵的一些测试。日本国家统计局35:251–272·doi:10.14490/jjss.35.251
[18] Stein C(1945)线性假设的双样本检验,其功率独立于方差。数学统计年鉴16:243–258·Zbl 0060.30403号 ·doi:10.1214/aoms/1177731088
[19] Yata K(2010)高维高斯均值线性函数的有效两阶段估计。序列分析29:463–482·Zbl 1203.62108号 ·doi:10.1080/07474946.2010.520630
[20] Yata K,Aosima M(2009a)通过协方差结构确定样本大小的双收缩方法。J Stat Plan推断139:81–99·Zbl 1149.62018号 ·doi:10.1016/j.jspi.2008.03.032
[21] Yata K,Aoshima M(2009b)高维、低样本量背景下非高斯数据的PCA一致性。Commun Stat,Theory Methods(纪念Zacks S,ed Mukhopadhyay N的特刊)38:2634–2652·Zbl 1175.62060号 ·网址:10.1080/03610910902936083
[22] Yata K,Aoshima M(2010a)《利用交叉数据矩阵的奇异值分解对高维、低样本数据进行有效主成分分析》,多变量分析杂志101:2060–2077·Zbl 1203.62112号 ·doi:10.1016/j.jmva.2010.04.006
[23] Yata K,Aosima M(2010b)具有d-渐近性的高维低样本数据的内在维数估计。Commun Stat,Theory Method(纪念Akahira M,ed Aosima M的特刊)39:1511–1521·Zbl 1318.62204号 ·doi:10.1080/03610920903121999年
[24] Yata K,Aoshima M(2011)通过几何表示降低噪声的高维低样本数据的有效主成分分析。J Mult Anal,修订版·Zbl 1236.62065号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。