×

关于双曲线到正规的变换。 (英语) Zbl 1466.62202号

摘要:在生物和社会科学中,为了检测结构效应以及更好的数据表示和解释,必须考虑将数据转换为正常值。对于表现出偏斜、轻风廓形和单峰形状的数据,已经导出了一系列到正态的转换,但对于表现出板状形状的数据,如几乎双峰的分布,则不太适用。本研究提出并构造了一类新的双曲幂变换,用于改善具有不同偏度和峰度的原始数据的正态性。这个新系列的一个优点是它可以有效地将平台或双峰数据分布转换为正态分布。通过对数学成绩测试分数的模拟研究和实际数据示例,说明了所提出的变换族的广泛应用。值得注意的是,我们将讨论所提出方法的有用性和局限性,以稳定DNA微阵列数据的方差,并将数据分布对称化为正态分布。实证应用还举例说明了违反正态性假设时的保守(t)检验和方差分析(F)检验。

MSC公司:

62-08 统计问题的计算方法
62G10型 非参数假设检验
62页第10页 统计学在生物学和医学中的应用;元分析
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Allison,D。;崔,X。;第页,G。;Sabripour,M.,《微阵列数据分析:从混乱到整合和共识》,《国家遗传学评论》,7,1,55-65,(2006)
[2] Ambroise,J。;比尔扎托,B。;罗伯特·A。;Govaerts,B。;Macq,B.M。;Gala,J.-L.,斑点微阵列预处理方法对折变压缩和方差稳定性的影响,BMC生物信息。,12, 413, (2011)
[3] Baker,G.A.,《非正态频率分布到正态分布的转换》,《数学年鉴》。统计人员。,5, 2, 113-123, (1934) ·Zbl 0009.26602号
[4] 巴雷特,T。;Edgar,R.,《基因表达总汇:微阵列数据存储、提交、检索和分析》,《酶学方法》。,411, (2006)
[5] 贝尔·A·J。;Sejnowski,T.J.,盲分离和盲反褶积的信息最大化方法,神经计算。,7, 6, 1129-1159, (1995)
[6] 比克尔,P。;Doksum,K.,《重访转型分析》,J.Amer。统计师。协会,76,374,296-311,(1981)·兹比尔0464.62058
[7] 盒子,G.E.P。;Cox,D.R.,《转换分析》(含讨论),J.R.Stat.Soc.Ser。A、 26211-252(1964)·Zbl 0156.40104号
[8] 布朗,M.B。;Forsythe,A.B.,方差相等的稳健检验,J.Amer。统计师。协会,69,346,364-367,(1974)·Zbl 0291.62063号
[9] Burbidge,J.B。;Magee,L。;Robb,A.L.,处理因变量极值的替代变换,J.Amer。统计师。协会,83,401,123-127,(1988)
[10] 程,体育。;Liou,M。;Aston,J.A。;蔡A.C.,《信息身份与检验假设:列联表的权力分析》,《中国统计》,第18、2、535页,(2008)·Zbl 1135.62049号
[11] D’Haese,S。;De Meester,F。;布尔迪厄德胡伊,I。;变形,B。;Cardon,G.,《儿童主动通勤上学的标准距离和环境相关性》,国际J.Behav。螺母。物理学。2011年第8、1、88号法案
[12] Durbin,B。;哈丁,J。;霍金斯博士。;Roke,D.,基因表达微阵列数据的方差稳定转换,生物信息学,18,S105-110,(2002)
[13] 福布斯,C。;埃文斯,M。;黑斯廷斯,N。;皮科克,B.,《统计分布》(2011年),威利纽约·Zbl 1258.62012号
[14] Gastwirth,J.L。;凝胶,Y.R。;苗伟,《列文方差相等检验对统计理论和实践的影响》,《统计科学》。,343-360, (2009) ·Zbl 1329.62332号
[15] 凝胶,Y.R。;Gastwirth,J.L.,《正态性震-贝拉试验的稳健修正》,《经济学》。莱特。,99, 1, 30-32, (2008) ·Zbl 1255.62132号
[16] 盖勒,南卡罗来纳州。;格雷格,J.P。;Hagerman,P。;Roke,D.M.,寡核苷酸微阵列数据的转换和规范化,生物信息学,19,14,1817-1823,(2003)
[17] R.C.先生。;凯里·V·J。;贝茨,D.M。;Bolstad,B。;Dettling,M。;Dudoit,S。;埃利斯,B。;Gautier,L。;Ge,Y。;Gentry,J。;霍尼克,K。;Hothorn,T。;Huber,W。;Iacus,S。;爱尔兰共和国。;Li,F.L.C。;Maechler,M。;罗西尼,A.J。;Sawitzki,G。;史密斯,C。;Smyth,G。;蒂尔尼,L。;Yang,J.Y.H。;张杰,《生物导体:计算生物学和生物信息学的开放软件开发》,《基因组生物学》。,5,R80,(2004)
[18] 玻璃,G.V。;佩克姆,P.D。;Sanders,J.R.,《未能满足方差和协方差固定效应分析所依据假设的后果》,Rev.Educe。决议,237-288,(1972)
[19] Greenacre,M.,对应分析中的功率变换,计算。统计师。数据分析。,53, 8, 3107-3116, (2009) ·Zbl 1453.62099号
[20] 侯,Q。;Mahnken,J.D。;Gajewski,B.J。;Dunton,N.,《护理敏感指标的箱盒功率变换:在估计变换参数时忽略结构效应有关系吗?》?,BMC医学研究方法。,11, 1, 118, (2011)
[21] Huber,W。;冯·海德布雷克,A。;苏特曼,H。;Poustka,A。;Vingron,M.,用于微阵列数据校准和差异表达量化的方差稳定,生物信息学,18,S96-104,(2002)
[22] Hyvärinen,A。;Karhunen,J。;Oja,E.,独立成分分析,(2001),John Wiley&Sons
[23] 约翰·J·A。;Draper,N.R.,变换的一个替代族,应用。统计人员。,29, 190-197, (1980) ·Zbl 0443.62062号
[24] Johnson,N.L.,《通过平移方法生成的频率曲线系统》,《生物统计学》,36,1/2,149-176,(1949)·Zbl 0033.07204号
[25] 琼斯,M.C。;Pewsey,A.,Sinh-arcsinh分布,Biometrika,96,4,761-780,(2009)·Zbl 1183.62019年6月
[26] Kelmansky,D.M。;马丁内斯,E.J。;Leiva,V.,用于基因表达数据分析的一种新的方差稳定转换,Stat.Appl。遗传学。分子生物学。,12, 6, 653-666, (2013)
[27] Lagarias,J.C。;Reeds,J.A。;Wright,M.H。;Wright,P.E.,低维Nelder-Mead单纯形方法的收敛性,SIAM J.Optim。,9, 1, 112-147, (1998) ·Zbl 1005.90056号
[28] Lee,T。;Girolma,M。;Sejnowski,T.,使用扩展的infomax算法进行亚高斯和超高斯混合源的独立分量分析,Neural Comput。,11, 2, 417-441, (1999)
[29] Lehmann,E.L。;Casella,G.,点估计理论,(1998),斯普林格科学与商业媒体·Zbl 0916.62017号
[30] Lehmann,E.L。;D'Aberra,H.J.,《非参数:基于等级的统计方法》,(2006),纽约施普林格出版社·Zbl 0354.62038号
[31] 莱瓦,V。;Sanhueza,A。;Kelmansky,D.M。;Martínez,E.J.,关于glog-正态分布及其与基因表达问题的关联,计算。统计师。数据分析。,53, 5, 1613-1621, (2009) ·Zbl 1453.62133号
[32] Levene,H.,方差相等的稳健性检验,(概率与统计贡献:哈罗德·霍特林荣誉论文,2,(1960)),278-292·Zbl 0094.13901号
[33] Leys,C。;Schumann,S.,《分析相互作用的非参数方法:调整后的秩变换检验》,《心理学实验杂志》。,46, 4, 684-688, (2010)
[34] 利尔曼,M。;钢,A。;罗辛,M。;Guttorp,P.,《随机分母与比率数据分析》,《环境》。经济。统计,11,1,55-71,(2004)
[35] Manly,B.F,指数数据转换。统计学家,25,37-42,(1976)
[36] 穆德霍尔卡,G.S。;马切蒂,C.E。;Lin,C.T.,《独立性特征和针对限制偏度-峰度备选方案的正态性测试》,J.Statist。计划。推理,104,2485-501,(2002)·Zbl 1009.62012号
[37] Munson,P.,2001年。一种“一致性”测试,用于确定重复样本上基因表达变化的重要性,以及两种方便的方差稳定转换。In:医学博士贝塞斯达Affymetrix基因芯片数据低水平分析的基因逻辑研讨会
[38] 尼尔德,J.A。;Mead,R.,函数最小化的单纯形方法,计算。J.,第7、4、308-313页,(1965年)·Zbl 0229.65053号
[39] Osborne,J.,《数据转换使用说明》,Pract。评估。研究评估。,8, 6, 1-8, (2002)
[40] 帕里什,R.S。;斯宾塞·H·J。;Xu,P.,基因表达数据的分布建模和模拟,计算机。统计师。数据分析。,53, 5, 1650-1660, (2009) ·Zbl 1453.62173号
[41] 帕森斯,H.M。;路德维希,C。;吉尔特,U.L。;Viant,M.R.,《使用方差稳定广义对数变换提高一维和二维核磁共振代谢组数据的分类准确性》,BMC Bioninform。,8, 1, 234, (2007)
[42] Pattyn,E。;Van Praag,L。;Verhaeghe,M。;莱维克,K。;Bracke,P.,《比利时男女居民区特征与心理健康结果之间的关系》,Arch。公共卫生,69,1,1-11,(2011)
[43] Purdom,E。;Holmes,S.P.,基因表达数据的误差分布,Stat.Appl。遗传学。分子生物学。,4, 1, (2005) ·Zbl 1083.62114号
[44] Rakhshan,A。;Pishro-Nik,H.,使用MATLAB进行模拟的介绍,(Pishro-Nik,H,概率、统计和随机过程简介:统计和随机进程,(2014),Kappa Research,LLC),703-723(第12章)
[45] 拉什·D·。;库宾格,K.D。;Moder,K.,《双样本t检验:预先检验其假设没有回报》,Stat.Pap。,52, 1, 219-231, (2011) ·Zbl 1247.62056号
[46] Sakia,R.,《盒子-盒子转换技术:综述》,统计学家,41,2,169-178,(1992)
[47] 萨维洛夫斯基,S.S。;Blair,R.C.,《关于t检验偏离人口常态的稳健性和II型误差特性的更现实的研究》,心理医学。公牛。,111, 2, 352-360, (1992)
[48] 施密德,E。;齐格勒,M。;Danay,E。;Beyer,L。;Bühner,M.,它真的很健壮吗?重新研究方差分析对违反正态分布假设的稳健性,方法论,6,147-151,(2010)
[49] Shi,L。;里德·L。;琼斯,W。;Shippy,R。;沃林顿,J。;贝克,S。;柯林斯,P。;de Longueville,F.,微阵列质量控制(MAQC)项目显示了基因表达测量的平台间和平台内再现性,自然生物技术。,1151-1161年9月24日,(2006年)
[50] 斯特利克,M。;圣路易斯安那州。;Thulin,M.,《关于化学计量学中正态性的稳健测试》,《化学》。智力。实验室系统。,130, 98-108, (2014)
[51] Strauss,R.E.,MATLAB统计函数[计算机软件],(2012),http://www.faulty.biol.ttu.edu/Strauss/Matlab/Matlab.htm
[52] 托马肯,A.J。;Serlin,R.C.,方差异质性和特定非中心结构下方差分析替代方案的比较,心理。公牛。,99, 1, 90-99, (1986)
[53] 维尔卡,F。;罗德里格斯-莫塔,M。;Leiva,V.,《关于方差稳定模型及其在基因组数据中的应用》,J.Appl。统计人员。,40, 11, 2354-2371, (2013) ·Zbl 1514.62918号
[54] Welch,B.L.,《当涉及多个不同的人口差异时“学生”问题的概括》,《生物统计学》,34,28-35,(1947)·Zbl 0029.40802号
[55] 温,Z。;王,C。;石青(Shi,Q.)。;黄,Y。;苏,Z。;Hong,H。;Tong,W。;Shi,L.,使用MAQC参考RNA样本评估过期affymetrix基因芯片微阵列生成的基因表达数据,BMC Bioninform。,11(补充6),(2010)
[56] Yeo,I.-K。;Johnson,R.A.,《改善正态性或对称性的一种新的功率变换家族》,《生物统计学》,87,4,954-959,(2000)·Zbl 1028.62010号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。