×

表达数量性状基因座(eQTL)定位的统计方法。 (英语) Zbl 1091.62119号

概述:传统的遗传作图主要集中于识别影响一个或至多几个复杂性状的基因座。微阵列可以测量数千个基因表达丰度,它们本身具有复杂的特征,最近的一些研究将这些测量视为绘图研究中的表型。将传统的数量性状基因座(QTL)定位方法与微阵列数据相结合是一种强有力的方法,在许多最近的生物学研究中已证明其实用性。这些表达数量性状基因座(eQTL)研究与传统的QTL研究类似,因为其主要目的是确定与表达性状相关的基因组位置。然而,eQTL研究探测了数千个表达转录物;因此,设计用于处理最多数十个性状的标准多性状QTL定位方法并不直接适用。
一种可能的方法是使用单性状QTL定位方法分别分析每个转录本。这导致错误发现的数量增加,因为没有对多个笔录测试进行更正。同样,在每个标记处重复应用识别差异表达转录物的方法也会受到多个标记的多重测试。在这里,我们展示了这些方法的不足,并提出了一个标记物混合(MOM)模型,该模型在标记物和转录物之间共享信息。在糖尿病研究中,所有方法的实用性都是使用模拟数据以及来自F_2小鼠杂交的数据进行评估的。仿真研究结果表明,MOM模型在不牺牲功率的情况下,最适合控制错误发现。MOM模型也是唯一一个能够发现两个先前被证明与糖尿病有关的基因组区域的模型。

MSC公司:

62页第10页 统计学在生物学和医学中的应用;元分析
92C40型 生物化学、分子生物学
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Baldi,微阵列表达数据分析的贝叶斯框架:基因变化的规则化t检验和统计推断,生物信息学17 pp 509–(2001)·doi:10.1093/bioinformatics/17.6.509
[2] Brem,芽殖酵母转录调控的遗传解剖,《科学》296 pp 752–(2002)·数字对象标识代码:10.1126/science.1069516
[3] Broman,实验杂交QTL作图统计方法综述,《实验动物》30,第44页–(2001)
[4] Broman,实验杂交中数量性状位点识别的模型选择方法(含讨论),皇家统计学会杂志,B辑64 pp 641–(2002)·Zbl 1067.62108号 ·doi:10.1111/1467-9868.00354
[5] 数据分析的Carlin、Bayes和经验Bayes方法(1998)·Zbl 0871.62012号
[6] 丘吉尔,数量性状图谱的经验阈值,遗传学138页963–(1994)
[7] 科尔曼,遗传背景对小鼠肥胖(Ob)基因表达的影响,《糖尿病》9第287页–(1973)·doi:10.1007/BF01221856
[8] 大肠杆菌,小鼠饮食诱导动脉粥样硬化病变和血脂的遗传基因座,哺乳动物基因组14第464页–(2003)·数字标识代码:10.1007/s00335-002-2187-2
[9] 考克斯,《兴趣表达》,《自然》第12卷第733页–(2004年)·doi:10.1038/430733a
[10] Dudoit,在复制的cDNA微阵列实验中识别差异表达基因的统计方法,《中国统计》12第111页–(2002)·Zbl 1004.62088号
[11] Dupuis,从密集标记集映射数量性状位点的统计方法,《遗传学》151第373页–(1999)
[12] 埃夫隆,《大尺度同时假设检验:无效假设的选择》,《美国统计协会杂志》99页96–(2004)·Zbl 1089.62502号 ·doi:10.1198/0162145000000089
[13] Efron,微阵列的经验贝叶斯方法和错误发现率,遗传流行病学1第70页–(2002)·doi:10.1002/gepi.1124
[14] Efron,微阵列实验的经验贝叶斯分析,美国统计协会杂志96页1151–(2001)·Zbl 1073.62511号 ·doi:10.1198/016214501753382129
[15] 高密度寡核苷酸阵列探针水平数据的虹膜、探索、归一化和总结,生物统计学4第249页–(2003)·Zbl 1141.62348号 ·doi:10.1093/生物统计学/4.2.249
[16] 金,用于提高遗传图谱研究效率的选择性表型,《遗传学》168页2285–(2004)·doi:10.1534/genetics.104.027524
[17] Kendziorski,《利用重复基因表达谱比较多组的参数经验贝叶斯方法》,《医学统计学》22,第3899页–(2003)·doi:10.1002/sim.1548
[18] Lan,非糖尿病和糖尿病肥胖小鼠的基因表达谱表明肝脏脂肪生成能力在糖尿病易感性中的作用,《糖尿病52》第688页–(2003a)·doi:10.2337/糖尿病.52.3688
[19] Lan,将信使核糖核酸丰度映射为定量性状的降维,遗传学164第1607页–(2003b)
[20] 兰德,使用RFLP连锁图绘制数量性状的孟德尔因子,《遗传学》121第185页–(1989)
[21] Lonnstedt,复制微阵列数据,《中国统计》12第31页–(2002)
[22] Lund,利用连锁不平衡和连锁分析组合对数量性状位点进行多性状精细定位,《遗传学》163页405–(2003)
[23] Naggert,肥胖脂肪/脂肪小鼠的高胰岛素血症与羧肽酶E突变相关,该突变可降低酶活性,《自然遗传学》10第135页–(1995)·doi:10.1038/ng0695-135
[24] 牛顿,《基因表达数据分析:方法和软件》,第254页–(2003年)·doi:10.1007/0-387-21679-0_11
[25] 牛顿,《关于表达比率的差异可变性:从微阵列数据改进关于基因表达变化的统计推断》,《计算生物学杂志》8第37页–(2001)·doi:10.1089/106652701300099074
[26] 牛顿,用半参数分层混合法检测差异基因表达,生物统计学5 pp 155–(2004)·Zbl 1096.62124号 ·doi:10.1093/biostatistics/5.2.155
[27] Parmigiani,《基因表达数据分析:方法和软件》(2003年)·兹比尔1012.00021 ·doi:10.1007/b97411
[28] R开发核心团队。,R统计计算基金会(2004年)
[29] Schadt,《玉米、小鼠和人的基因表达调查遗传学》,《自然》422第297页–(2003年)·doi:10.1038/nature01434
[30] Stoehr,遗传性肥胖揭示了小鼠2型糖尿病易感性位点之间的非线性相互作用,《糖尿病》第49页,1946–(2000)·doi:10.2337/糖尿病.49.11.1946
[31] Stoehr,《控制肥胖/肥胖小鼠体重变化的主要数量性状位点的识别》,《糖尿病》53,第245页–(2004年)·doi:10.2337/糖尿病.53.1245
[32] Storey,The positive false discovery rate:A Bayesian interpretation and The q value,《统计年鉴》2013–(2003)第31页·Zbl 1042.62026 ·doi:10.1214/aos/1074290335
[33] Storey,《全基因组研究的统计意义》,《美国国家科学院院刊》100页9440–(2003)·Zbl 1130.62385号 ·doi:10.1073/pnas.1530509100
[34] Storey、强控制、保守点估计和假发现率的同时保守一致性:统一方法,《皇家统计学会杂志》,B辑66第187页–(2004)·兹比尔1061.62110 ·文件编号:10.1111/j.1467-9868.2004.00439.x
[35] Tusher,应用于电离辐射反应的微阵列显著性分析,美国国家科学院院刊98页5116–(2001)·2014年12月10日 ·doi:10.1073/pnas.091062498
[36] Yvert,酿酒酵母中的反式调节变异和转录因子的作用,《自然遗传学》35,第57页–(2003)·doi:10.1038/ng1222
[37] Zhang,小鼠肥胖基因及其人类同源物的定位克隆,《自然》372第425页–(1994)·数字对象标识代码:10.1038/372425a0
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。