IDEAS主页打印自https://ideas.repec.org/a/taf/jnlasa/v111y2016i516p1427-1439.html
  我的参考书目  保存此文章

结合已知和新生物信息的层次特征选择:识别与前列腺癌复发相关的基因组特征

作者

上市的:
  • 赵一泽
  • 马蒂亚斯·钟
  • 布伦特·约翰逊
  • 卡洛斯·莫雷诺
  • 齐龙

摘要

我们的工作受到前列腺癌研究的启发,该研究旨在确定预测前列腺切除术后癌症复发的mRNA和miRNA生物标记物。文献表明,结合已知的通路成员生物信息和生物标记物之间的相互作用可以改进与疾病风险相关的高维生物标记物的特征选择。生物信息通常用图形或网络表示,其中生物标记物用节点表示,它们之间的相互作用用边表示;然而,生物信息往往并不完全为人所知。例如,microRNAs(miRNAs)在调节基因表达中的作用还没有完全理解,miRNA调节网络也没有完全建立,在这种情况下,需要新的策略来进行特征选择。为此,我们将未知生物信息视为缺失数据(即图中的缺失边),这不同于变量值缺失时常见的缺失数据问题。我们提出了一个基于观测数据输入未知生物信息的新概念,并将输入的信息定义为新的生物信息。此外,我们提出了一种层次化的群体惩罚,以鼓励路径级别和路径内级别的稀疏性和特征选择,这与插补步骤相结合,允许纳入已知和新的生物信息。虽然它适用于一般的回归设置,但我们在由我们的数据示例驱动的半参数加速失效时间模型的背景下开发和研究了所提出的方法。数据应用和仿真研究表明,新生物信息的引入提高了风险预测和特征选择的性能,并且所提出的惩罚优于现有几种惩罚的扩展。本文的补充材料可在线获取。

建议引用

  • Yize Zhao&Matthias Chung&Brent A.Johnson&Carlos S.Moreno&Qi Long,2016年。"结合已知和新生物信息的层次特征选择:识别与前列腺癌复发相关的基因组特征,"美国统计协会杂志《泰勒与弗朗西斯杂志》,第111卷(516),第1427-1439页,10月。
  • 手柄:RePEc:taf:jnlasa:v:111:y:2016:i:516:p:1427-1439
    内政部:10.1080/01621459.2016.1164051
    作为

    从出版商下载全文

    文件URL: http://hdl.handle.net/10.1080/01621459.2016.1164051
    下载限制:全文仅限于订阅者访问。

    文件URL: https://libkey.io/10.1080/01621459.2016.1164051?utm_source=ideas
    LibKey链接:如果访问受到限制,并且您的库使用此服务,LibKey会将您重定向到可以使用库订阅访问此项目的位置
    ---><---

    由于此文档的访问受到限制,您可能希望搜索换一个不同的版本。

    IDEAS上列出的参考文献

    作为
    1. Thierry Chekouo和Francesco C.Stingo以及James D.Doecke和Kim-Anh Do,2015年。"miRNA–靶基因调控网络:一种贝叶斯综合生物标记物选择方法及其在肾癌中的应用,"生物计量学国际生物识别学会,第71卷(2),第428-438页,6月。
    2. 金哲珍,2003。"加速失效时间模型的秩推理,"生物特征《Biometrika信托》,第90卷(2),第341-353页,6月。
    3. Rolf Thermann和Matthias W.Hentze,2007年。"果蝇miR2诱导假多聚体并抑制翻译起始,"自然《自然》,第447卷(7146),第875-878页,6月。
    4. Fan J.&Li R.,2001年。"基于非冲突惩罚似然的变量选择及其Oracle性质,"美国统计协会杂志,美国统计协会,第96卷,第1348-1360页,12月。
    5. Lynn M.Johnson和Robert L.Strawderman,2009年。"半参数加速失效时间模型的诱导平滑:渐近性和对聚类数据的扩展,"生物特征《Biometrika信托》,第96卷(3),第577-590页。
    6. 邹辉,2006。"自适应套索及其Oracle特性,"美国统计协会杂志,美国统计协会,第101卷,第1418-1429页,12月。
    7. Rui Song&Wenbin Lu&Shuange Ma&X.Jessie Jeng,2014年。"高维生存数据的删失秩独立筛选,"生物特征《Biometrika信托》,第101卷(4),第799-814页。
    8. S.Wang和B.Nan和N.Zhu和J.Zhu,2009年。"带分组变量的层次惩罚Cox回归,"生物特征《Biometrika信托》,第96卷(2),第307-322页。
    9. Robert Tibshirani、Michael Saunders、Saharon Rosset、Ji Zhu和Keith Knight,2005年。"通过融合套索实现轻盈流畅,"英国皇家统计学会学报B辑皇家统计学会,第67卷(1),第91-108页,2月。
    10. Hui Zou和Trevor Hastie,2005年。"补遗:通过弹性网进行规则化和变量选择,"英国皇家统计学会学报B辑英国皇家统计学会,第67卷(5),第768-768页,11月。
    11. Hui Zou和Trevor Hastie,2005年。"通过弹性网进行正则化和变量选择,"英国皇家统计学会学报B辑英国皇家统计学会,第67卷(2),第301-320页,4月。
    12. 沈晓彤、潘伟伟、朱云章,2012。"基于似然法的选择和尖锐参数估计,"美国统计协会杂志《泰勒与弗朗西斯杂志》,第107卷(497),第223-232页,3月。
    13. 格伦·海勒,2007年。"截尾数据的平滑秩回归,"美国统计协会杂志,美国统计协会,第102卷,第552-559页,6月。
    14. Ming Yuan和Yi Lin,2006年。"分组变量回归中的模型选择与估计,"英国皇家统计学会学报B辑皇家统计学会,第68卷(1),第49-67页,2月。
    完整参考文献 (包括与IDEAS上的项目不匹配的项目)

    引文

    引文由CitEc项目,订阅其RSS源用于此项目。
    作为


    引用人:

    1. 赵一泽、吴本建和康健,2023年。"用于多模态神经成像数据分析的贝叶斯交互选择模型,"生物计量学国际生物识别学会,第79卷(2),第655-668页,6月。

    最相关的项目

    这些是最常引用与本书相同作品的项目,也被与本书同样的作品引用。
    1. Kwon,Sunghoon&Oh,Seungyoung&Lee,Youngjo,2016年。"随机效应模型在高维变量选择问题中的应用,"计算统计与数据分析爱思唯尔,第103(C)卷,第401-412页。
    2. 秦珊珊、丁浩、吴月华、刘峰,2021年。"高维符号约束特征选择和分组,"统计数学研究所年鉴,施普林格;统计数学研究所,第73卷(4),第787-819页,8月。
    3. Tutz,Gerhard&Pößnecker,Wolfgang&Uhlmann,Lorenz,2015年。"一般多项式logit模型中的变量选择,"计算统计与数据分析爱思唯尔,第82(C)卷,第207-222页。
    4. Loann David Denis Desboulets,2018年。"回归分析中变量选择的研究进展,"计量经济学,MDPI,第6卷(4),第1-27页,11月。
    5. Takumi Saegusa&Tianzhou Ma&Gang Li&Ying Qing Chen&Mei-Ling Ting Lee,2020年。"阈值回归模型中的变量选择及其在HIV药物依从性数据中的应用,"生物科学统计,施普林格;国际中国统计协会,第12卷(3),第376-398页,12月。
    6. Massimiliano Caporin和Francesco Poli,2017年。"从文本数据构建新闻测度及其在波动性预测中的应用,"计量经济学,MDPI,第5卷(3),第1-46页,8月。
    7. 王培(Pei Wang)、陈顺杰(Shunjie Chen)和杨思嘉(Sijia Yang),2022年。"生物数据惩罚回归模型的最新进展,"数学,MDPI,第10卷(19),第1-24页,10月。
    8. Justin B.Post和Howard D.Bondell,2013年。"交互方差分析模型中的因子选择和结构识别,"生物计量学国际生物识别学会,第69卷(1),第70-79页,3月。
    9. 蒋丽文、邦德尔、霍华德·D·王、惠霞·朱迪,2014年。"分位数回归中的分位数间收缩和变量选择,"计算统计与数据分析爱思唯尔,第69卷(C),第208-219页。
    10. 钟文彦、卢学文和吴晶晶,2021年。"右偏数据半参数变换模型中的双层变量选择,"计算统计学,施普林格,第36卷(3),第1661-1692页,9月。
    11. 伊斯梅尔·沙阿(Ismail Shah)、希娜·纳兹(Hina Naz)、萨吉德·阿里(Sajid Ali)、阿曼尼·阿尔莫海米德(Amani Almohaimeed)和肖卡特·艾哈迈德·隆恩(Showkat Ahmad Lone),2023年。"一种新的基于分位数的LASSO估计方法,"数学,MDPI,第11卷(6),第1-13页,3月。
    12. Sunkyung Kim、Wei Pan和Xiaotong Shen,2013年。"基于网络的惩罚回归及其在基因组数据中的应用,"生物计量学国际生物识别学会,第69卷(3),第582-593页,9月。
    13. Howard D.Bondell和Brian J.Reich,2009年。"方差分析中的同时因子选择和崩溃水平,"生物计量学国际生物识别学会,第65卷(1),第169-177页,3月。
    14. Diego Vidaurre、Concha Bielza和Pedro Larrañaga,2013年。"L1回归综述,"国际统计评论国际统计局,第81(3)卷,第361-387页,12月。
    15. Yen-Shiu Chin和Ting-Li Chen,2016年。"马尔可夫链蒙特卡罗最小化变量选择准则,"计算统计学《施普林格》,第31卷(4),第1263-1286页,12月。
    16. Howard D.Bondell和Brian J.Reich,2012年。"基于惩罚可信域的一致高维贝叶斯变量选择,"美国统计协会杂志《泰勒与弗朗西斯杂志》,第107卷(500),1610-1624页,12月。
    17. 孙志华、刘毅、陈嘉妮和李刚,2022年。"右偏生存数据的断裂自适应岭回归,"统计数学研究所年鉴,施普林格;统计数学研究所,第74卷(1),第69-91页,2月。
    18. Audrino,Francesco&Tetereva,阿纳斯塔西亚,2019年。"美国和欧洲公司的情绪溢出效应,"银行与金融杂志,爱思唯尔,第106卷(C),第542-567页。
    19. 蔡凯达、沈华、卢学文,2022年。"具有发散协变量的多元失效时间模型的自适应双层变量选择,"测试:西班牙统计与运筹学会官方期刊,施普林格;Sociedad de Estadística e Investigación Operativa,第31卷(4),第968-993页,12月。
    20. 桑德拉·斯坦基维茨(Sandra Stankiewicz),2015年。"用贝叶斯自适应弹性网预测欧元区宏观经济变量,"康斯坦茨大学经济系工作文件系列2015年12月,康斯坦茨大学经济系。

    有关此项目的更多信息

    统计

    访问和下载统计

    更正

    本网站上的所有材料均由各自的出版商和作者提供。你可以帮助纠正错误和遗漏。请求更正时,请提及此项目的句柄:RePEc:taf:jnlasa:v:111:y:2016:i:516:p:1427-1439。请参阅一般信息关于如何更正RePEc中的材料。

    如果您编写了此项目,但尚未在RePEc注册,我们鼓励您这样做在这里。这允许将您的个人资料链接到此项目。它还允许您接受我们不确定的该项目的潜在引用。

    如果CitEc公司识别了书目参考,但没有将RePEc中的项目链接到它,您可以帮助这个表格

    如果你知道引用这一条的缺失条目,你可以通过以与上述相同的方式为每个引用条目添加相关引用来帮助我们创建这些链接。如果您是此项目的注册作者,您可能还需要检查您的RePEc作者服务个人资料,因为可能有一些引文等待确认。

    有关本项目的技术问题,或更正作者、标题、摘要、书目或下载信息,请联系:Chris Longhurst(以下电子邮件可用)。供应商的一般联系方式:http://www.tandfonline.com/UASA20

    请注意,更正可能需要几周时间才能筛选出来各种RePEc服务。

    思想是一个经济学研究论文服务。RePEc使用各出版商提供的书目数据。