{“状态”:“确定”,“消息类型”:“工作”,“信息版本”:“1.0.0”,“邮件”:{“索引”:{“日期-部件”:[[2024,4,19]],“日期-时间”:“2024-04-19T14:06:50Z”,“时间戳”:1713535610012},“参考-计数”:35,“出版商”:“Springer Science and Business Media LLC”,“问题”:“1”,“许可证”:[{“开始”:}“日期-零件”:[2021,8,12]],“时间”:“2021-08-12T00:00:00Z”,“时间戳”:1628726400000},“内容版本”:“tdm”,“延迟天数”:0,“URL”:“https://creativecommons.org/licenses\/by\/4.0”},{“开始”:{“日期部分”:[[2021,8,12]],“日期时间”:“2021-08-12T00:00:00Z”,“时间戳”:1628726400000},“内容版本”:“vor”,“延迟天数”:0,“URL”:“https://creativecommons.org/licenses\/by\/4.0”}],“基金er“:[{”DOI“:“10.13039\/501100004238”,“name”:“University\u00e4t Potsdam”,“doi-asserted-by”:“crossref”,“id”:[{“id”:“10.13029\/5011000004238”,“id-type”:“doi”,“asserted-by”::“cross-ref”}]],“content-domain”:{“domain”:[“link.springer.com”],“crossmark-restriction”:false},“short-container-tile”:[“BMC生物信息学”],published-print“:{“date-parts”:[[2021,12]]},“摘要”:“摘要<\/jats:title>背景<\/jats:title>可复制基准测试对于评估应用于基因表达数据的新特征选择方法的有效性非常重要,特别是对于包含在线知识库中生物信息的先验知识方法。然而,不存在可扩展、提供内置特征选择方法和包括分类性能、稳健性和生物相关性的综合结果评估的成熟基准测试系统。此外,先前知识特征选择方法的特殊需求,即统一访问知识库,并未得到解决。因此,先前的知识方法不会在彼此之间进行评估,从而留下关于其有效性的未决问题<\/jats:p>结果<\/jats:title>我们提出了Comporior基准测试工具,它有助于特征选择方法的快速开发和轻松基准测试,特别关注先验知识方法。Compior可通过自定义方法进行扩展,提供内置的标准特征选择方法,支持对多个知识库的统一访问,并提供可自定义的评估基础结构,以比较多种特征选择方法的分类性能、健壮性、运行时间和生物相关性<\/jats:p>结论<\/jats:title>Comporior允许重复基准测试,尤其是先前知识方法,这有助于其适用性,并首次实现对其有效性的全面评估<\/jats:p><\/jats:sec>“,”DOI“:”10.1186\/s12859-021-04308-z“,”type“:”journal-article“,”created“:{”date-parts“:[2021,8,12],”date-time“:”2021-08-12T14:03:07Z“,”timestamp“:1628776987000},”update-policy“:by-count“:1,”title“:[”比较:促进基因表达数据集“],”前缀“:”10.1186“,”卷“:”22“,”作者“:[{”ORCID“:”http://\/ORCID.org\/00000-0003-4273-0012“,”authenticated-ORCID“:false,”给定“:”Cindy“,”family“:”Perscheid“,”sequence“:”first“,”affiliation“:[]}],“member”:“297”,“published-online”:{“date-parts”:[[2021,8,12]]},“reference”:[{“issue”:“8”,“key”:“4308_CR1”,“doi-asserted-by”:“publisher”,”first page“:”1416“,”doi“:”10.1093\/生物信息学\/btx795“,”volume“:“34”,“author”:“M Chiesa”,“year”:“2018”,“unstructured”:“Chiesa M,Colombo GI,Piacentini L。DaMiRseq\u2014an R\/Bioconductor软件包,用于RNA-Seq数据的数据挖掘:规范化、特征选择和分类。生物信息学。2018;34(8):1416\u20138.“,”journal-title“:“生物信息学”},{“key”:“4308_CR2”,“unstructured”:“Determan Jr.CE.Package\u2018omicsmarker\u2019 2017.”}、{“issue”:“11”,“key“:”4308_CR3“,”doi-asserted-by“:”publisher“,”first page“:“1851”,“doi”:“10.1093\/btv066”,“volume”:”31“author”:“D Strbena c“,”年份“:”2015“,”非结构化“:”斯特比纳克·D、曼·GJ、奥尔默罗德·JT、杨·JY。ClassifyR:用于分类性能评估的R包,用于转录组学。生物信息学。2015;31(11):1851\u20133.“,”journal-title“:“生物信息学”},{“issue”:“1”,“key”:“4308_CR4”,“doi-asserted-by”:“publisher”,“first-page”:“25”,“doi”:“10.1038\/75556”,“volume”:”25“,“author”:“M Ashburner”,“year”:“2000”,“unstructured”:“AshburnerM,Ball CA,Blake JA,Botstein D,Butler H,Cherry JM,Davis AP,Dolinski K、Dwight SS、Eppig JT等。基因本体:生物学统一的工具。自然遗传学。2000;25(1):25\u20139.“,”journal-title“:”Nat-Genet“},{“key”:“4308_CR5”,“doi-asserted-by”:“crossref”,“unstructured”:“Perscheid C.高维基因表达数据集上的综合生物标记检测:先验知识方法的调查。生物信息简介。2021;22(3):bbaa151.\u00a0”,“doi”:“10.1093\/bib\/bbaa151”},}“issue”:“6”,“key“:”4308_CR 6“,”doi-asserted-by“:”publisher“,”first-pages“:”787“,”doi“:”10.1016\/j.jbi.2007.06.005“,”volume“:”40“,”author“:”R Bellazzi“,”year“:”2007“,”unstructured“:”Bellazzy R,Zupan B。面向基于知识的基因表达数据挖掘。J生物识别信息。2007;40(6):787\u2013802.“,”journal-title“:”J Biomed Inform“},{”issue“:”2“,”key“:”4308_CR7“,”first page“:“215”,“volume”:“2”,“author”:“N Pasquier”,“year”:“2008”,“unstructured”:“Pasquier N,Pasquier C,Brisson L,Collard M。使用领域知识挖掘基因表达数据。Int J Softw Inform(IJSI)。2008;2(2):215\u201331.”,“journal-title标题“:”Int J Softw Inform(IJSI)“},{“issue”:“1”,“key”:“4308_CR8”,“doi asserted by”:“publisher”,“首页”:“86309”,“doi”:“10.1371\/journal.pone.00866309”,“volume”:“9”,“author”:“C Park”,“year”:“2014”,“nonstructured”:“Park C,Ahn J,Kim H,Park S”。利用半监督学习构建整合基因网络分析癌症复发。PLOS ONE公司。2014;9(1):86309.“,”journal-title“:”PLOS ONE“},{“key”:“4308_CR9”,“unstructured”:“Vert J-P,Kanehisa M.使用扩散核和核CCA从微阵列数据中提取图形驱动的特征。In:Advances In neural information processing systems(NIPS),2002。”},“issue”:“1”,“key“:”4308_CR10“,”doi-asserted-by“:”publisher“,”first page“:“21”,“doi”:“10.1186\/1471-2105-10-S1-S21“,“volume”:“10”,“author”:“Y Zhu”,“year”:“2009”,“unstructured”:“Zhu Y,Shen X,Pan W.用于微阵列样本分类的基于网络的支持向量机。BMC生物信息。2009;10(1):21.“,”journal-title“:”BMC Bioninform“},{”issue“:”W1“,”key“:”4308_CR11“,“doi-asserted-by”:“publisher”,“first page”:“191”,”doi“:”10.1093\/nar\/gkz369“,”volume“:“47”,“author”:“U Raudvere”,“year”:“2019”,“unstructured”:“Raudvere U、Kolberg L、Kuzmin I、Arak T、Adler P、Peterson H、Vilo J.g:Profiler:用于功能富集分析和基因列表转换的web服务器(2019年更新)。2019年《核酸研究》;47(W1):191\u20138.”,“journal-title”:“核酸Res”},{“key”:“4308_CR12”,“doi-asserted-by”:“publisher”,“unstructured”:“Perscheid C,Grasnick B,Uflacker M.基因表达数据的综合基因选择:为传统方法提供生物背景。J Integrr Bioninform.2019;16(1).https:\/\/doi.org\/10.1515\/jib-2018-0064.”,“doi”:“10.1515\/jib-2018-0064“},{”issue“:”4“,”key“:”4308_CR13“,”doi-asserted-by“:”publisher“,”first page“:“514”,”doi“:”10.1093\/bioinformatics\/btaa776“,“volume”:“37”,“author”:“C Zeng”,“year”:“2021”,“unstructured”:“Zeng C,Thomas DC,Lewinger JP.Incorporating prior knowledge into regulated regulated回归.生物信息学.2021;37(4):514\u201321。“,”journal-title“:“生物信息学”},{“issue”:“38”,“key”:“4308_CR14”,“doi-asserted-by”:“publisher”,“first-page”:“13544”,“doi”:“10.1073\/pnas.0506577102”,“volume”:”102“,“author”:“L Tian”,“year”:“2005”,“unstructured”:“Tian L、Greenberg SA、Kong SW、Altschuler J、Kohane IS、Park PJ。在表达谱研究中发现具有统计意义的途径。国家科学院院刊。2005;102(38):13544\u20139.“,”journal-title“:”Proc Natl Acad Sci“},{”issue“:”11“,”key“:”4308_CR15“,”doi-asserted-by“:”publisher“,”first-page“:”1000217“,”doi“:”10.1371“\/journal.pcbi.1000217”,“volume”:“4”,“author”:“E Lee”,“year”:“2008”,“unstructured”:“Lee E,Chuang H-Y,Kim J-W,Ideker T,Lee D。推断精确疾病分类的途径活动。公共科学图书馆计算生物学。2008;4(11):1000217.“,”journal-title“:”PLoS Compute Biol“},{”issue“:”1“,”key“:”4308_CR16“,”doi-asserted-by“:”publisher“,”first page“:“27”,”doi“:”10.1093\/nar\/28.1.27“,”volume“:”28“,”author“:”M Kanehisa“,”year“:”2000“,”unstructured“:”KanehisaM,Goto S.KEGG:京都基因和基因组百科全书。《氨基酸研究》2000;28(1):27\u201330.“,”journal-title“:”Nucleic Acids Res“},{”issue“:”D1“,”key“:”4308_CR17“,”doi-asserted-by“:”publisher“,“first page”:“985”,“doi”:“10.1093\/nar\/gkw1055”,”volume“:“45”,“author”:“G Koscielny”,“year”:“2016”,“unstructured”:“Koscierny G,An P,Carvalho-Silva D,Cham JA,Fumis L,Gasparyan R,Hasan S,Karamanis N、Maguire M、Papa E等人。开放靶点:用于治疗靶点识别和验证的平台。2016年《核酸研究》;45(D1):985\u201394.”,“journal-title”:“核酸研究”},{“key”:“4308_CR18”,“doi-asserted-by”:“publisher”,“unstructured”:“Pi\u00f1ero J,Queralt-Rosinach N,Bravo\u00c0,Deu-Pons J,Bauer-Mehren A,Baron M,Sanz F,Furlong LI。DisGeNET:人类疾病及其基因动态探索的发现平台。数据库2015。https:\/\/doi.org\/10.1093\/database\/bav028.“,”doi“:”10.1093\/database“\/bav0028”},{“key”:“4308_CR19”,“doi-asserted-by”:“publisher”,“unstructured”:“Rodchenkov I、Babur O、Luna A、Aksoy BA、Wong JV、Fong D、Franz M、Siper MC、Cheung M、Wrana M、Mistry H、Mosier L、Dlin J、Wen Q、O\u2019Callaghan C、Li W、Elder G、Smith PT、Dallago C、Cerami E、Gross B、Dogrusoz U、Demir E、Bader GD、Sander C.Pathway commons 2019更新:整合、分析和探索路径数据。2019年《核酸研究》;48(1):489\u201397。https:\/\/doi.org\/10.1093\/nar\/gkz946.“,”doi“:”10.1093\/nar\\gkz946“},{“key”:“4308_CR20”,“doi-asserted-by”:“crossref”,“unstructured”:“Chen EY,Tan CM,Kou Y,Duan Q,Wang Z,Meireles GV,Clark NR,Ma\u2019ayan A.Enrichr:交互式和协作HTML5基因列表富集分析工具。BMC Bioninform.2013;14(1):128.”,“内政部”:“10.1186\/1471-2105-14-128“},{“问题”:“3”,“关键”:“4308_CR21”,“doi-asserted-by”:“出版商”,“首页”:“90”,“doi”:“10.1002\/cpz1.90”,“卷”:“1”,“作者”:“Z Xie”,“年份”:“2021”,《非结构化》:“Xie Z,Bailey A,Kuleshov MV,Clarke DJ,Evangelista JE,Jenkins SL,Lachmann A,Wojciechowicz ML,Kropiwn icki E、Jagodnik KM等人。利用enrichr进行基因集知识发现。当前协议。2021;1(3):90.”,“journal-title”:“Curr Protoc”},{“key”:“4308_CR22”,“unstructured”:“Kendall MG.排名相关方法.1948.”}“:”Wilkinson MD、Dumoniter M、Aalbersberg IJ、Appleton G、Axton M、Baak A、Blomberg N、Boiten J-W、da Silva Santos LB、Bourne PE等。科学数据管理和管理的公平指导原则。科学数据。2016;3(1):1\u20139.“,”journal-title“:”Sci Data“},{“key”:“4308_CR24”,“doi-asserted-by”:“publisher”,“unstructured”:“Gruenpeter M,Di\u00a0Cosmo R,Koers H,Hertrich P,Hooft R,Parland-von\u00a0 Essen J,Tana J,Aalto T,Jones S.M2.15《关于软件\u2019FAIRness of software\u2019的评估报告》。泽诺,2020年。https:\/\/doi.org\/10.5281\/zenodo.4095092.“,”doi“:”10.5281\/zenodo.4.095092“},{“问题”:“24”,“密钥”:“4308_CR25”,“doi-asserted-by”:“发布者”,“首页”:“3241”,“doi”:“10.1093\/生物信息学\/btt547”,“卷”:“29”,“作者”:“T Cokelaer”,“年份”:“2013”,“非结构化”:“Cokelare”阿尔·T、普尔茨·D、哈德·LM、塞拉·穆萨奇J、塞伊兹·罗德里格斯J。Bioservices:以编程方式访问生物web服务的通用python包。生物信息学。2013;29(24):3241\u20132.“,”journal-title“:“生物信息学”},{“issue”:“12”,“key”:“4308_CR26”,“doi-asserted-by”:“publisher”,“first-page”:“966”,“doi”:“10.1038\/nmeth.4077”,“volument”:“13”,“author”:“D T\u00fcrei”,“year”:“2016”,“unstructured”:“T\u00 fcrei D,Korcsm\u00e1ros T,Saez-Rrig尤兹·J。Omnipath:文献控制信号通路资源的指南和网关。自然方法。2016;13(12):966\u20137.“,”journal-title“:”Nat Methods“},{”issue“:”1“,”key“:”4308_CR27“,”doi-asserted-by“:”publisher“,”first page“:“1”,”doi“:”10.1186\/s13073-015-0131-9“,“volume”:“7”,“author”:“LH Saal”,“year”:“2015”,“unstructured”:“Saal LH、Vallon-Christerson J、H\u00e4kkinen J、Hegardt C、Grabau D、Winter C、Brueffer C、Tang M-HE、Reutersw\u00e 4rd C、Schulz R等。瑞典癌症分析网络乳腺(scan-b)倡议:在临床常规中实施乳腺癌基因组分析的大规模多中心基础设施。《基因组医学》2015;7(1):1\u201312.“,”journal-title“:”Genome Med“},{”issue“:”8“,”key“:”4308_CR28“,”doi-asserted-by“:”publisher“,”first page“:“1160”,”doi“:”10.1200\/JCO.2008.1370“,“volume”:“27”,“author”:“JS Parker”,“year”:“2009”,“unstructured”:“Parker JS,Mullins M,Cheang MC,Leung S,Voduc D,Vickery T,Davies S、Fauron C、He X、Hu Z等。基于内在亚型的乳腺癌风险预测值的监测。临床肿瘤学杂志。2009;27(8):1160。”,“期刊标题”:“J Clin Oncol”},{“issue”:“12”,“key”:“4308_CR29”,“doi asserted by”:“publisher”,“first page”:“1739”,“doi”:“10.1093\/biologistics\/btr260”,“volume”:“27”,“author”:“A Liberzon”,“year”:“2011”,“nonstructured”:“Liberzon A,Subramanian A,Pinchback R,Thorvaldsd\u00f3ttir H,Tamayo P,Mesironian v JP一案。分子签名数据库(MSigDB)。生物信息学。2011;27(12):1739\u201340.“,“journal-title”:“生物信息学”},{“issue”:“4”,“key”:“4308_CR30”,“doi-asserted-by”:“publisher”,“first-page”:“283”,“doi”:“10.1038\/nmeth.3805”,“volume”:”13“author”:“C Soneson”,“year”:“2016”,“unstructured”:“Soneson C,Robinson MD.iCOBRA:开放、可复制、标准化和实时方法标杆。Nat Methods。2016年;13(4):283.“,”journal-title“:”Nat Methods“},{”issue“:”2“,”key“:”4308_CR31“,”doi-asserted-by“:”publisher“,”first page“:“732”,”doi“:”10.1021\/acs.jproteome.8b00523“,”volume“:‘18’,”author“:”J Willforss“,”year“:”2018“,”unstructured“:”Willfors J,Chawade A,Levander F。Normalyzerde:用于改进组学表达数据标准化和高灵敏度差异表达分析的在线工具。蛋白质组学研究杂志2018;18(2):732\u201340.“,”journal-title“:”J Proteome Res“},{“issue”:“1”,“key”:“4308_CR32”,“doi-asserted-by”:“publisher”,“first page”:”137“,“doi”:“10.1093\/生物信息学”:“35”,“author”:“PK Kimes”,”year“2019”,“unstructured”:“Kimes PK,Reyes A.使用summarizedbenchmark进行可复制和可复制比较。生物信息学2019年;35(1):137\u20139.“,”journal-title“:”Bioinformatics“},{”issue“:”7“,”key“:”4308_CR33“,”doi-asserted-by“:”publisher“,”first page“:“2288”,”doi“:”10.1093\/bioinformations\/btz889“,”volume“:36”,“author”:“S Su”,“year”:“2020”,“unstructured”:“Su S,Tian L,Dong X,Hickey PF,Freytag S,Ritchie ME。Cellbench:用于比较单细胞RNA-Seq分析方法的R\/生物导体软件。生物信息学。2020;36(7):2288\u201390.“,”journal-title“:”Bioinformatics“},{“issue”:“1”,“key”:“4308_CR34”,“doi-asserted-by”:“publisher”,“first page”:”1“,”doi“:”10.1186\/s13059-020-02136-7“,”volume“:”21“,”author“:”P-L Germain“,”year“:”2020“,”unstructured“:”Germain P-L、Sonrel A、Robinson MD.pipeComp是评估计算管道的通用框架,揭示了性能良好的单细胞RNA-Seq预处理工具。基因组生物学。2020;21(1):1\u201328.“,”journal-title“:”Genome Biol“},{“issue”:“1”,“key”:“4308_CR35”,“doi-asserted-by”:“publisher”,“first-page”:“10”,“doi”:“10.1145\/1656274.1656278”,“volume”:”11“author”:“M Hall”,“year”:“2009”,“unstructured”:“Hall M、Frank E、Holmes G、Pfahringer B、Reutemann P、Witten IH。WEKA数据挖掘软件:更新。ACM SIGKDD探索新闻。2009;11(1):10\u20138.“,”journal-title“:”ACM SIGKDD Explorations Newsl“}],”container-title”:[“BMC生物信息学”],”original-title:“[],”language“:”en“,”link“:[{”URL“:”https:\\/link.springer.com\/content\/pdf\/10.1186\/s12859-021-04308-z.pdf“,”content-type“:”application\/pdf“、”content-version“:”vor“,”intended-application“:”text-mining“},{”URL“:”https:\/\/link.springer.com/article\/10.1186\/s12859-021-04308-z\/fulltext.html“,“内容类型”:“文本\/html”,“内容版本”:“vor”,“intended-application”:“text-mining”},{“URL”:“https:\//link.springer\com/content\/pdf\/10.1186 \/s12859-021-04308-z.pdf”,“content-type”:“application\/pdf”“:”相似性检查“}”,“存放”:{“日期-部分”:[[2023,1,7]],“日期-时间”:“2023-01-07T06:32:00Z”,“时间戳”:1673073120000},“分数”:1,“资源”:{“主要”:{-“URL”:“https:\/\/bmcbioinformations.biomedcentral.com/articles\/10.1186\/s12859-021-04308-z”},”副标题“:[],”短标题“:[],”已发布“:{”日期-部分“:[202 1,8,12]]},“引用计数”:35,“新闻期刊“:{”期刊“:“1”,“published-print”:{“date-parts”:[2021,12]}},“alternative-id”:[“4308”],“URL”:“http://\/dx.doi.org\/10.1186\/s12859-021-04308-z”,“relationship”:{},”ISSN“:[”1471-2105“],”ISSN-type“:[{”value“1471-2100”,“type”:“electronic”}],“subject”:[],“publish”:{“日期部分”:[[2021,8,12]]},“断言”:[{“值”:“2021年4月28日”,“order“:1,”name“:”received“,”label“:”received“,“group”:{“name”:“Article History”,“label”:“文章历史”}},{“value”:“2021年7月27日”,“order”:2,“name”:“accepted”,“table”:“accepted组“:{”名称“:”Article History“,”label“:”Article History“}},{”order“:1,”name“:”Ethics“,”group“:“名称”:“EthicsHeading“,”label“:”出版同意“}},”{“value”:“作者声明他们没有竞争性利益。”,“order”:4,“name”:“Ethics”,“group”:{“name”:“EthicsHeading”,“label”:“竞争性利益”}}],“文章编号”:“401”}}