{“状态”:“确定”,“消息类型”:“工作”,“信息版本”:“1.0.0”,“邮件”:{“索引”:{“日期-部件”:[[2024,1,26]],“日期-时间”:“2024-01-26T10:40:44Z”,“时间戳”:1706265644579},“引用-计数”:28,“发布者”:“威利”,“问题”:“6”,“许可证”:[{“开始”:“日期-零件”:[2022,5,11]],”日期-时间“:”2022-0 5-11T00:00:00Z“,”时间戳“:165222720000},“content-version”:“am”,“delay-in-days”:365,“URL”:“http://\/onlinelibrary.wiley.com/termsAndConditions#am”},{“start”:{“date-parts”:[[2021,5,11]],“date-time”:“2021-05-11T00:00Z”,“timestamp”:1620691200000},“content-version”:“vor”,“delay-in-days”:0,“URL”:“http:\\/onlinelibrary.wiley.com/termsand”条件#vor“}],“出资人”:[{“DOI”:“10.13039\/1000000015”,“name”:“美国能源部”,“doi-asserted-by”:“publisher”,“award”:[“DE\u2010NA0003525”]},{“doi”:“10.130.39\/100006234”,“name:”Sandia National Laboratories“,”doi-assert-by“:”publisher“,”award“:[”SAND2020\u2010717171C“]}”,{by“:”publisher“},{“DOI”:“10.13039\/100006134”,“name”:“能效和可再生能源办公室”,“DOI-asserted-by”:“publisher”}],“content-domain”:{“domain”:[“onlinelibrary.wiley.com”],“crossmark-restriction”:true},“short-container-title”:[“统计分析”],”published-print“:{”date-parts“:[2021,12]},”abstract“:”摘要<\/jats:title>2010年,基于化学和燃料特性的新型生物燃料分子的硅筛选是生物燃料评估过程中的关键第一步,因为实验测试需要大量样品,发动机测试的破坏性,以及与新型燃料的台架合成相关的成本。预测模型受到现有少量测量值的训练集的限制,通常包含类似类别的分子,这些分子仅代表潜在分子燃料空间的一个子集。软件工具可以用来生成每个可能的分子描述符,用作输入特征,但大多数这些特征在很大程度上是不相关的,在维数高于大小的数据集上训练模型往往会产生较差的预测性能。研究表明,特征选择可以改进机器学习模型,但基于相关性的特征选择无法对决定结构-属性关系的潜在机制提供科学见解。在特征选择中实施因果发现可以潜在地为生物燃料设计过程提供信息,同时还可以提高模型预测准确性和对新数据的鲁棒性。在本研究中,我们研究了基于因果关系\u2010的特征选择对模型性能和关键分子亚结构识别的益处。我们发现基于因果关系\u2010的特征选择与替代过滤方法表现不相上下,并且结构因果模型为分子亚结构和燃料特性之间的关系提供了有价值的科学见解<\/jats:p>“,”DOI“:”10.1002\/sam.1151“,”type“:”journal-article“,”created“:{”date-parts“:[2021,5,11]],”date-time“:”2021-05-11T17:52:46Z“,”timestamp“:1620755566000},”page“:,“标题”:[“评估基于因果\u2010的燃料特性预测模型特征选择“],”前缀“:”10.1002“,”卷“:”14“,”作者“:[{”ORCID“:”http://\/ORCID.org\/0000-0003-4203-6805“,”authenticated-ORCID“:false,”给定“:”Bernard“,”family“:”Nguyen“,”sequence“:”first“,”affiliation“:”[{“name”:“Sandia National Laboratories Livermore California USA”}]},{“given“:”Leanne S.“,”family“:”Whitmore“,”sequence“:”additional“,”affiliation“:”Sandia National Laboratories Livermore California USA“},”{“name”:“University of Washington Seattle Washingth USA”}]},{“given”:“Anthe”,“family”:“George”,“sequence”:“additional”,“affiliance”:[{“name:”Sandia National Laboratories Livermore California USA“}]},{“ORCID”:“http://\/ORCID.org\/00000-0003-4796-538X”,“authenticated-ORCID”:false,“given”:Corey M.,“family”:“Hudson”,“sequence”:“additional”,“affiliation”:[{“name”:“Sandia National Laborations Livermore-California USA”}]}],“member”:“311”,“published-on-line”:{“date-parts”:[2021,5,11]]}、“reference“:[{”key“:”e_1_2_7_2_1“,”doi-asserted-by“:”publisher“,“doi”:“10.3389\/fmech.2015.0016”},{“key”:“e_1_i_7_3_1”,“doi-assert-by”:“publisher”,”doi“:”10.3389\\fmech.2018.00020“},”{“密钥”:“e_1_2_7_4_1”Mittal V.和J。B.海伍德:燃料RON和MON与现代汽油机爆震发生的相关性。SAE技术论文系列2008。https://\/doi.org\/10.4271\/2008\u201001\u20102414.“,”doi“:”10.4271\/2008-01-2414“},{“key”:“e_1_2_7_5_1”,“doi-asserted-by”:“crossref”,”unstructured“:”e.W.Chow J。B.海伍德和R。L.Speth高辛烷值标准汽油对美国2010年轻型车辆车队的益处。SAE技术论文系列2014。https:\/\/doi.org\/10.4271\/2014\u201001\u20101961.“,”doi“:”10.4271\/2014-01-1961“},{“key”:“e_1_2_7_6_1”,“doi-asserted-by”:“publisher”,”doi:“10.4271\/2009\u201001 \u20102622”},“key“:”e_1_i_7_1“,”volume-title“:”火花发动机燃料研究辛烷值的标准测试方法”,“作者“:”ASTM,D2699\u201016”,“年份”:“2016”},{“密钥”:“e_1_2_7__8_1”,“卷标题”:“发动机火花辛烷值标准测试方法\u2010点火发动机燃料”,“作者”:“ASTM,D2700\u201016a”,“年份”:“2016”},{“密钥”:“e_1_2_7_9_1”,“doi断言者”:“publisher”,“doi”:“10.1021\/acs.energyfuels.6b01952”},{“密钥”:“e_1_2_7_10_1”,“doi由“:”发布者“断言,”DOI“:”10.1016\/j.compleceng.2013.11.024“},{“key”:“e_1_2_7_11_1”,“volume-title”:“机器学习的特征选择:比较基于相关性\u2010的过滤方法与包装器”,“author”:“Hall M.a.”,“year”:“1999”},}“key”:_1“,”doi-asserted-by“:”publisher“,”doi“:”10.1186\/s40535\u2010016\u20100018\u2010x“},{“key”:“e_1_2_7_14_1”,“unstructured”:“美国能源部Co\u2010optimization of fuels and engines:Fuel propertimissions database:NREL 2020 available athttps:\/\/www.NREL.gov\/transportation\/fuels\u2010properties\u2010database\/.”},“key“:”e_1_i_7_15_1“,“doi-asserted-by“:”crossref“,”unstructured“:”C.W.Yap Padel\u2010descriptor:一个用于计算2010年分子描述符和指纹的开源软件,可从以下网址获得:http://\/onlinelibrary.wiley.com/doi\/full\/10.002\/jcc.21707“,”doi“:”10.1002\/jcc.21707“},{“key”:“e_1_2_7_16_1”,“doi-assert-by”:“publisher”,”doi:“10.1021\/ci300584r”},“”key“:”e_1_2_7_17_1“,”doi-asserted-by“:”publisher“,“doi”:“10.26434\/chemrxiv.12280325”},{“key”:“e_1_i_7_18_1”,“doi-assert-by”:“crossref”,”unstructured“:”S.Kim et al.Pubchem substance and compound databases 2015,网址:http://\\ademicial.oup.com/nar\/articlex\/44\/D1\/D1202\/2503131“,”doi“:”10.1093\/nar \/gkv951“},{”键“:”e_1_2_7_19_1“,”首页“:”125“,”volume-title“:”Inf.Theory Stat.Learn“,”author“:”Huang J.“,”year“:”2009“},{“key”:“e_1_2_7_20_1”,“doi-asserted-by”:“publisher”,”doi“:”10.1109\/tpami.2005.159“}”,{”key“:”e_1_i_7_21_1“,”doi-assert-by“:”publisher“,“doi”:“10.1007\/s00521\u2010013\u20101368\u20100”},{“key”:“e_1_2_7_22_1”,“doi-asserted-by”:“publisher”,“doi”:“10.1186\/1471\u20102105\u201010\u2010213“},{”key“:”e_1_2_7_23_1“,”doi-asserted-by“:”publisher“,“doi”:“10.1186\/12471\u 20102105\ u20108\u201025”},“key”:“e_1_i_7_24_1”,“doi-assert-by”:“crossref”,”unstructured“:”M.Ribeiro S.Singh and C.Guestrin为什么我应该信任你?:解释计算语言学协会北美分会2016年会议任何分类器会议记录的预测:演示2016。https://\\doi.org\/10.18653\/v1\/n16\u20103020.“,”doi“:”10.18653\v1\/n16-3020“},{“key”:“e_1_2_7_25_1”,“doi-asserted-by”:“crossref”,”unstructured“:”R。K.Mothillal A.Sharma和C。Tan通过各种反事实解释解释机器学习分类器2020年公平、问责和透明度会议记录。https:\/\/doi.org/10.1145\/3351095.3372850.“,”doi“:”10.1145\/3351095.3372850“},{”key“:”e_1_2_7_26_1“,”doi断言“:”publisher“,”doi“:”10.21236\/ada580574“},{”key“:”e_1_2_7_27_1“,”doi-asserted-by“:”publisher“,“doi”:“10.1111\/cogs.12069”},{“key”:“e_1_i_7_28_1”,“unstructured”:“Microsoft Microsoft\/dowhy 2020 available athttps:\/\/github.com\/Microsoft\/dowxy”}、{“密钥”:“e_1_2_7_29_1”、“doi-assert-by”:“publisher”,”doi“:”10.1016\/j.fuel.2020.118772“}],”container-title“:[”统计分析和数据挖掘:ASA数据科学杂志“],”original-title“:[],”language“:”en“,”link“:[{”URL“:”https:\/\/onlinelibrary.wiley.com/doi\/pdf\/10.1002\/sam.11511“,”content-type“:”application\/pdf“,”content-version“:”vor“,”intended-application“:”text-Mining“},”{“URL”:“https:\/\/onlinelibrary.wiley.com/doi\/full-xml\/101002\/sam.11511“,”content-type“:”application\/xml“,”内容版本“:”vor“,”intended-application“:”text-mining“},{”URL“:”https:\///onlinelibrary.wiley.com/doi\/am-pdf\/101001\/sam.11511“,联合“},{”URL“:”https:\/\/onlinelibrary.wiley.com/doi\/pdf\/10.1002\/sam.11511“,”content-type“:”unspecified“,”content-version“:”vor“,”intended-application“:”similarity-checking“}],”deposed“:{”date-parts“:[[2023,8,28]],”date-time“:“2023-08-28T04:20:24Z”,”timestamp“:1693196424000},”score“:1,”resource“:”{“primary”:{“URL”:“https:\/\/onlinelibrary.wiley.com/doi\/101002\/sam.11511“}},”副标题“:[],”短标题“:[],”已发布“:{”日期部分“:[[2021,5,11]]},“参考计数”:28,“新闻发布”:{“发布”:“6”,“发布发布”:}“日期部分”:[2021,12]}}、“替代id”:[“10.1002\/sam.1151”],“URL”:“http://\/dx.doi.org\/10.1002\/sam.11511“,”存档“:[”Portico“],”关系“:{},”ISSN“:[”1932-1864“,”1932-1872“],”ISSN-type“:[{”value“:”1932-1844“,“type”:“print”},{“value”:”1932-1872“,”type“:”electronic“}],“subject”:[],“published”:{“date-parts”:[[2021,5,11]]},“assertion”:[{“value”:“2020-07-14”,“order”:0,“name”:“received”,“label”:“received”,“group”:{“name”:“publication_history”,“label”:“publication history”}},{”value“:”2021-04-12“,”order“:1,”name“:”accepted“,“label”:”accepted”,“group”:{“name”:”publication_history“,”label“:”publication history“}},{“value”:“2021-05-11”,”orders“:2,”name”:“published”,“label:”published“,”group“: