{“状态”:“确定”,“消息类型”:“工作”,“信息版本”:“1.0.0”,“邮件”:{“索引”:{-“日期-部件”:[[2024,5,2],“日期-时间”:“2024-05-02T23:28:41Z”,“时间戳”:1714692521120},“引用-计数”:38,“发布者”:“威利”,“问题”:“4”,“许可证”:[{“开始”:{“日期-零件”:[2020,3,17]],“日期时间”:”2020-03-03 17T00:00:00Z“,”时间戳“:1584403200000},“content-version”:“vor”,“delay-in-days”:0,“URL”:“http://\/onlinelibrary.wiley.com/termsAndConditions#vor”}],“content-domain”:{“domain”:[“wires.onlinelibrary.wiley.com”],“crossmark-restriction”:true},“short-container-title”:[“wires Data Min&Knowl”],”published-print“:{”date-parts“:[2020,7]},”abstract“:”摘要<\/jats:title>如今,数据的维度正在以巨大的方式增加。因此,传统的特征选择技术并不直接适用。因此,最近的研究导致了一种从特征流中选择特征的更有效方法的发展,称为流特征选择。另一个与特征选择相关的活跃研究领域是特征分组。特征分组通过评估所选特征的隐藏信息来选择相关特征。然而,尽管特征分组是一种很有前途的技术,但它并不直接适用于特征流。在本文中,我们提出了一种新的高效算法,该算法使用在线特征分组,嵌入一种新增量技术,从特征流中选择特征。这种技术将相似的特征组合在一起;它将新引入的功能分配给现有组或创建新组。据我们所知,这是第一种建议使用增量特征分组从特征中进行特征选择的方法。我们已经实现了该算法,并使用基准数据集对其进行了评估,对比了使用特征分组或增量选择技术的流媒体特征选择算法的状态。结果表明,通过在线选择和分组相结合,该技术在预测精度和运行时间方面具有优越的性能<\/jats:p>本文分类如下:\n个\u2003\u2003Algorithmic Development>时空数据挖掘\u2003\u2003技术>数据预处理\u2003\u2003技术>分类\u2003\u2003Technologies>Machine Learning机器学习org\/10.1002\/crossmark_policy“,”源“:”Crossref“,“is-referenced-by-count“:5,”title“:[“在线流媒体功能选择与增量功能分组”],”prefix“:”10.1002“,”volume“:”10“,”author“:[{”ORCID“:“http://\/ORCID.org\/00000-0002-6547-3509”,”authenticated-ORCID“:false,”given“:Noura”,“family”:“Al-Nuami”,”sequence“:”first“,”affiliation“:[}”name“:”阿拉伯联合酋长国大学阿布扎比阿联酋分校“}]},{“given”:“Mohammad M.”,“family”:“Masud”,“sequence”:“additional”,“affiliation”:[{“name”:“United Arabi Emirates University Abu Dhabi UAE”}]}],“member”:“311”,“published-online”:{“date-parts”:[[2020,3,17]]}、“reference”:[}“key”:”“e_1_2_10_2_1”、“doi-asserted-by”:”publisher“,“doi”:“10.1201\/b17320“},{”key“:”e_1_2_10_3_1“,”首页“:”1“,”article-title“:”高频数据的主成分分析“,”author“:”A\u00eft\u2010Sahalia Y.“,”year“:”2018“,”journal title“:“journal of the American Statistical Association”},{“key”:“e_1_i_10_4_1”,“doi-asserted-by”:“publisher”,”doi“:”10.1109 \/DSA.2017.81“},”{“key”:”e_ 2_10_5_1“”,”doi-asserted-by“:”publisher“,”doi“:”10.1016\/j.aci.2019.01.001“},{”issue“:”3“,”key“:”e_1_2_10_6_1“,“首页”:“175”,”article-title“:”内核和最近邻非参数回归简介“,”volume“:“”doi由“:”publisher断言,“doi”:“10.1023\/A:1010933404324”},{“key”:“e_1_2_10_8_1”,“doi由”:“publisher断言,“doi”:“10.1007\/BF00994018”},{“key”:“e_1_2_10_9_1”,“doi由”:“publisher断言,“doi”:“10.1016\/j.jar.2015.11.006”},{“key”:“e_1_2_10_10_1”,“doi由”:“publisher”断言,“doi”:“10.1016\/j.in.2015.07.041”},{“key”:“e_1_2_10_11_1”,“doi-asserted-by“:”publisher“,”doi“:”10.1109\/ICBK.2017.16“},{“key”:“e_1_2_10_12_1”,“doi-assert-by”:“publisher”,“doi”:“10.1007\/s13042-016-0595-y”},}“issue”:“3”,“key“:”e_1_i_10_13_1“,tle“:”短期\u2010年预测\u2014概述“,”卷“:”6“,”作者“:”Landberg L.“,“年份”:“2003年”,“新闻标题”:“风能:风力发电转换技术进展和应用的国际期刊”},{“key”:“e_1_2_10_14_1”,“doi-asserted-by”:“publisher”,”doi“:”10.1109\/ICDM.2013.137“},”{“key”:”e_1_i_10_15_1“,”doi-assert-by“:”publisher“非结构化“:”MIMIC II数据库。(n.d.).https:\/\/mimic.physicnet.org\/database.html“},{“key”:“e_1_2_10_17_1”,“volume-title”:“使用嫁接进行在线特征选择”,“author”:“Perkins Simon”,“year”:“2003”},“key“:”e_1_i_10_18_1OSFSMI:基于互信息的在线流特征选择方法”,“author”:“Rahmaninia M.”,“year”:“2017”,“journal-title”:“Applied Soft Computing”},{“key”:“e_1_2_10_20_1”,《doi-asserted-by》:“publisher”,”doi“:”10.1038\/nbt0308-303“}”,{”key“:”e_1_i_10_21_1“unstructured”:“Siu C.Xu D.&Yi R.(2018)。多样化的在线功能选择。ArXiv预打印ArXiv:1806.04308.“},{“key”:“e_1_2_10_22_1”,“doi-asserted-by”:“publisher”,“doi”:“10.1109\/TKDE.2011.181”},},“key“:”e_1_i_10_23_1“,”doi-assert-by“:”publisher“,‘doi’:“10.1016\/j.inffus.2017.05.003”}、{“密钥”:“e_1_20_24_1”,‘非结构化’:“UCI机器学习库:数据集。(未注明日期).https:\/\/archive.ics.uci.edu\/ml\/datasets.html“},{”key“:”e_1_2_10_25_1“,”doi-asserted-by“:”publisher“,“doi”:“10.1145\/2641190.2641198”},“key”:“e_1_i_10_26_1”,“doi-assert-by”:“publisher”,”doi“:”10.1016\/j.knosys.2012.10.010“}”,{“key“”:”e_ 1_2_ 10_27_1“”,“首页”:“1757”,“article-title”:“在线群组特征选择”,“作者”:“王杰”,“年份”:“2013年“,”journal-title“:”IJCAI“},{”key“:”e_1_2_10_28_1“,”doi-asserted-by“:”publisher“,“doi”:“10.1007\/s10115-007-0114-2”},“key”:“e_1_i_10_29_1”,“doi-assert-by”:“publisher”,”doi“:”10.1109\/TPAMI.2012.197“}”,{第27届机器学习国际会议论文集(ICML\u201010)“,”作者:“Wu X.”,“年份”:“2010”},{“key”:“e_1_2_10_31_1”,“doi-asserted-by”:“publisher”,“doi”:“10.3390\/app8122548”}DM.2014.63“},{”key“:”e_1_2_10_34_1“,”doi-asserted-by“:”publisher“,“doi”:“10.1145\/2976744“},{“key”:“e_1_2_10_35_1”,“首页”:“1205”,“article-title”:“通过相关性和冗余分析进行有效的特征选择”,“volume”:”5“,“author”:“Yu L.”,”year“:”2004“,”journal-title“:”journal of Machine Learning Research“}”,{在线流媒体特征选择使用抽样技术和特征之间的相关性”,“作者”:“郑H.\u2010T。“,”“年份”:“2016年”,“新闻标题”:“亚太地区2010年网络会议”},{“key”:“e_1_2_10_37_1”,“doi-asserted-by”:“publisher”,”doi“:”10.1145\/1081870.1081914“},”{“key”:”e_1_i_10_38_1“,”doi-assert-by“:”publisher“,y“:”publisher“,”doi“:”10.1016\/j.patcog.2018.08.009“}],“container-title“:[“WIREs数据挖掘和知识发现”],“original-title”:[],“language”:“en”,“link”:[{“URL”:“https:\/\/api.wiley.com/onlinelibrary\/tdm\/v1\/articles \/10.1002%2Fwidm.1364”,“content-type”:“application\/pdf”,“content-version”:“vor”,“intended-application”:“text-Mining”},{“URL”:“https:\/\/onlinelibrary.wiley.com/doi\/pdf\/10.1002\/widm.1364“,“content-type”:“application\/pdf”,“content-version”:“vor”,“intended-application”:“text-mining”},{“URL”:“https:\//onlinelibrary.wiley.com\/doi\/full-xml\/10.10002\/widm.1364”,“content-type“:”application\\xml“,”content-versiion“:”vor“,“intented-appliation”:“text-mining”},{“URL”:“https:\/\/wires.onlinelibrary.wiley.com//doi\/pdf\/101002\/widm.1364“,”content-type“:”unspecified“,”content-version“:”vor“,”intended-application“:”similarity-checking“}],”deposed“:{”date-parts“:[2023,8,29]],”date-time“:“2023-08-29T17:22:38Z”,”timestamp“:169332975800},”score“:1,”resource“:”{“primary”:{“URL”:“https:\/\/wires.onlinelibrary.wiley.com/doi\/10.1002\/widm.1364“}},”副标题“:[],”短标题“:[],”已发布“:{”日期部分“:[[2020,3,17]]},“引用计数”:38,”日志发布“:}”问题“:“4”,”发布-打印“:{”日期部分”:[2020,7]}}、“alternative-id”:[“10.1002\/widm.1364”],“”URL“:”http://\/dx.doi.org\/10.1002\/widm.1364“,”存档“:[”Portico“],”关系“:{},”ISSN“:[”1942-4787“,”1942-7795“],”ISSN-type“:[{”value“:”1942-4487“,“type”:“print”},{”value“:”1949 2-4795“,”type“:”electronic“}],“subject”:[],“published”:{“date-parts”:[2020,3,17]]},“assertion”:[{“value”:”2019-02-11“,“order”:0,“name”:“received”,“label”:“received”,组“:{”name“:”publication_history“,”label“:”publication history“}},{“value“:”2020-02-20“,”order“:1,”name“:”accepted“,”label“:”accepted”,“group”:{“name”:“publication_history”,“label”:“publication history”}},{“value”:“2020-03-17”,“order”:2,“name”(名称):“published”(已发布),“lable”:“published”