跳到主要内容
研究论文

基于多目标杜鹃搜索的多标签数据流特征选择

出版:2021年5月19日出版历史
跳过摘要部分

摘要

特征选择方法是通过删除用于表示数据的大量特征中不相关或冗余的特征,仅选择相关特征的过程。如今,许多应用领域,尤其是社交媒体网络,在不同的时间戳上不断产生新的功能。在这种情况下,当功能以在线方式到达时,为了应对功能的不断到达,选择任务也必须是一个连续的过程。因此,必须结合基于流特征选择的方法,即每次新特征或一组特征到达时,都必须调用特征选择过程。同样,近年来,有许多应用程序域生成数据,其中的样本可能属于多个称为多标签数据集的类。实例关联的多个标签之间可能有一些依赖关系。找到类标签之间的相互关系有助于跨多个标签选择有区别的特征。在本文中,我们为多标签数据开发了流特征选择方法,其中多标签被简化为低维空间。在执行选择方法之前,将相似的标签分组在一起,以提高选择质量和模型的时间效率。使用基于杜鹃搜索的多目标版本方法来选择最优特征集。该方法开发了两种版本的流特征选择方法:\(\))当功能单独到达时,以及\(\))当功能以批处理的形式到达时。来自文本、生物和音频等不同领域的各种多标签数据集已用于测试所开发的流特征选择方法。将所提出的方法与以往的许多特征选择方法进行了比较,从比较中可以看出在特征选择过程中使用多目标和标签关联的优越性。

工具书类

  1. 努拉·努艾米、穆罕默德·梅赫迪·马苏德、穆罕默德·阿德尔·塞哈尼和纳扎尔·扎基。2019.大数据流特征选择算法:调查。应用计算与信息学(2019)。谷歌学者谷歌学者
  2. D.P.Bertsekas博士。2006.非线性规划。雅典娜科技。谷歌学者谷歌学者
  3. 魏碧和詹姆斯·郭台铭。2011.树和数据结构层次的多标签分类。在第28届国际机器学习大会论文集(ICML'11)上。17–24.谷歌学者谷歌学者数字图书馆数字图书馆
  4. 阿尔贝托·卡诺、何塞·玛丽亚·卢纳、伊娃·L.吉巴亚和塞巴斯蒂安·文图拉。2016。多标签数据的LAIM离散化。信息科学330(2016),370-384。谷歌学者谷歌学者数字图书馆数字图书馆
  5. Hai Ha Do、P.W.C.Prasad、Angelika Maag和Aber Alsadon。2019.基于方面的情绪分析的深度学习:比较综述。专家系统与应用118(2019),272–299。谷歌学者谷歌学者数字图书馆数字图书馆
  6. 马可·多里戈(Marco Dorigo)和吉安尼·迪卡罗(Gianni Di Caro)。1999.蚁群优化:一种新的元神经算法。1999年进化计算大会会议记录,第2卷。IEEE,1470–1477。谷歌学者谷歌学者交叉引用交叉引用
  7. 奥利弗·让·邓恩。1961.平均值之间的多重比较。《美国统计协会杂志》56,293(1961),52-64。谷歌学者谷歌学者交叉引用交叉引用
  8. 安德烈·埃利塞夫和杰森·韦斯顿。2002.多标记分类的核心方法。神经信息处理系统进展论文集。681–687.谷歌学者谷歌学者数字图书馆数字图书馆
  9. 萨代赫·埃斯坎达里(Sadegh Eskandari)和穆罕默德·马苏德·贾维迪(Mohammad Masoud Javidi)。2016.使用粗糙集选择在线流媒体功能。《国际近似推理杂志》69(2016),35–57。谷歌学者谷歌学者数字图书馆数字图书馆
  10. 费利克斯·安托万·福廷和马克·帕里佐。2013年,重新审视NSGA-II拥挤距离计算。第15届遗传和进化计算年会论文集。ACM,623–630。谷歌学者谷歌学者数字图书馆数字图书馆
  11. 米尔顿·弗里德曼。1940.m排名问题重要性替代测试的比较。《数理统计年鉴》11,1(1940),86–92。谷歌学者谷歌学者交叉引用交叉引用
  12. David E.Goldberg,2006年。遗传算法。培生教育印度。谷歌学者谷歌学者
  13. 阿瑟·格雷顿(Arthur Gretton)、奥利维尔·博斯克(Olivier Bousquet)、亚历克斯·斯莫拉(Alex Smola)和伯恩哈德·舍尔科夫(Bernhard Schölkopf)。2005.使用Hilbert-Schmidt规范测量统计相关性。算法学习理论国际会议论文集。施普林格,63–77岁。谷歌学者谷歌学者数字图书馆数字图书馆
  14. Mohammad Masoud Javidi和Sadegh Eskandari,2019年。在线流媒体功能选择:一种最小冗余、最大重要性的方法。模式分析与应用22,3(2019),949–963。谷歌学者谷歌学者数字图书馆数字图书馆
  15. 凌健、李俊东、舒凯和刘欢。2016.多标签功能选择。第25届国际人工智能联合会议记录。1627年至1633年。谷歌学者谷歌学者数字图书馆数字图书馆
  16. X.Jiang和S.Li.2017。贝斯:甲虫天线搜索算法的优化问题。2017年12月。arXiv预印arXiv:1710.10724(2017)。谷歌学者谷歌学者
  17. 詹姆斯·肯尼迪和拉塞尔·埃伯哈特。1995年,粒子群优化。神经网络国际会议论文集,第4卷。IEEE,1942-1948年。谷歌学者谷歌学者交叉引用交叉引用
  18. 李在星和金大元。2013.使用多元互信息进行多标签分类的特征选择。《模式识别快报》34,3(2013),349–357。谷歌学者谷歌学者数字图书馆数字图书馆
  19. 李在星、大元和金。2017.SCLS:基于大标签集可扩展标准的多标签特征选择。模式识别66(2017),342-352。谷歌学者谷歌学者数字图书馆数字图书馆
  20. 林跃进、胡清华、刘京华、陈金坤和段洁。2016.基于邻域互信息的多标签特征选择。应用软计算38,C(2016),244–256。谷歌学者谷歌学者数字图书馆数字图书馆
  21. 林跃进、胡清华、刘京华、李金锦和吴新东。2017.基于模糊互信息的多标签学习流特征选择。IEEE模糊系统汇刊25,6(2017),1491-1507。谷歌学者谷歌学者数字图书馆数字图书馆
  22. 林耀锦、胡清华、张佳和吴新东。2016年。带流媒体标签的多标签功能选择。信息科学372,C(2016),256-275。谷歌学者谷歌学者数字图书馆数字图书馆
  23. 刘华文、张世超和吴新东。2014年,MLSLR:通过稀疏逻辑回归进行多标签学习。信息科学281(2014),310-320。谷歌学者谷歌学者数字图书馆数字图书馆
  24. 刘京华、林跃进、吴顺祥和王晨曦。2018.在线多标签群组功能选择。基于知识的系统143(2018),42–57。谷歌学者谷歌学者交叉引用交叉引用
  25. 孟贤兵、高晓志、陆丽华、刘瑜和张恒珍。2016.一种新的生物灵感优化算法:鸟群算法。《实验与理论人工智能杂志》28,4(2016),673–687。谷歌学者谷歌学者交叉引用交叉引用
  26. 西蒙·珀金斯和詹姆斯·泰勒。2003.使用嫁接进行在线特征选择。在《第20届国际机器学习大会论文集》(ICML'03)中。592–599.谷歌学者谷歌学者数字图书馆数字图书馆
  27. 玛丽亚姆·拉赫马尼亚和帕勒姆·莫拉迪。2018.OSFSMI:基于互信息的在线流特征选择方法。应用软件计算68(2018),733–746。谷歌学者谷歌学者数字图书馆数字图书馆
  28. 安德烈·斯科伦(Andrzej Skowron)、扬·科莫罗夫斯基(Jan Komorowski)、兹齐斯拉夫·鲍拉克(Zdzislaw Pawlak)和莱赫·波尔科夫斯基(Lech Polkowski)。2002.关于数据和知识的粗糙集观点。在《数据挖掘和知识发现手册》中。134–149.谷歌学者谷歌学者数字图书馆数字图书馆
  29. 萨乌尔·索洛里奥·费尔南德斯(Saúl Solorio-Fernández)、J.阿里尔·卡拉斯科·奥乔亚(J.Ariel Carrasco-Ochoa)和何塞·菲科·马丁内兹(JoséFco Martínez-Trinidan)。2020年,非监督特征选择方法综述。《人工智能评论》53,2(2020),907–948。谷歌学者谷歌学者数字图书馆数字图书馆
  30. 牛顿·斯波拉(Newton Spolaór)、埃弗顿·阿尔瓦雷斯·切尔曼(Everton Alvares Cherman)、玛丽亚·卡罗莱娜·莫纳德(Maria Carolina Monard)和怀伊·戴安娜·李(Huei Diana Lee)。2013.用于多标签特征选择的ReliefF。2013年巴西智能系统会议记录。IEEE,6–11。谷歌学者谷歌学者数字图书馆数字图书馆
  31. Nidamarthi Srinivas和Kalyanmoy Deb。1994年。在遗传算法中使用非支配排序进行多目标优化。进化计算2,3(1994),221-248。谷歌学者谷歌学者数字图书馆数字图书馆
  32. 唐继良(Jiliang Tang)、塞勒姆·阿利亚尼(Salem Alelyani)和刘欢(Huan Liu)。2014.分类特征选择:综述。《数据分类:算法和应用》(2014),37。谷歌学者谷歌学者
  33. 王静、王萌、李培培、刘罗琪、赵忠秋、胡雪刚和吴新东。2015年,在线特征选择与群体结构分析。IEEE知识与数据工程汇刊27,11(2015),3029–3041。谷歌学者谷歌学者数字图书馆数字图书馆
  34. 王佳磊、赵培林、史蒂文·霍伊和金荣。2013.在线功能选择及其应用。IEEE知识与数据工程学报26,3(2013),698–710。谷歌学者谷歌学者数字图书馆数字图书馆
  35. 吴新东、奎瑜、魏丁、王浩和朱星泉。2012.使用流媒体功能进行在线功能选择。IEEE模式分析和机器智能汇刊35,5(2012),1178-1192。谷歌学者谷歌学者数字图书馆数字图书馆
  36. 吴新东、奎瑜、王浩和丁伟。2010.在线流媒体功能选择。第27届国际机器学习会议论文集。谷歌学者谷歌学者数字图书馆数字图书馆
  37. Jihoon Yang和Vasant Honavar。1998年。使用遗传算法选择特征子集。在特征提取、构造和选择中。施普林格,117–136。谷歌学者谷歌学者
  38. 杨新社。2013.蝙蝠算法和布谷鸟搜索:教程。在人工智能、进化计算和元启发式中。施普林格,421–434。谷歌学者谷歌学者
  39. 杨新社和苏亚什·德布。2009年,通过勒维航班进行布谷鸟搜索。2009年世界自然与生物启发计算大会会议记录(NaBIC’09)。IEEE,210–214。谷歌学者谷歌学者交叉引用交叉引用
  40. 杨新社、苏亚什和德布。2010年,通过布谷鸟搜索进行工程优化。国际数学建模和数值优化杂志1,4(2010),330-343。谷歌学者谷歌学者交叉引用交叉引用
  41. Kui Yu、Xindong Wu、Wei Ding和Jian Pei。2014.为大数据实现可扩展和准确的在线功能选择。2014年IEEE数据挖掘国际会议论文集。IEEE,660-669。谷歌学者谷歌学者数字图书馆数字图书馆
  42. 张敏玲(Min-Ling Zhang)、何塞·佩尼亚(JoséM Peña)和维克托·罗伯斯(Victor Robles)。2009.多标签朴素贝叶斯分类的特征选择。《信息科学》179,19(2009),3218–3229。谷歌学者谷歌学者数字图书馆数字图书馆
  43. 张敏玲和吴磊。2014.Lift:具有标签特定功能的多标签学习。IEEE模式分析和机器智能汇刊37,1(2014),107–120。谷歌学者谷歌学者交叉引用交叉引用
  44. 张敏玲和周志华。ML-KNN:多标签学习的懒惰学习方法。模式识别40,7(2007),2038-2048。谷歌学者谷歌学者数字图书馆数字图书馆
  45. 张茵和周志华。2010年,通过依赖最大化减少多标签维度。ACM《从数据中发现知识的汇刊》4,3(2010),1–21。谷歌学者谷歌学者数字图书馆数字图书馆
  46. Jing Zhou、Dean Foster、Robert Stine和Lyle Ungar。2005.使用字母识别选择流媒体功能。第11届ACM SIGKDD数据挖掘知识发现国际会议论文集。384–393.谷歌学者谷歌学者数字图书馆数字图书馆
  47. 周鹏、陈江永、范明宇、杜良、沈一东和李学军。2020年。平衡集群的无监督特征选择。基于知识的系统193(2020),105417。谷歌学者谷歌学者数字图书馆数字图书馆
  48. 周鹏、胡雪刚、李培培和吴新东。2019.OFS密度:一种新的在线流媒体特征选择方法。模式识别86(2019),48–61。谷歌学者谷歌学者交叉引用交叉引用
  49. 周鹏、胡雪刚、李佩佩、新东和吴。2019.使用自适应邻域粗糙集选择在线流媒体功能。信息科学481(2019),258–279。谷歌学者谷歌学者数字图书馆数字图书馆

索引术语

  1. 基于多目标杜鹃搜索的多标签数据流特征选择

    建议

    评论

    登录选项

    检查您是否可以通过登录凭据或您的机构访问本文。

    登录

    完全访问权限

    • 发布于

      从数据中发现知识的封面图像ACM事务
      ACM数据知识发现事务 第15卷第6期
      2021年6月
      474页
      国际标准编号:1556-4681
      EISSN公司:1556-472倍
      内政部:10.1145/3465438
      期刊目录

      版权所有©2021计算机协会。

      允许制作本作品的全部或部分数字或硬拷贝供个人或课堂使用,但不收取任何费用,前提是复制品的制作或分发不是为了盈利或商业利益,并且复制品在首页注明本通知和完整引文。必须尊重ACM以外的其他人对本作品组成部分的版权。允许用信用证进行摘要。要以其他方式复制或重新发布,在服务器上发布或重新发布到列表,需要事先获得特定许可和/或付费。从请求权限[电子邮件保护]

      出版商

      计算机协会

      美国纽约州纽约市

      出版历史

      • 出版:2021年5月19日
      • 认可的:2021年1月1日
      • 修订过的:2020年11月1日
      • 收到:2020年8月1日
      发布于tkdd公司第15卷第6期

      权限

      请求有关此文章的权限。

      请求权限

      检查更新

      限定符

      • 研究论文
      • 推荐

    PDF格式

    以PDF文件查看或下载。

    PDF格式

    电子阅读器

    使用eReader联机查看。

    电子阅读器

    HTML格式

    以HTML格式查看本文。

    查看HTML格式