{“状态”:“确定”,“消息类型”:“工作”,“信息版本”:“1.0.0”,“讯息”:{“索引”:{“日期-部分”:[[2024,8,24]],“日期-时间”:“2024-08-24T05:04:48Z”,“时间戳”:1724475888312},“参考-计数”:62,“出版商”:“计算机协会(ACM)”,“问题”:“1”,“资助者”:[{“名称”:“陕西省自然科学基础研究计划”,“奖项”:[“2020JC-01”]},{“DOI”:“10.13039\/50100012226”,“name”:“中央高校基本科研业务费”,“DOI-asserted-by”:“crossref”,“adward”:[“CXTD2017003”],“id”:[{“id”:“10.13029\/501100012226”,”id-type“:”DOI“,”asserted-by“:”crossref.“}]}中国”,“DOI-asserted-by”:“crossref”,“adward”:[“31701150”],“id”:[{“id”:“10.13039\/501100001809”,“id-type”:“DOI”,“asserted-by”:“cross-ref”}]}],“content-domain”:{“domain”:[“dl.acm.org”],”crossmark-restriction“:true},”short-container-title“:[”acm Trans.Knowl.Discov.Data“],”published-print“:{”date-parts“:[2021,2,28”]]},“抽象”:“由于存在大量的距离度量,使用指定的聚类算法对给定数据集进行聚类的适当选择成为一个重要问题。本文提出了一种用于聚类算法的自动距离度量推荐方法。该推荐方法包括以下步骤:(1)元数据提取,包括元特征收集和元目标识别;(2) 利用元数据构建推荐模型;(3)对推荐模型中的新数据集进行距离度量推荐。考虑到用户可能的不同需求,使用了两种不同类型的元目标和元学习技术<\/jats:p>\n为了验证距离度量推荐方法的必要性和有效性,使用199个公开可用的数据集、9个距离度量和2个广泛使用的聚类算法进行了实证研究。实验结果表明,对于给定的数据集,距离测度显著影响聚类算法的性能。此外,对该推荐方法的性能分析证明了其有效性<\/jats:p>“,”DOI“:”10.1145\/3418228“,”type“:”journal-article“,”created“:{”date-parts“:[[2020,12,7]],”date-time“:”2020-12-07T19:04:16Z“,”timestamp“:1607367856000},”page“:“标题”:[“聚类算法距离度量的自动推荐“],”前缀“:”10.1145“,”卷“:”15“,”作者“:[{”给定“:”晓燕“,”家族“:”朱“,”序列“:”第一“,”隶属“:[}”名称“:”西安交通大学,西安交通大学西安交通大学,西安交通大学“}]},{“given”:“嘉荫”,“family”:“Wang”,“sequence”:“additional”,“affiliation”:[{“name”:“西安交通大学”,中国,{“给定”:“静文”,“family“:”Fu“,”sequence“:”additional“,”affiliation“:[{“name”:“中国西安交通大学,2019an”}]}],“member”:“320”,“published-on-line”:{“date-parts”:[[2020,12,7]]},“reference”:[{“key”:“e_1_1_1”,“doi-asserted-by”:“publisher”,“doi”:“10.1007\/s10994-017-5687-8”},{“密钥”:“e 1_2_1_2_“,”卷时间“:”计算智能:理论”,“作者”:“Aggarwal Swati”},{“key”:“e_1_2_1_3_1”,“doi断言”:“publisher”,“doi”:“10.1007\/s03579900027”},{“key”:“e_1_2_4_1”,“doi断言”:“publisher”,“doi”:“10.1016\/j.datak.2006.01.013”},{“key”:“e_1_2_1_5_1”,“首页”:“2501”,“文章标题”:“不同距离测度对K-means算法性能的影响:Matlab中的实验研究“,”volume“:”5“,”author“:”Bora Dibya Jyoti“,”year“:”2014“,”journal-title“:”International journal of Computer Science and Information Technologies(IJCSIT)“},{”key“:“e_1_2_1_6_1”,”doi-asserted-by“:”publisher“,”doi“:”10.1023\/A:1021713901879“},{“key”:“e_1_1_7_1”,“doi-asserted-by”:“publisher”,”doi“:”10.1016\/j.asoc.2020.106180“},{”key“:”e_2_1_8_1“,”volume-title“:”CommunityDiff:可视化社区聚类算法。ACM Transactions on Knowledge Discovery from Data 12,1“,”author“:”Datta Srayan“,“year”:“2018”},”{“key”:“e_1_2_1_9_1”我“:“10.1109\/IJCNN.2008.4634333”},{“key”:“e_1_2_1_10_1”,“doi-asserted-by”:“publisher”,”doi“:”10.1007\/s11205-018-1902-7“},}”key“:”e_1_c_11_11_1“,”doi-assert-by“:”publisher“,“doi”:“10.109\/BigComp.2018.0093”}、{“key”:”e_c_12_12_1“、“doi-sserted-by:“10.1007\/s13042-017-0636-1”},{“key”:“e_1_2_1_13_1”,“volume-title”:“第17届国际机器学习会议记录。247--254”,“author”:“Jennifer”},{“key”:“e_1_1_14_1”,“volume-title”:“Ferrari and Leandro Nunes de Castro”,”author“:”Daniel“,”year“:”2012“},”{“key”:“e_1_2_15_1”:“e_1_1_16_1”,“doi-asserted-by”:“publisher”,”doi“:”10.1016\/j.ins.2014.1244“},{“key”:“e\e_2_1_17_1”、“volume-title”:“中欧信息与智能系统会议论文集(CECIS\u201908)”,“author”:“Furd\u00edk Karol”,《年份》:“2008”},“key“:”e_1_ 1_18_1“,”doi-assert-by“:”publisher“,“doi”:“10.1007\/s10994-008-5064-8”},{“key”:“e_1_2_1_19_1”,“doi-asserted-by”:“publisher”,”doi“:”10.1007\/978-3642-13800-3_10“}”,{”key“:”e_1_i_1_20_1“,”首页“:”760“,”文章标题“基于数据集特征的特征选择算法建议”,“卷”:“22”,“作者”:“Goswami Saptarsi”,“年份”:“2016”,“新闻标题”:“Universal Computer Science杂志”},{“key”:“e_1_2_1_21_1”,“volume-title”:“Elementary Linear Algebra.Brooks\/Cole Publishing Company”,“author”:“Grossman Stanley I.”}、{“密钥”:“e_1_2_1_22_22_1”、“volume-title”:“CURE:大型数据库的有效聚类算法。在ACM Sigmod Record”中,“au作者”:“Guha Sudipto”,“年份”:“1998”}和{“key”:“e_1_1_23_1”,“doi-asserted-by”:“publisher”,”doi“:”10.1109\/34.709601“},{“key”:“e_ 1_24_1”、“doi-sserted-by“:”publisher“,”doi:“10.1109\/TIP.2016.259803”},“key“:”e_1_ 1_25_1“,“doi-asserted-by”:”publister“,”doi“:“10.1162\/NECO_a_00661”}、{“key”:”e_ 2_1_26_1“,”doi-asserted-by“:”publisher“,”doi“:”10.1109\/34.857001“},{”key“:”e_1_2_1_27_1“,“卷标题”:“出租车几何:非欧几里得几何的冒险”,“作者”:“克劳斯·尤金·F”,“年份”:“1986”},{“密钥”:“e_1_2_1_28_1”,“出版商”断言的doi,“doi”:“10.1109\/3477.764879”},{“密钥”:“e_1_2_29_1”,“卷标题”:“吉宾德·库马尔·查布拉和迪内什·库马尔”,“作者”:“库马尔·维杰”,“年份”:“2014”},{“密钥”:“e_1_2_1_30_1”,“首页”:“38”,“article-title”:“聚类算法中距离度量的性能评估”,“卷”:“13”,“作者”:“维杰伊·库马尔和马尼帕尔大学”,“年份”:“2014年”,“期刊标题”:“Infocomp计算机科学杂志”},{“key”:“e_1_2_1_31_1”,“doi-asserted-by”:“publisher”,”doi“10.1109”\/TNNLS.2018.2872595“}”,{”key“:”e_2_132_1“,“doi-asserted-by”:“publisher”,“doi”:“10.1016\/S0031-3203(02)00060-2”},{“key”:“e_1_2_1_33_1”,《volume-title》:“使用基于连接性的代表点对动态数据流进行增量聚类。数据与知识工程68,1”,“author”:“L\u00fchr Sebastian”,“year”:“2009”}:“印度国家科学院院刊”,“作者”:“Mahalanobis Prasanta Chandra”},{“key”:“e_1_2_35_1”,“volume-title”:“人工神经网络国际会议论文集。斯普林格”,“author”:“Nascimento Andr\u00e9 C.A.”}:“机器学习国际会议论文集。ACM”,“作者”:“阮宣荣”,“年份”:“2009”},{“key”:“e_1_1_37_1”,“doi-asserted-by”:“publisher”,”doi“:”10.1023\/A:1023447105713“},”{“key”:”e_1_i_1_38_1“,”首页“:”165“,“article-title”:“日本更新世海洋软体动物的动物群特征,作为日本更新纪气候变冷的证据”,“卷”:“6”,“作者”:“Otsuka Yanosuke”,“年份”:“1936年”,“新闻标题”:“日本生物地理学会”},{“键”:“e_1_2_1_39_1”,“doi-asserted-by”:“出版商”,“doi”:“10.1109\/TPAMI.2017.2679100”},“volume-title”:“聚类高维和大型数据集的系统综述。ACM从数据中发现知识的事务12,2”,“年份”:“2018”},{“key”:“e_1_2_1_41_1”,“doi-asserted-by”:“publisher”,”doi“:“10.1016\/j.eswa.2017.01.013”}、{“key”:”e_2_2_42_1“,”doi-assert-by“:”publisher“,“doi”:“10.116\/j.ins.2018.0.043”}和{“密钥”:“e_1_1_43_1”,“doi-asserted-by”:“publisher”,”doi“:”10.1109\/SAI.2016.7555983“},{“key”:“e\e_2_1_44_1”、“doi-sserted-by“:”publisher“,”doi:“10.1007\/s10044-012-0280-z”},“key“:e_1_2_1_46_1“,”doi-asserted-by“:”publisher“,“doi”:“10.1109\/SAI.2014.6918200”},{“key”:“e_1_1_47_1”,“doi-asserted-by”:“publisher”,”doi“:”10.1117\/12.523103“},{“key”:”e_2_1_48_1“,”doi-assert-by“:”publisher“,“doi”:“10.1007\/3-540-45372-5_13”},”key“:”e_C_1_49_1“1_50_1“,”doi-asserted-by“:”publisher“,“doi”:“10.1016\/j.patcog.2011.12.025”},{“key”:“e_1_1_51_1”,“doi-asserted-by”:“publisher”,”doi“:”10.1037\/1082-989X.9.386“},{“key”:“e\e_2_1_52_1”、“volume-title”:“第一届国际生物医学电子与器件会议论文集。INSTICC-信息、控制与通信系统与技术研究所”,“author”:“Strickert Marc”,“year”:“2008”},“key“:“e_1_2_1_53_1”,“非结构化”:“Chakkrit Tantithamthavorn.2017。ScottKnottESD:scott-nott效应大小差异(ESD)测试。R包版本2。检索自https:\/\/github.com/klainfo\/ScottKnottESD。查克里特·坦提塔姆塔沃恩(Chakkrit Tantithamthavorn)。2017.斯科特-诺特ESD:斯科特-纽特效应大小差异(ESD)测试。R包版本2。检索自https:\/\/github.com/klainfo\/ScottKnottESD。“},{”key“:”e_1_1_54_1“,”doi-asserted-by“:”publisher“,“doi”:“10.1023\/A:1019956318069”},“key”:“e_2_1_55_1”,“volume-title”:“国际数据管理会议论文集。罗得岛州SIGMOD,241--244”,“author”:“Vimal Ankita”,“year”:“2009”}“内政部”:“10.1007\/s1122-007-9033-z“},{“key”:“e_1_2_1_57_1”,“doi-asserted-by”:“publisher”,”doi“:”10.5555\/2566972.2566973“}”,{”key“:”e_1_cu1_58_1“,”volume-title“:”一种基于多标签学习的通用分类算法推荐方法。ACM Transactions on Knowledge Discovery from Data 9,1“,”author“:”Wang Guantao“,“year”:“2014”},”{“密钥”:“”e_1_2_1_59_1“,“doi-asserted-by”:“publisher”,“doi”:“10.1016\/j.knosys.2018.05.034”},{“key”:“e_1_i_1_60_1”,”doi-assert-by“:”publisher“,”doi“:”10.1016\/j.amc.2018.12.020“},”{“密钥”:“e_1_2_1_61_1”e_1_2_1_62_1“,”首页“:”26“,”文章标题“:”基于数据集特征选择分类算法及其最佳参数”,“卷”:“28”,“作者”:“杨忠国”,“年份”:“2017年”,“期刊标题”:“计算机杂志”}],“容器标题”:[“ACM Transactions on Knowledge Discovery from data”],“原始标题”:[],“语言”:“en”,“链接”:[{“URL”:“https:\/\/dl.acm.org\/doi\/pdf\/10.1145\/3418228“,”content-type“:”unspecified“,”content-version“:”vor“,”intended-application“:”similarity-checking“}],”deposed“:{”date-parts“:[2023,1,1]],”date-time“:“2023-01-01T23:30:20Z”,”timestamp“:1672615820000},”score“:1,”resource“:”{“primary”:{“URL”:“https:\\/dl.acm.org\/doi\/10.1145\/3418228“}}”副标题“:[],”短标题“:[],”已发布“:{”日期部分“:[[2020,12,7]]},”参考文献数“:62,”期刊期“:{”期刊期“:“1”,”已出版印刷品“:{”日期部分“:[[2021,28]]}},”替代id“:[”10.1145\/3418228“],”URL“:”http:\/\/dx.doi.org/10.1145\/3418228“,”relationship“:{},”ISSN“:[”1556-4681“,”1556-472X“],“ISSN类型”:[{”value“:”1556-4681“,”type“:”print“},{”value“:“1556-472X”,“type”:“electronic”}],“subject”:[],“published”:{“date-parts”:[[2020,12,7]]},“assertion”:[{“value”:”2019-12-01“,“order”:0,“name”:“received”,“label”:“received”,”group“:{”name“:”publication_history“,”label“:”publication history“}}},{”value“:”2020-08-01“,”order“:1,”name“accepted”,“标签”:“已接受”,“组”:{“名称”:“publication_history“,”label“:”publication history“}},{”value“:”2020-12-07“,”order“:2,”name“:”published“,”标签“:”published“,”group“: