×

一些数据清理问题的NP-hardness。 (俄语。英文摘要) 兹比尔1496.68294

小结:我们证明了本文所考虑的离群值检测问题的NP-hardness,从而减少了数据分析问题的解决。作为对图像紧凑性的定量评估,使用了竞争相似性函数(FRiS-function),该函数评估对象与其最近邻居的局部相似性。

理学硕士:

68T09号 数据分析和大数据的计算方面
68N17号 逻辑编程
PDF格式BibTeX公司 XML格式引用
全文: 内政部 MNR公司

参考文献:

[1] Osborne J.W.,《数据清理最佳实践:收集数据前后需要做的所有事情的完整指南》,SAGE Publ。,洛杉矶,2013年,296页。
[2] Farcomeni A.、Greco L.,《稳健的数据缩减方法》,CRC出版社,纽约,2015年,297页·Zbl 1311.62006年
[3] Waal T.D.、Pannekoek J.、Scholtus S.,《统计数据编辑和插补手册》,新泽西州霍博肯威利,2011年,456页。
[4] I.A.Borisova,O.A.Kutnenko,“审查误分类样品”,马什。奥布奇。分析。Dannykh,1:11(2015),1632-1641(俄语)
[5] Aggarwal C.C.,数据挖掘,Springer,Cham,2015年,734页·Zbl 1311.68001号
[6] Brighton H.、Mellish C.、Data Min.Knowl。发现。,6:2(2002),基于实例的学习算法实例选择的进展·Zbl 1027.68673号 ·doi:10.1023/A:1014043630878
[7] Delany S.J.、Segata N.、Mac Namee B.,“降噪中的仿形实例”,Knowl-B.系统。,31 (2012), 28-40 ·doi:10.1016/j.knosys.2012.01.015
[8] Frenay B.,Verleysen M.,“标签噪声存在下的分类:一项调查”,IEEE Trans。神经网络。学习。系统。,25:5 (2014), 845-869 ·doi:10.1109/TNNLS.2013.2292894
[9] Jankowski N.,Grochowski M.,“实例选择算法的比较I.算法调查”,人工智能和软计算-ICAISC 2004,Proc。第七届国际会议(波兰扎科帕内,2004年6月7日至11日),Lect。注释计算。科学。,3070,斯普林格,海德堡,2004,598-603·Zbl 1058.68564号 ·doi:10.1007/978-3-540-24844-690
[10] Massie S.,Craw S.,Wiratunga N.,“当类似的问题没有类似的解决方案时”,基于案例的推理研究与开发,Proc。第七届国际会议(英国北岛贝尔法斯特,2007年8月13日至16日),Lect。注释计算。科学。,4626,施普林格,海德堡,2007,92-106·doi:10.1007/978-3-540-74141-1_7
[11] Quinlan J.R.,“决策树归纳”,马赫。学习。,1 (1986), 81-106
[12] Segata N.,Blanzieri E.,“使用局部最大边际方法减少基于实例的学习的噪音”,J.Intel。信息系统。,35:2 (2010) ·Zbl 1242.68246号 ·doi:10.1007/s10844-009-0101-z
[13] Son S.-H.,Kim J.-Y.,“使用基于熵的划分对基于实例的学习进行数据简化”,计算科学及其应用——ICCSA 2006,Proc。国际会议(英国格拉斯哥,2006年5月8日至11日),诉3,Lect。注释计算。科学。,3982,斯普林格,海德堡,2006,590-599·Zbl 1172.68579号 ·doi:10.1007/11751595_63
[14] Teng C.M.,“噪声处理技术的比较”,Proc。第14届国际佛罗里达州人工智能研究会(美国佛罗里达州基韦斯特,2001年5月21日至23日),AAAI出版社,加利福尼亚州门洛帕克,2001年,269-273
[15] Wilson D.R.、Martinez T.R.,“基于实例的学习算法的简化技术”,马赫。学习。,38:3 (2000), 257-286 ·Zbl 0954.68126号 ·doi:10.1023/A:1007626913721
[16] A.G.Arkadyev,Eh M.Braverman,机器学习到模式识别,Nauka,M.,1964年(俄语)
[17] N.G.Zagoruiko,认知数据分析,Akad。伊兹德。GEO,新西伯利亚,2013(俄罗斯)·Zbl 0896.68135号
[18] Borisova I.A.、Dyubanov V.V.、Kutnenko O.A.、Zagoruiko N.G.,“FRiS-函数在分类法、属性选择和决策规则构建中的应用”,《知识处理和数据分析》,Rev.Sel。巴普。2007年9月14日至16日在俄罗斯新西伯利亚举行的第1届国际会议KONT;2007年9月28日至30日,德国达姆施塔特,Lect,2007年第一届国际会议KPP。注释计算。科学。,6581,斯普林格,海德堡,2011,256-270·doi:10.1007/978-3-642-22140-8_17
[19] Zagoruiko N.G.、Borisova I.A.、Dyubanov V.V.、Kutnenko O.A.,“基于竞争相似性函数的识别方法”,模式识别。图像分析。,18:1 (2008), 1-6 ·doi:10.1134/S105466180801001X
[20] N.G.Zagoruiko,I.A.Borisova,V.V.Dyubanov,O.A.Kutenko,“竞争空间中紧致性和相似性的定量度量”,Sib。印度数学杂志。,5:1 (2011), 144-154
[21] M.R.Garey,D.S.Johnson,《计算机与难治性:NP-完备性理论指南》,弗里曼,旧金山,1979年·Zbl 0411.68039号
[22] I.A.Borisova,O.A.Kutnenko,“利用竞争相似性函数修正目标属性中的诊断错误”,Mat.Biol。生物信息。,13:1(2018),38-49(俄语)
[23] N.G.Zagoriko,O.A.Kutnenko,“列车数据集的审查”,Vestn。托木斯克。戈斯。州立大学。向上。维奇尔。泰克。通知。,2013年,第22、66-73号(俄语)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。