×

具有标签均匀分布模型的成本敏感主动学习。 (英语) Zbl 1452.68195号

摘要:主动学习是一种人机交互场景,机器主动从专家那里获取信息。成本敏感的主动学习将误分类成本与教师为标签查询支付的成本进行平衡。受粒度计算(GrC)和三元决策(3WD)的启发,本文提出了一种新的基于标签均匀分布模型(CADU)下密度聚类的成本敏感主动学习算法。CADU迭代地划分宇宙,查询标签,并对实例进行分类,直到查询或预测每个标签。密度聚类技术用于将宇宙划分为块。建立标签均匀分布模型,计算每个块的预期标签分布。根据教师和误分类成本设置,设计了一个优化函数来确定要查询的标签数量。在12个公共数据集上进行了与10种最先进算法的比较研究。结果表明,CADU在平均成本方面优于其他产品。

MSC公司:

68层35 人工智能语言和软件系统理论(基于知识的系统、专家系统等)
68T05型 人工智能中的学习和自适应系统
68层37 人工智能背景下的不确定性推理
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Agarwal,A.,《成本敏感性多类别预测的选择性抽样算法》(ICML(2013)),1220-1228
[2] 北卡罗来纳州巴恩森。;Aouada,D。;Ottersten,B.,信用评分的示例依赖性成本敏感逻辑回归(ICMLA(2014)),263-269
[3] 北卡罗来纳州巴恩森。;Aouada,D。;Ottersten,B.,示例相关成本敏感决策树集合(2015),arXiv预印本
[4] 北卡罗来纳州巴恩森。;Aouada,D。;Ottersten,B.,示例依赖性成本敏感决策树,专家系统。申请。,42, 19, 6609-6619 (2015)
[5] 巴尔坎,M.-F。;布罗德,A。;Zhang,T.,基于边缘的主动学习(COLT(2007)),35-50·Zbl 1203.68136号
[6] Bargiela,A。;Pedrycz,W.,《颗粒计算》(计算智能手册:第1卷:模糊逻辑、系统、人工神经网络和学习系统(2016年),《世界科学》),43-66·Zbl 1339.68001号
[7] 卡维察,F。;Ciucci,D。;Locoro,A.,《利用三方决策理论开发集体知识:基于问卷的研究案例》,《国际期刊近似推理》。,83, 356-370 (2017) ·Zbl 1404.68156号
[8] 陈,P.-L。;Lin,H.-T.,使用概率模型进行多类成本敏感分类的主动学习(TAAI(2013)),13-18
[9] Chong,E.K.P。;Zak,S.H.,《优化导论》,第76卷(2013),John Wiley&Sons·Zbl 1266.90001号
[10] 科恩,D.A。;加赫拉马尼,Z。;Jordan,M.I.,《统计模型的主动学习》,J.Artif。智力。第4129-145号决议(1996年)·兹比尔0900.68366
[11] 科尔,R.,并行合并排序,SIAM J.计算。,17, 4, 770-785 (1988) ·Zbl 0651.68077号
[12] 北卡罗来纳州克里斯蒂亚尼尼。;Shawe-Taylor,J.,《支持向量机和其他基于核的学习方法简介》(2000),剑桥大学出版社
[13] Demir,B。;Minello,L。;Bruzzone,L.,通过一种新的成本敏感主动学习方法对遥感图像进行监督分类的有效训练集的定义,IEEE Trans。地质科学。遥感,52,1272-1284(2014)
[14] 邓,X.-F。;姚永勇,模糊集的决策论三元逼近,信息科学。,279, 702-715 (2014) ·Zbl 1354.03073号
[15] 韩,X。;Kwoh,C.K。;Kim,J.J.,基于聚类的生物医学命名实体识别主动学习(IJCNN(2016)),1253-1260
[16] Hoare,C.A.R.,快速排序,计算。J.,5,1,10-16(1962)·Zbl 0108.13601号
[17] 胡碧琴,三向决策空间和三向决策,信息科学。,281, 21-52 (2014) ·Zbl 1355.68256号
[18] 胡碧琴。;Wong,H。;Yiu,K.C.,《关于三向决策空间中的两种新型三向决策》,《国际期刊近似推理》。,82, 285-306 (2017) ·Zbl 1404.68164号
[19] 胡庆华。;Yu,D.-R。;谢,Z.-X。;刘,J.-F.,模糊概率近似空间及其信息测度,IEEE Trans。模糊系统。,191-201年2月14日(2006年)
[20] 黄,J.-J。;Wang,J。;Yao,Y.Y。;Zhong,N.,通过学习成对偏好的成本敏感三向推荐,国际期刊近似理由。,86, 28-40 (2017) ·Zbl 1419.68209号
[21] 黄,K.-H。;Lin,H.-T.,一种用于成本敏感型多类主动学习的新型不确定性抽样算法,(ICDM(2016)),925-930
[22] 黄,S.-J。;金·R。;周Z.-H.,通过查询信息性和代表性示例进行主动学习(NIPS(2010)),892-900
[23] 江春明。;Yao,Y.Y.,基于动作的三方决策的有效性度量,Knowl-基于系统。,160136-143(2018)
[24] Kang,J。;Ryu,K.R。;Kwon,H.C.,使用基于聚类的抽样选择文本分类主动学习的初始训练集,(PAKDD(2004)),384-388
[25] Klir,G。;Yuan,B.,《模糊集与模糊逻辑》,第4卷(1995),普伦蒂斯·霍尔:新泽西普伦蒂斯霍尔·Zbl 0915.03001号
[26] Krempl,G。;Ha,T.-C。;Spiliopoulou,M.,基于聚类的优化概率主动学习(COPAL),(发现科学国际会议(2015)),101-115
[27] 李海霞。;张,L.-B。;黄,B。;Zhou,X.-Z.,成本敏感型人脸识别的顺序三元决策和粒化,Knowl-基于系统。,91, 241-251 (2016)
[28] 李海霞。;张,L.-B。;周,X.-Z。;黄,B.,使用深度神经网络的成本敏感序贯三方决策建模,国际期刊近似推理。,85, 68-78 (2017) ·Zbl 1419.68078号
[29] 李,J.-H。;黄,C.-C。;齐,J.-J。;钱,Y.-H。;刘伟强,基于多粒度的三向认知概念学习,信息科学。,378, 244-263 (2017) ·Zbl 1429.68228号
[30] Liaw,A。;Wiener,M.,《随机森林分类与回归》,R News,2,3,18-22(2002)
[31] 刘,A。;G·6月。;Ghosh,J.,《空间成本敏感主动学习》(SIAM(2009)),814-825
[32] 刘博士。;Liang,D.-C.,有序决策系统中的三向决策,Knowl-基于系统。,137, 182-195 (2017)
[33] 洛巴赫,M。;波普,R。;van Dam,E。;诺尔德斯,L。;Veltkamp,R.C.,《不平衡啮齿动物行为数据中基于聚类的主动学习》,(VAIB国际研讨会论文集(2016)),1-4
[34] 罗伊,C.C。;Hospedales,T.M。;Xiang,T。;Gong,S.-G.,基于流的联合勘探开发主动学习,(CVPR(2012)),1560-1567
[35] Mahajan,P。;坎德瓦尔,R。;Vijay,R.,《基于集群的主动学习算法的通用框架》,国际计算机杂志。科学。工程,3,1,307-312(2011)
[36] Marginantu,D.D.,《积极的成本敏感学习》(IJCAI,第5卷(2005)),1622-1623
[37] McCallumzy,A.K。;Nigamy,K.,《利用em和基于池的主动学习进行文本分类》(ICML(1998)),359-367
[38] Merz,C.J.,UCI机器学习数据库存储库
[39] 苗丹青。;Zhao,Y。;Yao,Y.Y。;李海霞。;Xu,F.-F.,Pawlak粗糙集模型一致和不一致决策表的相对约简,信息科学。,17924414-4150(2009年)·Zbl 1183.68608号
[40] 最小值,F。;刘,F.-L。;Wen,L.-Y。;Zhang,Z.-H.,通过kNN的三部分成本敏感主动学习,软计算。,7 (2017)
[41] 最小值,F。;张,Z.-H。;翟伟杰。;Shen,R.-P.,使用三部分字母进行频繁模式发现,《信息科学》。(2018)
[42] Narr,A。;特里贝尔,R。;Cremers,D.,基于流的主动学习,用于高效和自适应的三维对象分类(ICRA(2016)),227-233
[43] Pawlak,Z.,《粗糙集》,《国际计算杂志》。信息科学。,11, 5, 341-356 (1982) ·Zbl 0501.68053号
[44] Pedrycz,W.,阴影集:表示和处理模糊集,IEEE Trans。系统。人类网络。,B部分,网络。,28, 1, 103-109 (1998)
[45] 佩德里茨,W。;帕克,B.-J。;Oh,S.-K.,颗粒分类器的设计:模式识别中区间演算和模糊集协同作用的研究,模式识别。,41, 12, 3720-3735 (2008) ·Zbl 1173.68685号
[46] 钱,J。;Dang,C.-Y。;岳,X.-D。;Zhang,N.,动态粒度下连续三方决策的属性约简,国际期刊近似推理。,85, 196-216 (2017) ·兹伯利1419.68175
[47] 钱,Y.-H。;Liang,J.-Y。;Dang,C.-Y.,不完全多粒度粗糙集,IEEE Trans。系统。人类网络。,A部分,系统。Hum.,40,2,420-431(2010)
[48] 钱,Y.-H。;Liang,J.-Y。;吴维珍。;Dang,C.-Y.,模糊二进制GrC模型中的信息粒度,IEEE Trans。模糊系统。,19, 2, 253-264 (2011)
[49] Quinlan,J.R.,决策树归纳,马赫。学习。,1, 1, 81-106 (1986)
[50] 罗德里格斯,A。;Laio,A.,《通过快速搜索和发现密度峰值进行聚类》,《科学》,34461911492-1496(2014)
[51] Sang,B.-B。;Guo,Y.-T。;史,D.-R。;Xu,W.-H.,多源决策系统的决策论粗糙集模型,国际J.Mach。学习。赛博。,9, 11, 1941-1954 (2018)
[52] Settles,B.,主动学习,Synth。莱克特。Artif公司。智力。机器。学习。,6, 1, 1-114 (2012) ·Zbl 1270.68006号
[53] 沉降,B。;克雷文,M。;Friedland,L.,《实际注释成本下的主动学习》(NIPS成本敏感学习研讨会论文集(2008)),1-10
[54] Seung,H.S。;奥珀,M。;Sompolinsky,H.,委员会质疑,(第五届计算学习理论年度研讨会论文集(1992)),287-294
[55] 她,Y.-H。;他,X.-L。;史海霞。;钱,Y.-H.,多粒度粗糙集模型的多值逻辑方法,国际期刊近似推理。,82, 270-284 (2017) ·Zbl 1404.68174号
[56] Smailović,J。;格里卡尔,M。;拉夫拉奇,N。;ƀnidaršić,M.,金融领域情绪分析的基于流的主动学习,信息科学。,285, 181-203 (2014)
[57] 杉山,M。;Nakajima,S.,近似线性回归中基于池的主动学习,马赫数。学习。,75, 3, 249-274 (2009) ·Zbl 1470.68181号
[58] 苏肯斯,J.A.K。;Vandewalle,J.,最小二乘支持向量机分类器,神经过程。莱特。,9, 3, 293-300 (1999)
[59] 汤普森,C.A。;Califf,医学博士。;Mooney,R.J.,《自然语言解析和信息提取的主动学习》(ICML(1999)),406-414
[60] 唐,S。;Koller,D.,支持向量机主动学习及其在文本分类中的应用,J.Mach。学习。第245-66号决议(2001年11月)·Zbl 1009.68131号
[61] Turny,P.D.,《成本敏感分类:混合遗传决策树归纳算法的实证评估》,J.Artif。智力。第2369-409号决议(1995年)
[62] Turny,P.D.,归纳概念学习中的成本类型,(第17届ICML(2002)成本敏感学习研讨会论文集),15-21
[63] Wang,G.-Y。;关,L.-H。;吴维珍。;Hu,F.,基于扩展粗糙集的数据驱动值容差关系,Fundam。通知。,132, 3, 349-363 (2014) ·Zbl 1302.68266号
[64] Wang,G.-Y。;杨,J。;Xu,J.,粒度计算:从粒度优化到多粒度联合问题求解,粒度。计算。,105-120年2月3日(2017年)
[65] 王,M。;最小值,F。;张,Z.-H。;Wu,Y.-X.,通过密度聚类进行主动学习,专家系统。申请。,85, 305-317 (2017)
[66] 王,S。;王,J.-J。;高X.-H。;Wang,X.-Z.,基于增量决策树的基于池的主动学习,(ICMLC,第1卷(2010)),274-278
[67] 胡,H.Y。;Park,C.H.,基于层次聚类的主动学习,KIPS Trans。柔和。数据工程,2,10,705-712(2013)
[68] Yang,X.先生。;李,T.-R。;Fujita,H。;刘博士。;Yao,Y.Y.,顺序三方决策和多级增量处理的统一模型,Knowl-基于系统。,134172-188(2017)
[69] 姚,J.-T。;Azam,N.,基于Web的医疗决策支持系统,用于使用游戏理论粗糙集进行三方医疗决策,IEEE Trans。模糊系统。,23, 1, 3-15 (2015)
[70] 姚,J.-T。;瓦西拉科斯,A.V。;Pedrycz,W.,《颗粒计算:前景和挑战》,IEEE Trans。赛博。,1977年6月43日至1989年(2013年)
[71] Yao,Y.Y.,《颗粒计算:基本问题和可能的解决方案》,(第五届信息科学联合会议论文集,第1卷(2000)),186-189
[72] Yao,Y.Y.,颗粒计算的分区模型,(粗糙集学报I(2004),Springer),232-253·Zbl 1104.68776号
[73] 姚义勇,《三元决策:粗糙集理论中规则的解释》(RSKT(2009)),第642-649页
[74] Yao,Y.Y。;Wong,S.K.,《近似概念的决策理论框架》,国际J.Man-Mach出版社。螺柱,37、6、793-809(1992)
[75] Young,T.,《数据挖掘和面向机器的建模:粒度计算方法》,应用。智力。,113-124年2月13日(2000年)
[76] Yu,D。;Varadarajan,B。;邓,L。;Acero,A.,《语音识别的主动学习和半监督学习:使用全局熵减少最大化准则的统一框架,计算》。演讲语言,24,3,433-444(2010)
[77] Yu,H。;王X.C。;Wang,G.-Y。;Zeng,X.-H.,一种基于低秩矩阵的多视图数据主动三元聚类方法,Inf.Sci。(2018)
[78] Yu,H。;王毅,重叠聚类的三向决策方法,(RSCTC(2012)),277-286
[79] Yu,S.-L。;Zhao,H.,基于粗糙集和拉普拉斯分数的成本敏感特征选择,《公共科学图书馆·综合》,13(2018)
[80] 岳,X.-D。;Chen,Y.-F。;苗丹青。;Fujita,H.,三向分类的模糊邻域覆盖,信息科学。(2018) ·Zbl 1456.62122号
[81] 岳,X.-D。;Chen,Y.-F。;苗丹青。;Qian,J.,鲁棒分类的三分区邻域覆盖约简,Int.J.近似原因。,83, 371-384 (2017) ·Zbl 1404.68125号
[82] Zadeh,L.A.,关于模糊信息粒化理论及其在人类推理和模糊逻辑中的中心地位,模糊集系统。,90, 2, 111-127 (1997) ·Zbl 0988.0304号
[83] 张,C。;Chen,T.,基于内容的信息检索的主动学习框架,IEEE Trans。多媒体。,4, 2, 260-268 (2002)
[84] 张海瑞。;Min,F.,基于随机森林的三向推荐系统,Knowl-基于系统。,91275-286(2016)
[85] 张海瑞。;最小值,F。;Shi,B.,基于回归的三向推荐,信息科学。,378, 444-461 (2017)
[86] 张,L。;张斌,商空间结构下的模糊推理模型,信息科学。,173, 4, 353-364 (2005) ·Zbl 1088.68170号
[87] 张庆华。;谢奇。;Wang,G.-Y.,一个新的三方决策模型,使用效用理论的决策理论粗糙集,Knowl-基于系统。,159, 321-335 (2018)
[88] Zhang,Y。;Yao,J.-T.,《三向分类的基尼目标函数》,《国际期刊近似原因》。,81103-114(2017)·Zbl 1401.68332号
[89] Zhang,Y。;姚,J.-T.,《阴影集的博弈论方法:三方权衡视角》,《信息科学》。(2018)
[90] 赵,P.-L。;Hoi,S.C.H.,应用于恶意URL检测的成本敏感在线主动学习(SIGKDD(2013)),919-927
[91] 周,B。;Yao,Y.Y。;Luo,J.-G.,成本敏感型三向电子邮件垃圾邮件过滤,J.Intell。信息系统。,42, 1, 19-45 (2014)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。