×

从正面和未标记数据中学习的类前验估计。 (英语) 兹伯利1412.68181

摘要:我们考虑在未标记数据集中估计类先验的问题。在假设有额外的标记数据集可用的情况下,可以通过将类数据分布的混合物拟合到未标记的数据分布来估计类先验。然而,在实践中,这种附加的标记数据集通常不可用。在本文中,我们证明了,当附加样本仅来自正类时,可以正确估计未标记数据集的类先验。我们的关键思想是使用适当的惩罚偏差进行模型拟合,以消除由于缺乏负样本而引起的误差。我们进一步证明了惩罚L_1距离的使用给出了一个具有解析解的计算效率高的算法。从理论上分析了一致性、稳定性和估计误差。最后,我们通过实验证明了该方法的有效性。

MSC公司:

68T05型 人工智能中的学习和自适应系统
62小时30分 分类和区分;聚类分析(统计方面)
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Ali,S.M.和Silvey,S.D.(1966年)。一种分布与另一种分布的散度系数的一般类别。英国皇家统计学会杂志,B辑,28131-142·Zbl 0203.19902号
[2] Blanchard,G.、Lee,G.和Scott,C.(2010年)。半监督新颖性检测。机器学习研究杂志,99992973-2009·Zbl 1242.68205号
[3] Bonnans,F.和Cominetti,R.(1996年)。Banach空间中的扰动优化Ⅰ:基于弱方向约束条件的一般理论;二: 基于强定向限定条件的理论;三: 半无限优化。SIAM控制与优化杂志,34,1151-1171,1172-1189,1555-1567·Zbl 0862.49022号
[4] Bonnans,F.和Shapiro,A.(1998年)。带扰动的优化问题,导游。SIAM评论,40(2),228-264·Zbl 0915.49021号 ·doi:10.1137/S0036144596302644
[5] Csiszár,I.(1967年)。概率分布差异和间接观测的信息类型度量。匈牙利科学研究所,229-318·Zbl 0157.25802号
[6] du Plessis,M.C.和Sugiyama,M.(2014)。根据正数据和未标记数据进行分类先验估计。IEICE信息与系统交易,E97-D,1358-1362·doi:10.1587/transinf。E97.D.1358年
[7] du Plessis,M.C.和Sugiyama,M.(2012年)。基于分布匹配的班级优势变化下的班级平衡半监督学习。2012年6月26日至7月1日,ICML 2012(第823-830页)。
[8] du Plessis,M.C.、Niu,G.和Sugiyama,M.(2014)。从正面和未标记数据中学习的分析。Z.Ghahramani、M.Welling、C.Cortes、N.D.Lawrence和K.Q.Weinberger(编辑),《神经信息处理系统的进展》27,第703-711页。
[9] Elkan,C.和Noto,K.(2008年)。仅从正面和未标记的数据学习分类器。ACM SIGKDD 14,第213-220页。
[10] Iyer,A.、Nath,S.和Sarawagi,S.(2014)。类比估计的最大平均偏差:收敛边界和核选择。在ICML中,第530-538页。
[11] Kanamori,T.、Hido,S.和Sugiyama,M.(2009年)。直接重要性估计的最小二乘法。机器学习研究杂志,1391-1445年7月10日·Zbl 1235.62039号
[12] Keziou,A.(2003)。\[\phi\]的双重表示-发散和应用。Comptes Rendus Mathématique,336(10),857-862·Zbl 1043.62002号 ·doi:10.1016/S1631-073X(03)00215-2
[13] Kullback,S.和Leibler,R.A.(1951年)。关于信息和充分性。数理统计年鉴,2279-86·兹比尔0042.38403 ·doi:10.1214/aoms/1177729694
[14] McDiarmid,C。;Siemons,J.(编辑),《关于有界差分方法》,148-188(1989),剑桥·Zbl 0712.05012号
[15] Pearson,K.(1900)。基于这样一个准则,即在相关变量系统的情况下,给定的偏离概率系统可以合理地假设是由随机抽样引起的。《哲学杂志》,第50期,第157-175页·JFM 31.0238.04号 ·网址:10.1080/14786440009463897
[16] Saerens,M.、Latine,P.和Decaestecker,C.(2002年)。将分类器的输出调整为新的先验概率:一个简单的过程。神经计算,14(1),21-41·兹比尔1026.62065 ·doi:10.1162/089976602753284446
[17] Sanderson,T.和Scott,C.(2014)。类别比例估计及其在多类别异常抑制中的应用。第17届国际人工智能与统计会议(AISTATS)会议记录。
[18] 斯科特·C·布兰查德。,G.(2009)。新颖性检测:未标记的数据绝对有帮助。2009年4月16日至18日,美国佛罗里达州克利尔沃特海滩,第十二届人工智能和统计国际会议(AISTATS2009)会议记录。
[19] Scott,C.和Nowak,R.(2005)。Neyman-Pearson统计学习方法。IEEE信息理论汇刊,51(11),3806-3819·Zbl 1318.62054号 ·doi:10.1109/TIT.2005.856955
[20] Sugiyama,M.(2010年)。基于最小二乘后验拟合的超快速可训练多类概率分类器。IEICE信息与系统交易,E93-D(10),2690-2701·doi:10.1587/transinf。图93.D.2690
[21] Sugiyama,M.、Suzuki,T.、Kanamori,T.,du Plessis,M.C.、Liu,S.和Takeuchi,I.(2012)。密度差估计。神经信息处理系统进展,25,692-700。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。