×

将本地Fisher和朴素贝叶斯配对:改进两个标准判别式。 (英语) Zbl 1456.62062号

小结:Fisher判别式可能是连续数据中最著名的似然判别式。另一个基准鉴别是朴素贝叶斯,它只基于边缘。本文通过建模变量对之间的依赖关系来扩展这两个判别式。在连续情况下,这是由费希尔判别式的局部高斯版本完成的。在离散情况下,通过取两两联合概率的几何平均值来扩展朴素贝叶斯。我们还指出了如何将这两种方法结合用于混合连续和离散数据。新的判别式在一些模拟实验和实际数据说明中显示了良好的结果。

MSC公司:

62G07年 密度估算
6220国集团 非参数推理的渐近性质
62H30型 分类和区分;聚类分析(统计方面)
62第20页 统计学在经济学中的应用
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Aas,K。;Czado,C。;弗里吉斯,A。;Bakken,H.,多重依赖的对copula构造,保险数学。经济。,44, 2, 182-198 (2009) ·Zbl 1165.60009号
[2] 阿加瓦尔,C.C。;翟,C.,文本分类算法综述,(Mining text Data(2012),Springer),163-222
[3] 艾奇逊,J。;Aitken,C.G.,《利用核方法进行多元二进制判别》,《生物统计学》,第63、3、413-420页(1976年)·Zbl 0344.62035号
[4] Azzalini,A.,关于用核方法估计分布函数和分位数的注记,Biometrika,68,1326-328(1981)
[5] Berentsen,G.D。;Kleppe,T.S。;Tjötheim,D.,《引入局部高斯,估计和可视化局部高斯相关性的R包》,J.Stat.Softw。,56, 1, 1-18 (2014)
[6] Berentsen,G.D。;斯特夫,B。;特约西姆·D·。;Nordbö,T.,《识别和可视化连接函数:使用局部高斯近似的方法》,《保险数学》。经济。,57, 90-103 (2014) ·Zbl 1304.62085号
[7] Berentsen,G.D。;Tjötheim,D.,使用局部高斯相关识别和可视化双变量数据中独立性的偏离,统计计算。,24, 5, 785-801 (2014) ·Zbl 1322.62140号
[8] E.布兰齐里。;Bryl,A.,《基于学习的电子邮件垃圾邮件过滤技术调查》,Artif。智力。修订版,29,1,63-92(2008)
[9] 盒子,G.E.P。;Tiao,G.C.,统计分析中的贝叶斯推断(1973),John Wiley&Sons·Zbl 0271.62044号
[10] Brier,G.W.,以概率表示的预测验证,周一。《天气评论》,78,1,1-3(1950)
[11] Burman,P.,《普通交叉验证、v形交叉验证和重复学习测试方法的比较研究》,《生物统计学》,76,3,503-514(1989)·Zbl 0677.62065号
[12] 乔杜里,P。;Ghosh,A.K。;Oja,H.,基于参数和非参数分类器混合的分类,IEEE Trans。模式分析。机器。智力。,31, 7, 1153-1164 (2009)
[13] Fawcett,T.,过程控制分析导论,模式识别。莱特。,27, 8, 861-874 (2006)
[14] Fisher,R.A.,《分类问题中多重测量的使用》,Ann.Eugen。,7, 2, 179-188 (1936)
[15] Ghosh,A.K。;Chaudhuri,P.,核判别分析中的最优平滑,统计学。Sinica,14,457-483(2004)·Zbl 1045.62024号
[16] Ghosh,A。;Hall,P.,关于非参数分类中的错误率估计,统计学。Sinica,18,1081-1100(2008)·Zbl 1149.62026号
[17] 霍尔,P。;Racine,J。;Li,Q.,交叉验证和概率密度估计,J.Amer。统计师。协会,99,99,1015-1026(2004)·Zbl 1055.62035号
[18] Hart,J.D。;Vieu,P.,基于相关数据的密度估计的数据驱动带宽选择,Ann.Statist。,18, 873-890 (1990) ·Zbl 0703.62045号
[19] 哈斯蒂·T·J。;Tibshirani,R.J.,广义加法模型(1990),查普曼和霍尔:查普曼与霍尔伦敦·Zbl 0747.62061号
[20] 哈斯蒂,T。;Tibshirani,R。;Friedman,J.,《统计学习的要素》(2009),Springer:Springer New York·Zbl 1273.62005年
[21] 海菲尔德,T。;Racine,J.S.,《非参数计量经济学:np包》,J.Stat.Softw。,27, 5, 1-32 (2008)
[22] Hjort,N.L。;Glad,I.K.,带参数起点的非参数密度估计,Ann.Statist。,23, 882-904 (1995) ·兹比尔083862027
[23] Hjort,N。;Jones,M.,局部参数非参数密度估计,Ann.Stat.,241619-1647(1996)·Zbl 0867.62030号
[24] 约翰逊·R·A。;Wichern,D.W.,《应用多元统计分析》,第六版(2007年),培生教育国际·Zbl 1269.62044号
[25] 琼斯,M.C。;Signorini,D.,《高阶偏差核密度估计量的比较》,J.Amer。统计师。协会,924391063-1073(1997)·Zbl 0888.62035号
[26] Jorheanger,洛杉矶。;Tjötheim,D.,非线性光谱分析:局部高斯方法(2019),预印本arXiv:1708.02166
[27] 朱卢姆,M。;罗兰,A。;Huseby,R.B。;非森,G。;Lorentzen,J.P.,《利用机器学习检测洗钱交易》,J.money Laund。控制,23,1173-186(2020)
[28] Kohavi,R.,《精度估计和模型选择的交叉验证和引导研究》,(国际人工智能联合会议,第14卷(1995年),蒙特利尔:加拿大蒙特利尔),1137-1145
[29] 拉卡尔,V。;Tjötheim,D.,局部高斯自相关和序列独立性测试,《时间序列分析》。,38, 1, 51-71 (2017) ·Zbl 1356.62145号
[30] 拉卡尔,V。;Tjötheim,D.,估计和测试两个时间序列之间的非线性局部相关性,J.Bus。经济。统计人员。,37, 4, 648-660 (2019)
[31] 李,J。;Cuesta-Albertos,J.A。;Liu,R.Y.,Dd-分类器:基于Dd-plot的非参数分类程序,J.Amer。统计师。协会,107,498,737-753(2012)·Zbl 1261.62058号
[32] 李强。;Racine,J.S.,《非参数计量经济学:理论与实践》(2007),普林斯顿大学出版社:普林斯顿大学出版·Zbl 1183.62200号
[33] 李强。;Racine,J.S.,混合分类和连续数据条件cdf和分位数函数的非参数估计,J.Bus。经济。统计人员。,26, 4, 423-434 (2008)
[34] Loader,C.R.,局部似然密度估计,Ann.Statist。,34, 1602-1618 (1996) ·Zbl 0867.62034号
[35] Marron,J.S.,非参数判别中贝叶斯风险的最优收敛率,Ann.Statist。,11, 4, 1142-1155 (1983) ·Zbl 0554.62053号
[36] Min,J.H。;Jeong,C.,破产预测的二元分类方法,专家系统。申请。,36, 3, 5256-5263 (2009)
[37] Nadaraya,E.A.,分布函数的一些新估计,理论概率。申请。,9, 3, 497-500 (1964) ·Zbl 0152.17605号
[38] Nelsen,R.B.,Copulas简介(2007),施普林格科学与商业媒体
[39] Otneim,H.,lg:局部高斯分布:估计和方法(2019年),R包版本0.4.1
[40] Otneim,H。;Tjötheim,D.,多元数据的局部高斯密度估计,统计计算。,27, 6, 1595-1616 (2017) ·Zbl 1384.62128号
[41] Otneim,H。;Tjötheim,D.,使用局部高斯相关的条件密度估计,统计计算。,28, 2, 303-321 (2018) ·Zbl 1384.62127号
[42] 普瓦,C。;Lee,V。;史密斯,K。;Gayler,R.,《基于数据挖掘的欺诈检测研究综合调查》(2010),arXiv预印本arXiv:1009.6119
[43] R: 统计计算语言与环境(2018),R统计计算基金会:R统计计算基础,奥地利维也纳
[44] Ranjan,R。;Gneiting,T.,《结合概率预测》,J.R.Stat.Soc.Ser。《美国统计年鉴》。,72, 1, 71-91 (2010) ·Zbl 1411.62270号
[45] Samworth,R.,《最佳加权最近邻分类器》,《Ann.Stat.》,40,2733-2763(2012)·兹比尔1373.62317
[46] Satabdi,P.,《印度市场工作文件中信用评级分类和预测的支持向量机方法》(2018)
[47] Schott,P.A.,《反洗钱和打击资助恐怖主义参考指南》(2006年),世界银行
[48] Silverman,B.W.,《统计和数据分析密度估计》(1986年),查普曼和霍尔:查普曼与霍尔伦敦·Zbl 0617.62042号
[49] Stone,C.J.,对数样条模型的大样本推断,Ann.Statist。,717-741 (1990) ·Zbl 0712.62036号
[50] 斯通,C.J。;汉森,M.H。;科珀伯格,C。;Truong,Y.K.,扩展线性建模中的多项式样条及其张量乘积:1994年瓦尔德纪念讲座,Ann.Statist。,25, 4, 1371-1470 (1997) ·Zbl 0924.62036号
[51] Tjötheim,D.,使用模式识别改进地震识别,Phys。地球。埋。,16, 85-108 (1978)
[52] 特约西姆·D·。;Hufthammer,K.O.,《局部高斯相关性:一种新的依赖性度量》,《计量经济学杂志》,172,33-48(2013)·Zbl 1443.62288号
[53] Wood,S.,广义加性模型:R导论(2017),Chapman和Hall/CRC·Zbl 1368.62004号
[54] 郑,R。;李,J。;陈,H。;黄,Z.,《在线消息作者身份识别框架:写作风格特征和分类技术》,《美国社会科学杂志》。技术。,57, 3, 378-393 (2006)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。