文件Zbl 1456.62062-zbMATH Open

将本地Fisher和朴素贝叶斯配对：改进两个标准判别式。（英语） Zbl 1456.62062号

《经济学杂志》。 216，第1期，284-304（2020）.

小结：Fisher判别式可能是连续数据中最著名的似然判别式。另一个基准鉴别是朴素贝叶斯，它只基于边缘。本文通过建模变量对之间的依赖关系来扩展这两个判别式。在连续情况下，这是由费希尔判别式的局部高斯版本完成的。在离散情况下，通过取两两联合概率的几何平均值来扩展朴素贝叶斯。我们还指出了如何将这两种方法结合用于混合连续和离散数据。新的判别式在一些模拟实验和实际数据说明中显示了良好的结果。

引用于2文件

MSC公司：

62G07年	密度估算
6220国集团	非参数推理的渐近性质
62H30型	分类和区分；聚类分析（统计方面）
62第20页	统计学在经济学中的应用

关键词：

核估计量;局部Fisher判别式;朴素贝叶斯判别式;成对依赖;局部高斯密度

软件：

局部高斯;净现值;lg（长度）;R（右）;加迈尔

PDF格式 BibTeX公司 XML格式引用

全文：内政部

参考文献：

[1]	Aas，K。；Czado，C。；弗里吉斯，A。；Bakken，H.，多重依赖的对copula构造，保险数学。经济。，44, 2, 182-198 (2009) ·Zbl 1165.60009号
[2]	阿加瓦尔，C.C。；翟，C.，文本分类算法综述，（Mining text Data（2012），Springer），163-222
[3]	艾奇逊，J。；Aitken，C.G.，《利用核方法进行多元二进制判别》，《生物统计学》，第63、3、413-420页（1976年）·Zbl 0344.62035号
[4]	Azzalini，A.，关于用核方法估计分布函数和分位数的注记，Biometrika，68，1326-328（1981）
[5]	Berentsen，G.D。；Kleppe，T.S。；Tjötheim，D.，《引入局部高斯，估计和可视化局部高斯相关性的R包》，J.Stat.Softw。，56, 1, 1-18 (2014)
[6]	Berentsen，G.D。；斯特夫，B。；特约西姆·D·。；Nordbö，T.，《识别和可视化连接函数：使用局部高斯近似的方法》，《保险数学》。经济。，57, 90-103 (2014) ·Zbl 1304.62085号
[7]	Berentsen，G.D。；Tjötheim，D.，使用局部高斯相关识别和可视化双变量数据中独立性的偏离，统计计算。，24, 5, 785-801 (2014) ·Zbl 1322.62140号
[8]	E.布兰齐里。；Bryl，A.，《基于学习的电子邮件垃圾邮件过滤技术调查》，Artif。智力。修订版，29，1，63-92（2008）
[9]	盒子，G.E.P。；Tiao，G.C.，统计分析中的贝叶斯推断（1973），John Wiley&Sons·Zbl 0271.62044号
[10]	Brier，G.W.，以概率表示的预测验证，周一。《天气评论》，78，1，1-3（1950）
[11]	Burman，P.，《普通交叉验证、v形交叉验证和重复学习测试方法的比较研究》，《生物统计学》，76，3，503-514（1989）·Zbl 0677.62065号
[12]	乔杜里，P。；Ghosh，A.K。；Oja，H.，基于参数和非参数分类器混合的分类，IEEE Trans。模式分析。机器。智力。，31, 7, 1153-1164 (2009)
[13]	Fawcett，T.，过程控制分析导论，模式识别。莱特。，27, 8, 861-874 (2006)
[14]	Fisher，R.A.，《分类问题中多重测量的使用》，Ann.Eugen。，7, 2, 179-188 (1936)
[15]	Ghosh，A.K。；Chaudhuri，P.，核判别分析中的最优平滑，统计学。Sinica，14，457-483（2004）·Zbl 1045.62024号
[16]	Ghosh，A。；Hall，P.，关于非参数分类中的错误率估计，统计学。Sinica，18，1081-1100（2008）·Zbl 1149.62026号
[17]	霍尔，P。；Racine，J。；Li，Q.，交叉验证和概率密度估计，J.Amer。统计师。协会，99，99，1015-1026（2004）·Zbl 1055.62035号
[18]	Hart，J.D。；Vieu，P.，基于相关数据的密度估计的数据驱动带宽选择，Ann.Statist。，18, 873-890 (1990) ·Zbl 0703.62045号
[19]	哈斯蒂·T·J。；Tibshirani，R.J.，广义加法模型（1990），查普曼和霍尔：查普曼与霍尔伦敦·Zbl 0747.62061号
[20]	哈斯蒂，T。；Tibshirani，R。；Friedman，J.，《统计学习的要素》（2009），Springer:Springer New York·Zbl 1273.62005年
[21]	海菲尔德，T。；Racine，J.S.，《非参数计量经济学：np包》，J.Stat.Softw。，27, 5, 1-32 (2008)
[22]	Hjort，N.L。；Glad，I.K.，带参数起点的非参数密度估计，Ann.Statist。，23, 882-904 (1995) ·兹比尔083862027
[23]	Hjort，N。；Jones，M.，局部参数非参数密度估计，Ann.Stat.，241619-1647（1996）·Zbl 0867.62030号
[24]	约翰逊·R·A。；Wichern，D.W.，《应用多元统计分析》，第六版（2007年），培生教育国际·Zbl 1269.62044号
[25]	琼斯，M.C。；Signorini，D.，《高阶偏差核密度估计量的比较》，J.Amer。统计师。协会，924391063-1073（1997）·Zbl 0888.62035号
[26]	Jorheanger，洛杉矶。；Tjötheim，D.，非线性光谱分析：局部高斯方法（2019），预印本arXiv:1708.02166
[27]	朱卢姆，M。；罗兰，A。；Huseby，R.B。；Å非森，G。；Lorentzen，J.P.，《利用机器学习检测洗钱交易》，J.money Laund。控制，23,1173-186（2020）
[28]	Kohavi，R.，《精度估计和模型选择的交叉验证和引导研究》，（国际人工智能联合会议，第14卷（1995年），蒙特利尔：加拿大蒙特利尔），1137-1145
[29]	拉卡尔，V。；Tjötheim，D.，局部高斯自相关和序列独立性测试，《时间序列分析》。，38, 1, 51-71 (2017) ·Zbl 1356.62145号
[30]	拉卡尔，V。；Tjötheim，D.，估计和测试两个时间序列之间的非线性局部相关性，J.Bus。经济。统计人员。，37, 4, 648-660 (2019)
[31]	李，J。；Cuesta-Albertos，J.A。；Liu，R.Y.，Dd-分类器：基于Dd-plot的非参数分类程序，J.Amer。统计师。协会，107，498，737-753（2012）·Zbl 1261.62058号
[32]	李强。；Racine，J.S.，《非参数计量经济学：理论与实践》（2007），普林斯顿大学出版社：普林斯顿大学出版·Zbl 1183.62200号
[33]	李强。；Racine，J.S.，混合分类和连续数据条件cdf和分位数函数的非参数估计，J.Bus。经济。统计人员。，26, 4, 423-434 (2008)
[34]	Loader，C.R.，局部似然密度估计，Ann.Statist。，34, 1602-1618 (1996) ·Zbl 0867.62034号
[35]	Marron，J.S.，非参数判别中贝叶斯风险的最优收敛率，Ann.Statist。，11, 4, 1142-1155 (1983) ·Zbl 0554.62053号
[36]	Min，J.H。；Jeong，C.，破产预测的二元分类方法，专家系统。申请。，36, 3, 5256-5263 (2009)
[37]	Nadaraya，E.A.，分布函数的一些新估计，理论概率。申请。，9, 3, 497-500 (1964) ·Zbl 0152.17605号
[38]	Nelsen，R.B.，Copulas简介（2007），施普林格科学与商业媒体
[39]	Otneim，H.，lg：局部高斯分布：估计和方法（2019年），R包版本0.4.1
[40]	Otneim，H。；Tjötheim，D.，多元数据的局部高斯密度估计，统计计算。，27, 6, 1595-1616 (2017) ·Zbl 1384.62128号
[41]	Otneim，H。；Tjötheim，D.，使用局部高斯相关的条件密度估计，统计计算。，28, 2, 303-321 (2018) ·Zbl 1384.62127号
[42]	普瓦，C。；Lee，V。；史密斯，K。；Gayler，R.，《基于数据挖掘的欺诈检测研究综合调查》（2010），arXiv预印本arXiv:1009.6119
[43]	R：统计计算语言与环境（2018），R统计计算基金会：R统计计算基础，奥地利维也纳
[44]	Ranjan，R。；Gneiting，T.，《结合概率预测》，J.R.Stat.Soc.Ser。《美国统计年鉴》。，72, 1, 71-91 (2010) ·Zbl 1411.62270号
[45]	Samworth，R.，《最佳加权最近邻分类器》，《Ann.Stat.》，40，2733-2763（2012）·兹比尔1373.62317
[46]	Satabdi，P.，《印度市场工作文件中信用评级分类和预测的支持向量机方法》（2018）
[47]	Schott，P.A.，《反洗钱和打击资助恐怖主义参考指南》（2006年），世界银行
[48]	Silverman，B.W.，《统计和数据分析密度估计》（1986年），查普曼和霍尔：查普曼与霍尔伦敦·Zbl 0617.62042号
[49]	Stone，C.J.，对数样条模型的大样本推断，Ann.Statist。，717-741 (1990) ·Zbl 0712.62036号
[50]	斯通，C.J。；汉森，M.H。；科珀伯格，C。；Truong，Y.K.，扩展线性建模中的多项式样条及其张量乘积：1994年瓦尔德纪念讲座，Ann.Statist。，25, 4, 1371-1470 (1997) ·Zbl 0924.62036号
[51]	Tjötheim，D.，使用模式识别改进地震识别，Phys。地球。埋。，16, 85-108 (1978)
[52]	特约西姆·D·。；Hufthammer，K.O.，《局部高斯相关性：一种新的依赖性度量》，《计量经济学杂志》，172，33-48（2013）·Zbl 1443.62288号
[53]	Wood，S.，广义加性模型：R导论（2017），Chapman和Hall/CRC·Zbl 1368.62004号
[54]	郑，R。；李，J。；陈，H。；黄，Z.，《在线消息作者身份识别框架：写作风格特征和分类技术》，《美国社会科学杂志》。技术。，57, 3, 378-393 (2006)

此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配，可能包含数据转换错误。在某些情况下，zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献，而不要求完整或完全匹配。

任何	在任何地方
一个	内部文档标识符
澳大利亚	作者、编辑
人工智能	内部作者标识符
钛	标题
洛杉矶	语言
所以	来源
ab公司	回顾，摘要
第页	出版年份
车辆	评审员
复写的副本	MSC代码
美国犹他州	关键字
日期	文档类型(j个：期刊文章；b条：book；一：图书文章）

一&b条	逻辑和
一\|b条	逻辑或
!ab公司	逻辑不
美国广播公司*	右通配符
"ab c公司"	短语
(ab c公司)	圆括号

示例

领域

操作员

将本地Fisher和朴素贝叶斯配对：改进两个标准判别式。（英语） Zbl 1456.62062号

MSC公司：

关键词：

软件：

参考文献：

示例

领域

操作员

将本地Fisher和朴素贝叶斯配对：改进两个标准判别式。 （英语） Zbl 1456.62062号

MSC公司：

关键词：

软件：

参考文献：

将本地Fisher和朴素贝叶斯配对：改进两个标准判别式。（英语） Zbl 1456.62062号