×

异方差误差下的曲线估计和聚类。 (英语) 兹比尔1256.62020

摘要:本文介绍的技术是一种估计和发现具有异方差误差的大量曲线潜在模式的方法。因此,假设每条曲线的平均值和方差函数均未知且随时间变化。该方法由一系列步骤组成。我们使用(L_2)中函数的正交基进行变换。在变换域中,非参数回归被简化为均值模型。为了估计变换域中的平均值,我们考虑线性或调制估值器的类别,并按如下方式进行处理R.贝兰Dümbgen公司[估计量和置信集的调制。Ann.Stat.26,No.5,1826–1856(1998;Zbl 1073.62538号)]通过最小化Stein的无偏风险估计。通过最小化调制器嵌套子集选择的风险,我们降低了均值空间的维数。我们证明了在变换空间中,在异方差误差下,Sobolev椭球上的风险估计在Pinsker极小极大意义下是渐近最优的。通过最优风险估计进行系数估计和降维对于准确的聚类隶属度估计至关重要。我们通过在合成示例和特定应用程序中估计和聚类大量曲线来说明我们的技术。在此应用程序中,我们分析了Compustat Global数据库中公司子集的研发支出。我们表明,我们的方法优于两种备选方法。

MSC公司:

62G08号 非参数回归和分位数回归
62G05型 非参数估计
62H30型 分类和区分;聚类分析(统计方面)
65C60个 统计中的计算问题(MSC2010)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 内政部:10.1198/0162145000001574·Zbl 1117.62422号 ·doi:10.1198/0162145000001574
[2] DOI:10.1214/aos/1024691359·Zbl 1073.62538号 ·doi:10.1214/aos/1024691359
[3] DOI:10.1093/生物信息学/17.10.977·doi:10.1093/bioinformatics/17.10.977
[4] 内政部:10.1111/j.1467-9868.2004.02059.x·Zbl 1060.62064号 ·文件编号:10.1111/j.1467-9868.2004.02059.x
[5] 内政部:10.1093/biomet/85.3645·Zbl 0918.62065号 ·doi:10.1093/biomet/85.3.645
[6] 内政部:10.1214/aos/1176349022·Zbl 0773.62029号 ·doi:10.1214/aos/1176349022
[7] Fan J.,J.R.Stat.Soc.B 57第371页–(1995)
[8] 内政部:10.2307/2291516·Zbl 0868.62034号 ·doi:10.2307/2291516
[9] 内政部:10.1016/0378-3758(93)90046-9·Zbl 0769.62029号 ·doi:10.1016/0378-3758(93)90046-9
[10] 内政部:10.1214/aos/1176324630·Zbl 0841.62033号 ·doi:10.1214操作系统/1176324630
[11] DOI:10.1016/S0304-4076(97)00044-4·兹比尔0904.62047 ·doi:10.1016/S0304-4076(97)00044-4
[12] Efromovich,S.1999年。”非参数曲线估计:方法、理论和应用”。纽约:斯普林格·Zbl 0935.62039号
[13] Hartigan,J.A.1975年。”聚类算法”。John Wiley&Sons公司·Zbl 0372.62040号
[14] 内政部:10.2307/2284239·doi:10.2307/2284239
[15] DOI:10.111/1467-9868.00293·Zbl 0979.62046号 ·数字对象标识代码:10.1111/1467-9868.00293
[16] Pisier G.,数学课堂讲稿995 pp 123–(1983)
[17] Durbin J.,Biometrika 58第1页–(1971)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。