跳到主页内容
美国国旗

美国政府的官方网站

Dot政府

gov意味着它是官方的。
联邦政府网站通常以.gov或.mil结尾。之前分享敏感信息,确保你在联邦政府政府网站。

Https系统

该站点是安全的。
这个https(https)://确保您连接到官方网站,并且您提供的任何信息都是加密的并安全传输。

访问密钥 NCBI主页 MyNCBI主页 主要内容 主导航
.2015年6月1日;110(510):630-641.
doi:10.1080/01621459.2014.920256。

超高维判别分析的无模型特征筛选

附属公司

用于超高维判别分析的无模型特征筛选

崔恒健等。 美国统计协会. .

摘要

这项工作涉及超高维判别分析中的边缘确定独立特征筛选。在判别分析中,反应变量是分类的。这使得我们可以使用条件分布函数来构建一个新的特征筛选索引。本文提出了一种基于经验条件分布函数的边缘特征筛选方法。我们为所提出的过程建立了确定的筛选和排序一致性属性,而不需要对预测因子假设任何矩条件。拟议的程序有几个吸引人的优点。首先,它是无模型的,因为它的实现不需要指定回归模型。其次,它对预测因子的重尾分布和潜在异常值的存在具有鲁棒性。第三,它允许分类回答具有不同数量的类,其顺序为O(运行)(n个κ)和一些κ≥ 0. 我们通过蒙特卡罗模拟研究和数值比较评估了该方法的有限样本特性。我们通过对两个真实数据集的实证分析进一步说明了所提出的方法。

关键词:特征筛选;排名一致性;确定屏蔽性能;超高维数据分析。

PubMed免责声明

数字

图1
图1
(a) 的箱线图变量Y(Y)1[F类(x个|Y(Y)1)]反对c(c)星号表示平均值;(b) 的绘图变量Y(Y)1[F类(x个|Y(Y)1)]反对x个对于不同的c(c)价值观;(c) 第个方框图,共个变量Y(Y)2[F类(x个|Y(Y)2)]反对c(c)星号表示平均值;(d) 的绘图变量Y(Y)2[F类(x个|Y(Y)2)]反对x个对于不同的c(c)值。
图2
图2
实施例2中的肺癌数据。(a) 181个样本100个随机分区训练集的分类错误箱线图;(b) 测试集中分类错误的箱线图;(c) 选定基因数量的方框图。

类似文章

引用人

工具书类

    1. Bhattacharjee A、Richards W、Staunton J、Li C、Monti S、Vasal P、Ladd C、Beheshti J、Bueno R、Gillette M、Loda M、Weber G、Mark E、Lander E、Wong W、Johnson B、Golub T、Sugarbaker D、Meyerson M。通过mRNA表达谱对人类肺癌的分类揭示了不同的腺癌亚类。美国国家科学院。2001;98:13790–13795.-项目管理咨询公司-公共医学
    1. Clemmensen L,Hastie T,Witten D,Ersboll B.稀疏判别分析。技术计量学。2011;53:406–415.
    1. Fan J,Fan Y.使用特征退火独立规则进行高维分类。统计年鉴。2008;36:2605–2637.-项目管理咨询公司-公共医学
    1. Fan J,Feng Y,Song R.稀疏超高维加性模型中的非参数独立性筛选。美国统计协会杂志。2011;106:544–557.-项目管理咨询公司-公共医学
    1. Fan J,Ma Y,Dai W.稀疏超高维变系数模型中的非参数独立筛选。美国统计协会杂志。2014年出版。-项目管理咨询公司-公共医学

LinkOut-更多资源