稀疏降秩回归的交叉验证

表1

AIC、BIC、EBIC、PIC、双重交叉验证、十倍交叉验证、五倍交叉验证和五倍SCV在n个>第页较小信号强度的实验(b条= 0.1)†

方法	ρ的结果= 0.1					ρ的结果= 0.5
	MSE公司	$\hat{J型}$	$\hat{第页}$	M（%）	固定资产（%）	MSE公司	$\hat{J型}$	$\hat{第页}$	M（%）	固定资产（%）
AIC公司	43	37	6	4	29	44	38	6	7	35
比克	45	20	三	33	0	42	18	三	41	1
EBIC公司	104	8	1	74	0	103	7	1	75	0
照片	26	29	4	11	7	28	27	4	18	9
两倍CV	99	50	10	1	68	99	50	10	三	69
Tenfold简历	99	50	10	1	68	99	50	10	三	69
五倍简历	96	50	10	1	68	96	50	10	三	69
五倍SCV	28	29	5	10	9	30	27	5	19	9

方法	ρ的结果= 0.1					ρ的结果= 0.5
	MSE公司	$\hat{J型}$	$\hat{第页}$	M（%）	固定资产（%）	MSE公司	$\hat{J型}$	$\hat{第页}$	M（%）	固定资产（%）
AIC公司	43	37	6	4	29	44	38	6	7	35
比克	45	20	三	33	0	42	18	三	41	1
EBIC公司	104	8	1	74	0	103	7	1	75	0
照片	26	29	4	11	7	28	27	4	18	9
两倍CV	99	50	10	1	68	99	50	10	三	69
Tenfold简历	99	50	10	1	68	99	50	10	三	69
五倍简历	96	50	10	1	68	96	50	10	三	69
五倍SCV	28	29	5	10	9	30	27	5	19	9

†

为便于比较，对中小企业进行了缩放。

表2

AIC、BIC、EBIC、PIC、双重交叉验证、十倍交叉验证、五倍交叉验证和五倍SCV之间的性能比较n个>第页大信号强度实验(b条= 0.5)†

方法	ρ的结果= 0.1					ρ的结果= 0.5
	MSE公司	$\hat{J型}$	$\hat{第页}$	M（%）	固定资产（%）	MSE公司	$\hat{J型}$	$\hat{第页}$	M（%）	固定资产（%）
伊拉克语	13	34	6	0	17	12	33	6	0	17
比克	7	30	5	0	0	7	30	5	0	0
EBIC公司	7	30	5	0	0	7	30	5	0	0
照片	7	30	5	0	1	7	30	5	0	0
两个旧CV	40	50	10	0	67	40	50	10	0	67
Tenfold简历	40	50	10	0	67	40	50	10	0	67
五倍简历	40	50	10	0	66	40	50	10	0	66
五倍SCV	7	30	5	0	2	7	30	5	0	1

方法	ρ的结果= 0.1					ρ的结果= 0.5
	MSE公司	$\hat{J型}$	$\hat{第页}$	M（%）	固定资产（%）	MSE公司	$\hat{J型}$	$\hat{第页}$	M（%）	FA（%）
AIC公司	13	34	6	0	17	12	33	6	0	17
比克	7	30	5	0	0	7	30	5	0	0
EBIC公司	7	30	5	0	0	7	30	5	0	0
照片	7	30	5	0	1	7	30	5	0	0
两倍CV	40	50	10	0	67	40	50	10	0	67
Tenfold简历	40	50	10	0	67	40	50	10	0	67
五倍简历	40	50	10	0	66	40	50	10	0	66
五倍SCV	7	30	5	0	2	7	30	5	0	1

†

为便于比较，对中小企业进行了缩放。

表2

AIC、BIC、EBIC、PIC、双重交叉验证、十倍交叉验证、五倍交叉验证和五倍SCV之间的性能比较n个>第页大信号强度实验(b条= 0.5)†

方法	ρ的结果= 0.1					ρ的结果= 0.5
	MSE公司	$\hat{J型}$	$\hat{第页}$	M（%）	固定资产（%）	MSE公司	$\hat{J型}$	$\hat{第页}$	M（%）	固定资产（%）
AIC公司	13	34	6	0	17	12	33	6	0	17
比克	7	30	5	0	0	7	30	5	0	0
EBIC公司	7	30	5	0	0	7	30	5	0	0
照片	7	30	5	0	1	7	30	5	0	0
两倍CV	40	50	10	0	67	40	50	10	0	67
Tenfold简历	40	50	10	0	67	40	50	10	0	67
五倍简历	40	50	10	0	66	40	50	10	0	66
五倍SCV	7	30	5	0	2	7	30	5	0	1

方法	ρ的结果= 0.1					ρ的结果= 0.5
	MSE公司	$\hat{J型}$	$\hat{第页}$	M（%）	FA（%）	MSE公司	$\hat{J型}$	$\hat{第页}$	M（%）	固定资产（%）
伊拉克语	13	34	6	0	17	12	33	6	0	17
比克	7	30	5	0	0	7	30	5	0	0
EBIC公司	7	30	5	0	0	7	30	5	0	0
照片	7	30	5	0	1	7	30	5	0	0
两倍CV	40	50	10	0	67	40	50	10	0	67
Tenfold简历	40	50	10	0	67	40	50	10	0	67
五倍简历	40	50	10	0	66	40	50	10	0	66
五倍SCV	7	30	5	0	2	7	30	5	0	1

†

为便于比较，对中小企业进行了缩放。

表3

AIC、BIC、EBIC、PIC、双重交叉验证、十倍交叉验证、五倍交叉验证和五倍SCV之间的性能比较第页>n个较小信号强度的实验(b条=0.2）†

方法	ρ的结果= 0.1					ρ的结果= 0.5
	MSE公司	$\hat{J型}$	$\hat{第页}$	M（%）	固定资产（%）	MSE公司	$\hat{J型}$	$\hat{第页}$	M（%）	固定资产（%）
AIC公司	93	24	4	44	17	79	24	4	36	16
比克	42	12	1	59	7	31	10	2	56	5
EBIC公司	43	7	1	71	三	36	4	1	74	1
照片	40	10	2	62	5	28	9	2	59	三
两倍CV	122	25	4	43	19	97	25	4	35	18
Tenfold简历	130	25	4	43	19	99	25	4	35	18
五倍简历	128	25	4	43	19	99	25	4	35	18
五倍SCV	41	10	2	62	5	29	8	2	61	三

方法	ρ的结果= 0.1					ρ的结果= 0.5
	MSE公司	$\hat{J型}$	$\hat{第页}$	M（%）	固定资产（%）	MSE公司	$\hat{J型}$	$\hat{第页}$	M（%）	固定资产（%）
AIC公司	93	24	4	44	17	79	24	4	36	16
比克	42	12	1	59	7	31	10	2	56	5
EBIC公司	43	7	1	71	三	36	4	1	74	1
照片	40	10	2	62	5	28	9	2	59	三
两倍CV	122	25	4	43	19	97	25	4	35	18
Tenfold简历	130	25	4	43	19	99	25	4	35	18
五倍简历	128	25	4	43	19	99	25	4	35	18
五倍SCV	41	10	2	62	5	29	8	2	61	三

†

为便于比较，对中小企业进行了缩放。

表3

AIC、BIC、EBIC、PIC、双重交叉验证、十倍交叉验证、五倍交叉验证和五倍SCV之间的性能比较第页>n个较小信号强度的实验(b条= 0.2)†

方法	ρ的结果= 0.1					ρ的结果= 0.5
	MSE公司	$\hat{J型}$	$\hat{第页}$	M（%）	固定资产（%）	MSE公司	$\hat{J型}$	$\hat{第页}$	M（%）	固定资产（%）
AIC公司	93	24	4	44	17	79	24	4	36	16
比克	42	12	1	59	7	31	10	2	56	5
EBIC公司	43	7	1	71	三	36	4	1	74	1
照片	40	10	2	62	5	28	9	2	59	三
两倍CV	122	25	4	43	19	97	25	4	35	18
十倍CV	130	25	4	43	19	99	25	4	35	18
五倍简历	128	25	4	43	19	99	25	4	35	18
五倍SCV	41	10	2	62	5	29	8	2	61	三

方法	ρ的结果= 0.1					ρ的结果= 0.5
	MSE公司	$\hat{J型}$	$\hat{第页}$	M（%）	固定资产（%）	MSE公司	$\hat{J型}$	$\hat{第页}$	M（%）	固定资产（%）
AIC公司	93	24	4	44	17	79	24	4	36	16
比克	42	12	1	59	7	31	10	2	56	5
EBIC公司	43	7	1	71	三	36	4	1	74	1
照片	40	10	2	62	5	28	9	2	59	三
两倍CV	122	25	4	43	19	97	25	4	35	18
Tenfold简历	130	25	4	43	19	99	25	4	35	18
五倍简历	128	25	4	43	19	99	25	4	35	18
五倍SCV	41	10	2	62	5	29	8	2	61	三

†

为便于比较，对中小企业进行了缩放。

表4

AIC、BIC、EBIC、PIC双重交叉验证、十倍交叉验证、五倍交叉验证和五倍SCV之间的性能比较第页>n个大信号强度实验(b条= 1)†

方法	ρ的结果= 0.1					ρ的结果= 0.5
	MSE公司	$\hat{J型}$	$\hat{第页}$	M（%）	固定资产（%）	MSE公司	$\hat{J型}$	$\hat{第页}$	M（%）	固定资产（%）
AIC公司	47	25	2	40	18	31	25	2	32	16
比克	43	24	2	40	17	30	24	2	33	15
EBIC公司	34	21	2	43	12	26	19	2	38	11
照片	41	23	2	40	15	28	21	2	35	13
两个旧CV	47	25	2	40	18	34	25	三	31	17
Tenfold简历	48	25	三	40	18	34	25	三	31	17
五倍CV	50	25	2	39	18	35	25	4	31	17
五倍SCV	34	11	2	58	5	22	11	2	53	4

方法	ρ的结果= 0.1					ρ的结果= 0.5
	MSE公司	$\hat{J型}$	$\hat{第页}$	M（%）	固定资产（%）	MSE公司	$\hat{J型}$	$\hat{第页}$	M（%）	固定资产（%）
AIC公司	47	25	2	40	18	31	25	2	32	16
比克	43	24	2	40	17	30	24	2	33	15
EBIC公司	34	21	2	43	12	26	19	2	38	11
照片	41	23	2	40	15	28	21	2	35	13
两倍CV	47	25	2	40	18	34	25	三	31	17
Tenfold简历	48	25	三	40	18	34	25	三	31	17
五倍简历	50	25	2	39	18	35	25	4	31	17
五倍SCV	34	11	2	58	5	22	11	2	53	4

†

为便于比较，对中小企业进行了缩放。

表4

AIC、BIC、EBIC、PIC双重交叉验证、十倍交叉验证、五倍交叉验证和五倍SCV之间的性能比较第页>n个大信号强度实验(b条= 1)†

方法	ρ的结果= 0.1					ρ的结果= 0.5
	MSE公司	$\hat{J型}$	$\hat{第页}$	M（%）	固定资产（%）	MSE公司	$\hat{J型}$	$\hat{第页}$	M（%）	固定资产（%）
AIC公司	47	25	2	40	18	31	25	2	32	16
比克	43	24	2	40	17	30	24	2	33	15
EBIC公司	34	21	2	43	12	26	19	2	38	11
照片	41	23	2	40	15	28	21	2	35	13
两倍CV	47	25	2	40	18	34	25	三	31	17
Tenfold简历	48	25	三	40	18	34	25	三	31	17
五倍简历	50	25	2	39	18	35	25	4	31	17
五倍SCV	34	11	2	58	5	22	11	2	53	4

方法	ρ的结果= 0.1					ρ的结果= 0.5
	MSE公司	$\hat{J型}$	$\hat{第页}$	M（%）	固定资产（%）	MSE公司	$\hat{J型}$	$\hat{第页}$	M（%）	固定资产（%）
伊拉克语	47	25	2	40	18	31	25	2	32	16
比克	43	24	2	40	17	30	24	2	33	15
EBIC公司	34	21	2	43	12	26	19	2	38	11
照片	41	23	2	40	15	28	21	2	35	13
两个旧CV	47	25	2	40	18	34	25	三	31	17
Tenfold简历	48	25	三	40	18	34	25	三	31	17
五倍简历	50	25	2	39	18	35	25	4	31	17
五倍SCV	34	11	2	58	5	22	11	2	53	4

†

为便于比较，对中小企业进行了缩放。

PIC和SCV方法在这里考虑的几乎所有信号强度和相关性组合中都具有优越的预测性能。EBIC在低信噪比实验中的预测（例如，参见表1)有证据表明，其相对较高的复杂性惩罚导致了对这些特定设置进行过多的规范化。相反，在较大的信噪比实验中，EBIC的预测性能与PIC和SCV的预测性能相当（见表2和4). 在第页>n个在所有信息标准中，AIC的MSE最高，这并不令人惊讶，因为众所周知，AIC在很大程度上低估了第页.

交叉验证通常具有所有方法中最高的MSE，这表明速率校正是绝对必要的。在所有实验中，交叉验证的预测性能K（K）=2、5、10相似，验证了推论1后面的讨论。K（K）=5与K（K）= 2, 10.

有趣的是，当信号强度较弱时，PIC和SCV忽略了在无噪声情况下指定的一些变量（见表1和三)，但这可能是自然的，因为可能需要更多的正则化才能实现较低的预测误差。在这些小的SNR实验中，AIC往往会漏掉这些无噪声变量中最少的一个，但这是以较高的FA比率为代价的，正如前面所述，它的预测精度通常较差。在弱信号强度和强信号强度情况下，BIC，尤其是EBIC与AIC相比往往具有较高的丢失率，因为它们的惩罚条款更大，但与PIC和SCV不同，它们很少能够选择具有简约性的模型和弱信噪比和强信噪比情况下的预测误差都很低。

在n个>第页信号强度相对较强的实验（表2)PIC和SCV的变量选择性能几乎等于或超过所有其他方法。事实上，他们的M和FA比率在表中几乎为02这表明真实的变量也具有高度的预测性。事实上，在如此大的信噪比情况下（见定理5），PIC可以很高的概率恢复无噪声行支持。

与其他方法相比，PIC和SCV的中位数秩值与真实值最为一致。几乎在每个实验中，AIC和交叉验证都高估了第页而当信号强度相对较弱时，BIC，尤其是EBIC低估了等级。

PIC和SCV的预测性能在n个>第页实验（见表1和2)，但SCV在表中显示了一些优势4。我们通过改变第页>n个实验；参见表5SCV产生的标准误差最低，似乎更能成功地选择MSE最低的模型，并减少不稳定性。

表5

中PIC和SCV的预测误差比较第页>n个各种信号强度的实验†

方法	ρ的结果=0.1			ρ的结果= 0.5
	b条= 2	b条= 3	b条= 4	b条= 2	b条= 3	b条= 4
照片	42 (22)	42 (23)	43 (23)	28 (19)	29 (19)	29 (19)
SCV公司	34（16）	33 (17)	33 (17)	21 (10)	21 (10)	21 (10)

方法	ρ的结果= 0.1			ρ的结果= 0.5
	b条= 2	b条= 3	b条= 4	b条= 2	b条= 3	b条= 4
照片	42 (22)	42 (23)	43 (23)	28 (19)	29 (19)	29 (19)
SCV公司	34 (16)	33 (17)	33 (17)	21 (10)	21 (10)	21 (10)

†

报告的数字是小微企业，括号中有标准错误（为了便于比较，按比例缩放）。

表5

中PIC和SCV的预测误差比较第页>n个不同信号强度的实验†

方法	ρ的结果= 0.1			ρ的结果= 0.5
	b条= 2	b条= 3	b条= 4	b条= 2	b条= 3	b条= 4
照片	42（22）	42 (23)	43 (23)	28 (19)	29 (19)	29 (19)
SCV公司	34 (16)	33 (17)	33 (17)	21（10）	21 (10)	21 (10)

方法	ρ的结果= 0.1			ρ的结果= 0.5
	b条= 2	b条= 3	b条= 4	b条= 2	b条= 3	b条= 4
照片	42 (22)	42 (23)	43 (23)	28 (19)	29 (19)	29 (19)
SCV公司	34 (16)	33 (17)	33 (17)	21 (10)	21 (10)	21 (10)

†

报告的数字是小微企业，括号中有标准错误（为了便于比较，按比例缩放）。

总的来说，在几乎所有情况下，PIC或SCV的预测误差都最小，这是本工作的最终目标。在弱信号强度情况下，可以认为AIC的选择更好，因为它在无噪声模拟真实性方面遗漏了最少的变量。然而，如前所述，由于低信噪比数据受到噪声的严重污染，根据M-和FA-比率测量的变量选择可能没有意义；更加节俭和预测模型可能与生成合成数据时使用的零噪模型不同。

5.2酵母细胞周期数据

在斯佩尔曼进行的一项实验中等. (1998)收集了106个转录因子（TF）（也称为DNA结合蛋白），用于800个酵母基因，这些基因在真核生物周期内调节核糖核酸（RNA）水平。通过使用α-因子抑制法。在该数据分析中，我们使用从R（R核心团队，2017)包spls（Chun和Keleš，2010). 这个X（X）-基质由收集在542个基因上的106个TF组成；这个Y（Y）-基质包含在18个时间点在相同基因子集上测量的RNA水平。对于数据集，有21个实验验证的TF与细胞周期调节有关（Wang等。，2007). 它们可以作为一个生物真理，应该通过变量选择技术不断地选择。为此，我们集中并缩放了两者X（X）和Y（Y），进行选择性降秩回归（She，2017)并比较了普通交叉验证和SCV的选择性能。（交叉验证和SCV的预测性能在200多次重复训练中非常相似，其中50%用于训练，50%用于测试。）

我们对数据进行了200次引导，以测量这两种方法在秩和变量选择方面的稳定性。估计秩和基数的自举分布如图所示。2SCV中值 $\hat{J型}$ 和 $\hat{第页}$ 分别为86和4以及交叉验证的中位数 $\hat{J型}$ 和 $\hat{第页}$ 分别为46和7。显然，交叉验证选择的最优秩和基数的分布远大于SCV，这表明交叉验证在模型选择方面是不稳定的。尽管交叉验证的中值 $\hat{J型}$ 较小，其较大的方差表明该方法以比SCV更随机的方式挑选和剔除TF。确定自由参数的数量联合通过第页和J型; SCV的自由度中位数为400，交叉验证的自由度为410，这表明SCV倾向于选择较小的模型。此外，交叉验证表明，与SCV相比，计算时间增加了五倍。

图2

新标签中打开下载幻灯片

（a）引导数据的秩和（b）基数分布

为了评估21个实验验证TF的选择性能，图。三（a）显示了选择每个TF的引导数据库复制的百分比。每个点对应一个TF，虚线标记所有相同的选择频率。尤其是，每一个TF位于直线上或直线上方，表明SCV对已确认TF的选择频率均匀大于交叉验证的频率。很明显，交叉验证往往无法选择所有被证实与细胞周期调控相关的TF。例如，BAS1可能是酵母细胞周期（Cokus等。，2006)SCV在近75%的重复中选择了TF，但交叉验证在不到25%的重复中选中了TF。图。三（b）将在引导复制的不同百分比截止时选择的已确认TF的数量制成表格。SCV和交叉验证之间的巨大差距表明，SCV在选择验证TF方面要成功得多任何截止点。例如，大约50%的已确认TF是通过至少50%的重复中的交叉验证选择的，但SCV在相同截止点的成功率接近100%。SCV还确定了一些不属于已确认子集的TF。例如，SCV选择SKO1的次数为194次，而交叉验证选择该TF的次数少于50%；牛等. (2008)实验确定该TF的过度表达与细胞周期进展有关。

图3

新标签中打开下载幻灯片

21个经过实验验证的TF的自举选择频率

6讨论

交叉验证的传统方法包括将数据拆分为K（K）子集和调用学习算法K（K）次。此过程可能代价高昂且不稳定，因为它可能导致K（K）无法直接比较的拟合模型。为了解决这个问题，我们提出了SCV，它在数据重采样中保持相同的模型，并且计算效率高。理论上，我们证明了联合变量和秩选择的最优复杂度是通过PIC非渐近实现的。基于为交叉验证误差建立的恒等式，我们针对常用的K（K）-折叠SCV以匹配最佳错误率。据我们所知，这种经过校准的交叉验证是新颖的。

SCV和PIC的概念适用于纯变量选择或纯秩选择。例如，对于单个响应变量，SCV（4.6）的形式为CV-Err+α（事务-错误/n个)J型日志(电动自行车/J型)对于某些正常数α而在纯脊型问题中，通货膨胀项消失了。结构模式的提取扩展到追求稀疏性的广义套索问题T型β对于薄的T型-矩阵（她，2010; Tibshirani和Taylor，2011). 例如，给定一个估计 $\hat{β}$ 令人满意的T型[j个,]β≠0表示全部 $j个 \in J型$ ⁠，或 $T型 [{J型}^{c（c）},] \hat{β} = 0$ ⁠，我们可以构建一个结构模式 $O（运行） \in {O（运行）}^{第页 \times 第页}$ ⁠，使用 $第页 = 第页 - 第页 (T型 [{J型}^{c（c）},])$ ⁠，它跨越的行空间的正交补码 $T型 [{J型}^{c（c）},]$ ⁠.

该框架追求预测准确性作为其最终原则，并导出了一些没有大的普遍定理n个假设或非相干设计条件（见定理1-4）。如果信噪比不太小，采用预测学习观点也会自动意味着可靠的支持恢复（见定理5）。事实上，当噪声污染相对较小时，我们的模拟表明所提出的方法具有较低的预测误差和令人满意的选择性能。但我们的实验也表明，当信噪比较小时，参考无噪声仿真真实值评估变量选择可能是无效的。这些研究表明，格言“所有模型都是错误的，但有些模型是有用的”（Box，1979)似乎适用于小型SNR场景。

支持信息

其他“支持信息”可在联机本文版本：

“关于稀疏降秩回归的交叉验证”的补充材料。

致谢

作者感谢联合主编、副主编和审稿人提出的建议，这些建议大大改进了论文。这项工作得到了美国国家科学基金会DMS-1352259和CCF-1617801的部分资助。

工具书类

Akaike公司

,

H。

(

1974

)

统计模型识别的新视角

.

IEEE传输。自动。控制

,

19

,

716

–

723

.

安德森

,

总重量。

(

1999

)

一般条件下降秩回归估计的渐近分布

.

安。统计师。

,

27

,

1141

–

1154

.

阿洛牌汽车

,

美国。

和

塞利斯

,

答：。

(

2010

)

模型选择的交叉验证程序综述

.

统计师。Surv公司。

,

4

,

40

–

79

.

比克尔

,

第J页。

,

里托夫

,

年。

和

齐巴科夫

,

答：B。

(

2009

)

Lasso和Dantzig选择器的同时分析

.

安。统计师。

,

37

,

1705

–

1732

.

盒子

,

通用电气设备。

(

1979

)

科学建模策略中的稳健性

.英寸

统计学中的稳健性

，第1卷，pp。

201

–

236

.

纽约

:

学术出版社

.

布内亚

,

F、。

,

她

,

年。

和

韦坎普

,

M。

(

2011

)

高维矩阵降秩估计的最优选择

.

安。统计师。

,

39

,

1282

–

1309

.

布内亚

,

F、。

,

她

,

年。

和

韦坎普

,

M。

(

2012

)

高维矩阵简约估计的联合变量及其选择

.

安。统计师。

,

40

,

2359

–

2388

.

坎迪斯

,

E.J.公司。

(

2008

)

受限等距特性及其对压缩传感的影响

.

Compt.公司。伦德。数学。

,

346

,

589

–

592

.

坎迪斯

,

E.J.公司。

和

计划

,

年。

(

2011

)

从最少数量的随机测量中恢复低秩矩阵的严格预言界

.

IEEE传输。通知。理论

,

57

,

2342

–

2359

.

陈

,

英国。

,

陈

,

K.-S.公司。

和

斯坦塞斯

,

N.Chr.公司。

(

2012

)

稀疏奇异值分解的降秩随机回归

.

J.R.统计。Soc公司。

B、，

74

,

203

–

221

.

陈

,

J。

和

陈

,

Z.公司。

(

2008

)

大模型空间模型选择的扩展贝叶斯信息准则

.

生物特征

,

95

,

759

–

771

.

陈

,

L。

和

黄

,

J·Z。

(

2012

)

同时降维和变量选择的稀疏降秩回归

.

《美国统计杂志》。助理。

,

107

,

1533

–

1545

.

春

,

H。

和

凯莱什

,

美国。

(

2010

)

同时降维和变量选择的稀疏偏最小二乘回归

.

J.R.统计。Soc公司。

B、，

72

,

三

–

25

.

科库斯

,

美国。

,

玫瑰色

,

美国。

,

海诺

,

D。

,

Gr⊘nbech-Jensen公司

,

N。

和

佩莱格里尼

,

M。

(

2006

)

酿酒酵母细胞周期转录因子网络的建模

.

BMC生物信息。

,

7

，编号1，文章

381

.

多诺霍

,

D。

和

约翰斯通

,

一、。

(

1994

)

基于小波收缩的理想空间自适应

.

生物特征

,

81

,

425

–

455

.

风扇

,

J。

和

锂

,

R。

(

2001

)

基于非洞穴惩罚似然的变量选择及其预言性质

.

《美国统计杂志》。助理。

,

96

,

1348

–

1360

.

培养

,

D.P.公司。

和

乔治

,

即。

(

1994

)

多元回归的风险通货膨胀准则

.

安。统计师。

,

22

,

1947

–

1975

.

盖塞尔

,

美国。

(

1975

)

预测样本重用方法及其应用

.

《美国统计杂志》。助理。

,

70

,

320

–

328

.

哈斯蒂

,

T。

,

提比什拉尼

,

R。

和

弗里德曼

,

J。

(

2009

)

统计学习的要素

，第2版。

纽约

:

施普林格

.

约翰斯通

,

国际货币基金组织。

和

卢

,

A.年。

(

2009

)

高维主成分分析的一致性和稀疏性

.

《美国统计杂志》。助理。

,

104

,

682

–

693

.

妈妈

,

Z.公司。

(

2013

)

稀疏主成分分析与迭代阈值

.

安。统计师。

,

41

,

772

–

801

.

锦葵

,

C.L.公司。

(

1973

)

关于的一些评论C类_第页

.

技术计量学

,

15

,

661

–

675

.

牛

,

西。

,

锂

,

Z.公司。

,

詹（音译）

,

西。

,

Iyer公司

,

V.R.公司。

和

马科特

,

电子显微镜。

(

2008

)

酿酒酵母系统定量过表达筛选揭示的细胞周期控制机制

.

PLOS基因。

,

4

，第7号，文章

e1000120号

.

R核心团队

(

2017

)

R：统计计算语言与环境

.

维也纳

:

R统计计算基金会

.

罗德

,

答：。

和

齐巴科夫

,

答：B。

(

2011

)

高维低秩矩阵的估计

.

安。统计师。

,

39

,

887

–

930

.

施瓦兹

,

G.公司。

(

1978

)

估算模型的维数

.

安。统计师。

,

6

,

461

–

464

.

邵

,

J。

(

1993

)

通过交叉验证选择线性模型

.

《美国统计杂志》。助理。

,

88

,

486

–

494

.

邵

,

J。

(

1997

)

线性模型选择的渐近理论

.

统计师。罪。

,

7

,

221

–

242

.

她

,

年。

(

2010

)

精确聚类的稀疏回归

.

电子。J.统计。

,

4

,

1055

–

1096

.

她

,

年。

(

2012

)

用分组预测器拟合非凸惩罚广义线性模型的迭代算法

.

计算统计。数据分析。

,

9

,

2976

–

2990

.

她

,

年。

(

2016

)

关于的有限样本分析Θ-估计员

.

电子。J.统计。

,

10

,

1874

–

1895

.

她

,

年。

(

2017

)

高维选择性因子提取

.

生物特征

,

104

,

97

–

110

.

她

,

年。

,

锂

,

H。

,

王

,

J。

和

吴

,

D。

(

2013

)

基于分组迭代谱阈值的超分辨率稀疏谱选择

.

IEEE传输。Signl流程。

,

61

,

6371

–

6386

.

沈

,

H。

和

黄

,

J。

(

2008

)

基于正则化低秩矩阵逼近的稀疏主成分分析

.

J.Multiv.公司。分析。

,

99

,

1015

–

1034

.

斯皮尔曼

,

体育。

,

夏洛克

,

G.公司。

,

张

,

M.Q.先生。

,

Iyer公司

,

V.R.公司。

,

安德斯

,

英国。

,

艾森

,

医学学士。

,

棕色

,

采购订单。

,

博斯坦

,

D。

和

Futcher公司

,

B。

(

1998

)

基因芯片杂交综合鉴定酿酒酵母细胞周期调控基因

.

摩尔。生物细胞

,

9

,

3273

–

3297

.

股票

,

J.H。

和

沃森

,

M.W.公司。

(

2002

)

使用大量预测因子的主成分进行预测

.

《美国统计杂志》。助理。

,

97

,

1167

–

1179

.

提比什拉尼

,

R。

(

1996

)

通过套索回归收缩和选择

.

J.R.统计。Soc公司。

B、，

58

,

267

–

288

.

提比什拉尼

,

R·J。

和

泰勒

,

J。

(

2011

)

广义套索的解路径

.

安。统计师。

,

39

,

1335

–

1371

.

Vounou公司

,

M。

,

贾努索夫

,

E.公司。

,

沃尔兹

,

R。

,

斯坦因

,

J·L·。

,

汤普森

,

下午。

,

吕克特

,

D。

和

蒙大拿

,

G.公司。

(

2012

)

稀疏缩减秩回归检测阿尔茨海默病中与体素纵向表型的遗传关联

.

神经影像

,

60

,

700

–

716

.

瓦赫巴

,

G.公司。

(

1990

)

观测数据的样条模型

.

费城

:

工业和应用数学学会

.

王

,

L。

,

陈

,

G.公司。

和

锂

,

H。

(

2007

)

微阵列时间进程基因表达数据的组SCAD回归分析

.

生物信息学

,

23

,

1486

–

1494

.

威滕

,

D。

,

提比什拉尼

,

R。

和

哈斯蒂

,

T。

(

2009

)

惩罚矩阵分解及其在稀疏主成分和典型相关分析中的应用

.

J.Multiv.公司。分析。

,

10

,

515

–

534

.

杨

,

年。

(

2005

)

能否分享AIC和BIC的优势模型辨识与回归估计的冲突

.

生物特征

,

92

,

937

–

950

.

张

,

中心-中心。

和

黄

,

J。

(

2008

)

高维线性回归中拉索选择的稀疏性和偏差

.

安。统计师。

,

36

,

1567

–

1594

.

邹

,

H。

,

哈斯蒂

,

T。

和

提比什拉尼

,

R。

(

2006

)

稀疏主成分分析

.

J.计算图表。统计人员。

,

15

,

265

–

286

.