Measuring Agreement of Multivariate Discrete Survival Times Using a Modified Weighted Kappa Coefficient

基于500次模拟运行的Clayton模型模拟的具有成组生存时间的修正加权kappa估计量的模拟结果，与基于完全观测的样本kappa估计器的比较

κ^w个_克	样本大小	审查%	提议的kappa估计器			样本估计值只有完整的obs
κ^w个_克	样本大小	审查%	平均值（SD）	Bootstrap SE平均值（SD）	覆盖率问题。	样本估计平均值（SD）	Bootstrap SE平均值（SD）	覆盖率问题。
0.472	50	10	0.516 (0.114)	0.109 (0.021)	92.1	0.512 (0.123)	0.114 (0.021)	87.3
		30	0.492 (0.125)	0.131 (0.058)	93	0.391 (0.182)	0.144 (0.024)	83.4
		50	0.420 (0.139)	0.134 (0.025)	91.1	0.315 (0.234)	0.166 (0.031)	72.8
	100	10	0.509 (0.082)	0.079 (0.011)	90.2	0.499 (0.088)	0.086 (0.013)	89.3
		30	0.497 (0.089)	0.085 (0.012)	94.9	0.373 (0.136)	0.115 (0.015)	83.6
		50	0.443 (0.104)	0.101 (0.014)	92.2	0.261 (0.162)	0.135 (0.020)	65.2
	200	10	0.483 (0.058)	0.057 (0.006)	93.8	0.469 (0.061)	0.062 (0.007)	93.6
		30	0.477 (0.064)	0.063 (0.007)	96.1	0.340 (0.091)	0.089 (0.009)	71.3
		50	0.451 (0.081)	0.077 (0.009)	92.6	0.206 (0.115)	0.104 (0.014)	35.5
0.651	50	10	0.677 (0.084)	0.082 (0.020)	91.4	0.673 (0.093)	0.089 (0.024)	86.5
		30	0.646 (0.096)	0.108 (0.066)	95.9	0.539 (0.161)	0.132 (0.028)	83.8
		50	0.554 (0.126)	0.124 (0.028)	89.9	0.414 (0.218)	0.162 (0.033)	68.9
	100	10	0.675 (0.059)	0.058 (0.010)	91.8	0.665 (0.065)	0.064 (0.012)	90.6
		30	0.656 (0.068)	0.065 (0.011)	94.3	0.526 (0.110)	0.103 (0.017)	83.8
		50	0.600 (0.085)	0.088 (0.016)	91	0.370 (0.151)	0.136 (0.020)	52.5
	200	10	0.656 (0.042)	0.043 (0.005)	95.3	0.642 (0.046)	0.047 (0.006)	94.5
		30	0.647 (0.048)	0.048 (0.006)	95.3	0.497 (0.077)	0.078 (0.010)	50
		50	0.612 (0.065)	0.065 (0.010)	89.8	0.329 (0.111)	0.107 (0.012)	15
0.804	50	10	0.812 (0.054)	0.056 (0.016)	94.5	0.813 (0.060)	0.059 (0.021)	90
		30	0.779 (0.066)	0.082 (0.055)	92.8	0.704 (0.120)	0.106 (0.032)	90
		50	0.680 (0.109)	0.107 (0.028)	85.8	0.566 (0.185)	0.156 (0.038)	73.6
	100	10	0.812 (0.039)	0.038 (0.008)	93.2	0.806 (0.043)	0.042 (0.010)	94.5
		30	0.793 (0.044)	0.046 (0.009)	93.4	0.692 (0.081)	0.079 (0.018)	81.8
		50	0.727 (0.070)	0.075 (0.018)	86	0.536 (0.126)	0.126 (0.026)	45.7
	200	10	0.805 (0.027)	0.027 (0.004)	95.3	0.795 (0.030)	0.031 (0.005)	95.7
		30	0.793 (0.031)	0.033 (0.001)	92.8	0.677 (0.056)	0.059 (0.010)	40.4
		50	0.752 (0.051)	0.051 (0.010)	81.6	0.516 (0.092)	0.095 (0.015)	12

κ^w个_克	样本大小	审查%	拟定kappa估计器			的样本估计器仅包含完整的obs
κ^w个_克	样本大小	审查%	平均值（SD）	Bootstrap SE平均值（SD）	覆盖率问题。	样本估计均值（SD）	Bootstrap SE平均值（SD）	覆盖率问题。
0.472	50	10	0.516 (0.114)	0.109 (0.021)	92.1	0.512 (0.123)	0.114 (0.021)	87.3
		30	0.492 (0.125)	0.131 (0.058)	93	0.391 (0.182)	0.144 (0.024)	83.4
		50	0.420 (0.139)	0.134 (0.025)	91.1	0.315 (0.234)	0.166 (0.031)	72.8
	100	10	0.509 (0.082)	0.079 (0.011)	90.2	0.499 (0.088)	0.086 (0.013)	89.3
		30	0.497 (0.089)	0.085 (0.012)	94.9	0.373 (0.136)	0.115 (0.015)	83.6
		50	0.443 (0.104)	0.101 (0.014)	92.2	0.261 (0.162)	0.135 (0.020)	65.2
	200	10	0.483 (0.058)	0.057 (0.006)	93.8	0.469 (0.061)	0.062 (0.007)	93.6
		30	0.477 (0.064)	0.063 (0.007)	96.1	0.340 (0.091)	0.089 (0.009)	71.3
		50	0.451 (0.081)	0.077 (0.009)	92.6	0.206 (0.115)	0.104 (0.014)	35.5
0.651	50	10	0.677 (0.084)	0.082 (0.020)	91.4	0.673 (0.093)	0.089 (0.024)	86.5
		30	0.646 (0.096)	0.108 (0.066)	95.9	0.539 (0.161)	0.132 (0.028)	83.8
		50	0.554 (0.126)	0.124 (0.028)	89.9	0.414 (0.218)	0.162 (0.033)	68.9
	100	10	0.675 (0.059)	0.058 (0.010)	91.8	0.665 (0.065)	0.064 (0.012)	90.6
		30	0.656 (0.068)	0.065 (0.011)	94.3	0.526 (0.110)	0.103 (0.017)	83.8
		50	0.600 (0.085)	0.088 (0.016)	91	0.370 (0.151)	0.136 (0.020)	52.5
	200	10	0.656 (0.042)	0.043 (0.005)	95.3	0.642 (0.046)	0.047 (0.006)	94.5
		30	0.647 (0.048)	0.048 (0.006)	95.3	0.497 (0.077)	0.078 (0.010)	50
		50	0.612 (0.065)	0.065 (0.010)	89.8	0.329 (0.111)	0.107 (0.012)	15
0.804	50	10	0.812 (0.054)	0.056 (0.016)	94.5	0.813 (0.060)	0.059 (0.021)	90
		30	0.779 (0.066)	0.082 (0.055)	92.8	0.704 (0.120)	0.106 (0.032)	90
		50	0.680 (0.109)	0.107 (0.028)	85.8	0.566 (0.185)	0.156 (0.038)	73.6
	100	10	0.812 (0.039)	0.038 (0.008)	93.2	0.806 (0.043)	0.042 (0.010)	94.5
		30	0.793 (0.044)	0.046 (0.009)	93.4	0.692 (0.081)	0.079 (0.018)	81.8
		50	0.727 (0.070)	0.075 (0.018)	86	0.536 (0.126)	0.126 (0.026)	45.7
	200	10	0.805 (0.027)	0.027 (0.004)	95.3	0.795 (0.030)	0.031 (0.005)	95.7
		30	0.793 (0.031)	0.033 (0.001)	92.8	0.677 (0.056)	0.059 (0.010)	40.4
		50	0.752 (0.051)	0.051 (0.010)	81.6	0.516 (0.092)	0.095 (0.015)	12

表1

基于500次模拟运行的Clayton模型模拟的具有成组生存时间的修正加权kappa估计量的模拟结果，与基于完全观测的样本kappa估计器的比较

κ^w个_克	样本大小	审查%	拟定kappa估计器			的样本估计器仅包含完整的obs
κ^w个_克	样本大小	审查%	平均值（SD）	Bootstrap SE平均值（SD）	覆盖率问题。	样本估计均值（SD）	Bootstrap SE平均值（SD）	覆盖率问题。
0.472	50	10	0.516 (0.114)	0.109 (0.021)	92.1	0.512 (0.123)	0.114 (0.021)	87.3
		30	0.492 (0.125)	0.131 (0.058)	93	0.391 (0.182)	0.144 (0.024)	83.4
		50	0.420 (0.139)	0.134 (0.025)	91.1	0.315 (0.234)	0.166 (0.031)	72.8
	100	10	0.509 (0.082)	0.079 (0.011)	90.2	0.499 (0.088)	0.086 (0.013)	89.3
		30	0.497 (0.089)	0.085 (0.012)	94.9	0.373 (0.136)	0.115 (0.015)	83.6
		50	0.443 (0.104)	0.101 (0.014)	92.2	0.261 (0.162)	0.135 (0.020)	65.2
	200	10	0.483 (0.058)	0.057 (0.006)	93.8	0.469 (0.061)	0.062 (0.007)	93.6
		30	0.477 (0.064)	0.063 (0.007)	96.1	0.340 (0.091)	0.089 (0.009)	71.3
		50	0.451 (0.081)	0.077 (0.009)	92.6	0.206 (0.115)	0.104 (0.014)	35.5
0.651	50	10	0.677 (0.084)	0.082 (0.020)	91.4	0.673 (0.093)	0.089 (0.024)	86.5
		30	0.646 (0.096)	0.108 (0.066)	95.9	0.539 (0.161)	0.132 (0.028)	83.8
		50	0.554 (0.126)	0.124 (0.028)	89.9	0.414 (0.218)	0.162 (0.033)	68.9
	100	10	0.675 (0.059)	0.058 (0.010)	91.8	0.665 (0.065)	0.064 (0.012)	90.6
		30	0.656 (0.068)	0.065 (0.011)	94.3	0.526 (0.110)	0.103 (0.017)	83.8
		50	0.600 (0.085)	0.088 (0.016)	91	0.370 (0.151)	0.136 (0.020)	52.5
	200	10	0.656 (0.042)	0.043 (0.005)	95.3	0.642 (0.046)	0.047 (0.006)	94.5
		30	0.647 (0.048)	0.048 (0.006)	95.3	0.497 (0.077)	0.078 (0.010)	50
		50	0.612 (0.065)	0.065 (0.010)	89.8	0.329 (0.111)	0.107 (0.012)	15
0.804	50	10	0.812 (0.054)	0.056 (0.016)	94.5	0.813 (0.060)	0.059 (0.021)	90
		30	0.779 (0.066)	0.082 (0.055)	92.8	0.704 (0.120)	0.106 (0.032)	90
		50	0.680 (0.109)	0.107 (0.028)	85.8	0.566 (0.185)	0.156 (0.038)	73.6
	100	10	0.812 (0.039)	0.038 (0.008)	93.2	0.806 (0.043)	0.042 (0.010)	94.5
		30	0.793 (0.044)	0.046 (0.009)	93.4	0.692 (0.081)	0.079 (0.018)	81.8
		50	0.727 (0.070)	0.075 (0.018)	86	0.536 (0.126)	0.126 (0.026)	45.7
	200	10	0.805 (0.027)	0.027 (0.004)	95.3	0.795 (0.030)	0.031 (0.005)	95.7
		30	0.793 (0.031)	0.033 (0.001)	92.8	0.677 (0.056)	0.059 (0.010)	40.4
		50	0.752 (0.051)	0.051 (0.010)	81.6	0.516 (0.092)	0.095 (0.015)	12

κ^w个_克	样本大小	审查%	拟定kappa估计器			样本估计值只有完整的obs
κ^w个_克	样本大小	审查%	平均值（SD）	引导SE平均值（SD）	覆盖率问题。	样本估计平均值（SD）	引导SE平均值（SD）	覆盖率问题。
0.472	50	10	0.516 (0.114)	0.109 (0.021)	92.1	0.512 (0.123)	0.114 (0.021)	87.3
		30	0.492 (0.125)	0.131 (0.058)	93	0.391 (0.182)	0.144 (0.024)	83.4
		50	0.420 (0.139)	0.134 (0.025)	91.1	0.315 (0.234)	0.166 (0.031)	72.8
	100	10	0.509 (0.082)	0.079 (0.011)	90.2	0.499 (0.088)	0.086 (0.013)	89.3
		30	0.497 (0.089)	0.085 (0.012)	94.9	0.373 (0.136)	0.115 (0.015)	83.6
		50	0.443 (0.104)	0.101 (0.014)	92.2	0.261 (0.162)	0.135 (0.020)	65.2
	200	10	0.483 (0.058)	0.057 (0.006)	93.8	0.469 (0.061)	0.062 (0.007)	93.6
		30	0.477 (0.064)	0.063 (0.007)	96.1	0.340 (0.091)	0.089 (0.009)	71.3
		50	0.451 (0.081)	0.077 (0.009)	92.6	0.206 (0.115)	0.104 (0.014)	35.5
0.651	50	10	0.677 (0.084)	0.082 (0.020)	91.4	0.673 (0.093)	0.089 (0.024)	86.5
		30	0.646 (0.096)	0.108 (0.066)	95.9	0.539 (0.161)	0.132 (0.028)	83.8
		50	0.554 (0.126)	0.124 (0.028)	89.9	0.414 (0.218)	0.162 (0.033)	68.9
	100	10	0.675 (0.059)	0.058 (0.010)	91.8	0.665 (0.065)	0.064 (0.012)	90.6
		30	0.656 (0.068)	0.065 (0.011)	94.3	0.526 (0.110)	0.103 (0.017)	83.8
		50	0.600 (0.085)	0.088 (0.016)	91	0.370 (0.151)	0.136 (0.020)	52.5
	200	10	0.656 (0.042)	0.043 (0.005)	95.3	0.642 (0.046)	0.047 (0.006)	94.5
		30	0.647 (0.048)	0.048 (0.006)	95.3	0.497 (0.077)	0.078 (0.010)	50
		50	0.612 (0.065)	0.065 (0.010)	89.8	0.329 (0.111)	0.107 (0.012)	15
0.804	50	10	0.812 (0.054)	0.056 (0.016)	94.5	0.813 (0.060)	0.059 (0.021)	90
		30	0.779 (0.066)	0.082 (0.055)	92.8	0.704 (0.120)	0.106 (0.032)	90
		50	0.680 (0.109)	0.107 (0.028)	85.8	0.566 (0.185)	0.156 (0.038)	73.6
	100	10	0.812 (0.039)	0.038 (0.008)	93.2	0.806 (0.043)	0.042 (0.010)	94.5
		30	0.793 (0.044)	0.046 (0.009)	93.4	0.692 (0.081)	0.079 (0.018)	81.8
		50	0.727 (0.070)	0.075 (0.018)	86	0.536 (0.126)	0.126 (0.026)	45.7
	200	10	0.805 (0.027)	0.027 (0.004)	95.3	0.795 (0.030)	0.031 (0.005)	95.7
		30	0.793 (0.031)	0.033 (0.001)	92.8	0.677 (0.056)	0.059 (0.010)	40.4
		50	0.752 (0.051)	0.051 (0.010)	81.6	0.516 (0.092)	0.095 (0.015)	12

表2

基于500次模拟运行的离散克莱顿模型模拟的具有离散生存时间的修正加权kappa估计的模拟结果，与基于完全观测的样本kappa估计器的比较

κ^w个_克	样本大小	审查%	拟定kappa估计器			样本估计值只有完整的obs
κ^w个_克	样本大小	审查%	平均值（SD）	引导SE平均值（SD）	覆盖率问题。	样本估计平均值（SD）	引导SE平均值（SD）	覆盖率问题。
0.472	50	10	0.455 (0.120)	0.112 (0.016)	91.6	0.461 (0.120)	0.115 (0.017)	92
		30	0.436 (0.129)	0.116 (0.016)	88.7	0.356 (0.165)	0.137 (0.022)	81.6
		50	0.373 (0.200)	0.127 (0.020)	80.3	0.309 (0.248)	0.154 (0.031)	69.5
	100	10	0.462 (0.085)	0.082 (0.011)	93.9	0.459 (0.090)	0.086 (0.011)	93
		30	0.457 (0.092)	0.086 (0.011)	91.2	0.373 (0.121)	0.109 (0.012)	83.4
		50	0.427 (0.112)	0.103 (0.014)	90.8	0.329 (0.166)	0.133 (0.022)	76.8
	200	10	0.472 (0.060)	0.058 (0.006)	94	0.461 (0.062)	0.061 (0.006)	94.3
		30	0.460 (0.063)	0.062 (0.007)	93.6	0.370 (0.087)	0.082 (0.009)	78.5
		50	0.456 (0.081)	0.077 (0.009)	93.8	0.336 (0.119)	0.106 (0.013)	76.6
0.651	50	10	0.640 (0.092)	0.089 (0.018)	92	0.628 (0.095)	0.095 (0.021)	91.8
		30	0.609 (0.100)	0.100 (0.019)	95.1	0.518 (0.149)	0.130 (0.025)	82.6
		50	0.535 (0.137)	0.123 (0.022)	83.6	0.466 (0.212)	0.154 (0.034)	77.5
	100	10	0.646 (0.062)	0.062 (0.010)	93.9	0.631 (0.067)	0.068 (0.012)	96.1
		30	0.634 (0.067)	0.068 (0.011)	95.9	0.536 (0.099)	0.097 (0.017)	85
		50	0.600 (0.092)	0.088 (0.015)	91.2	0.505 (0.139)	0.128 (0.024)	81.3
	200	10	0.650 (0.044)	0.044 (0.006)	95.1	0.635 (0.046)	0.047 (0.006)	94.7
		30	0.640 (0.047)	0.048 (0.006)	94.9	0.543 (0.070)	0.070 (0.010)	71.9
		50	0.630 (0.064)	0.062 (0.009)	93.8	0.513 (0.099)	0.097 (0.015)	75.8
0.804	50	10	0.790 (0.059)	0.060 (0.016)	93.6	0.784 (0.066)	0.064 (0.020)	94.9
		30	0.765 (0.066)	0.072 (0.017)	95.1	0.704 (0.112)	0.101 (0.030)	90
		50	0.688 (0.130)	0.109 (0.025)	86.7	0.663 (0.159)	0.137 (0.042)	86.7
	100	10	0.799 (0.039)	0.041 (0.008)	95.7	0.795 (0.041)	0.044 (0.010)	95.5
		30	0.780 (0.044)	0.048 (0.009)	95.7	0.720 (0.069)	0.070 (0.017)	87.3
		50	0.746 (0.065)	0.070 (0.014)	91.6	0.683 (0.105)	0.102 (0.029)	86.5
	200	10	0.802 (0.027)	0.028 (0.004)	96.1	0.794 (0.031)	0.030 (0.005)	93.6
		30	0.792 (0.031)	0.032 (0.005)	95.9	0.721 (0.050)	0.049 (0.008)	68.8
		50	0.767 (0.046)	0.047 (0.007)	92.6	0.698 (0.070)	0.070 (0.017)	76.2

κ^w个_克	样本大小	审查%	拟定kappa估计器			的样本估计器仅包含完整的obs
κ^w个_克	样本大小	审查%	平均值（SD）	Bootstrap SE平均值（SD）	覆盖率问题。	样本估计均值（SD）	Bootstrap SE平均值（SD）	覆盖率问题。
0.472	50	10	0.455 (0.120)	0.112 (0.016)	91.6	0.461 (0.120)	0.115 (0.017)	92
		30	0.436 (0.129)	0.116 (0.016)	88.7	0.356 (0.165)	0.137 (0.022)	81.6
		50	0.373 (0.200)	0.127 (0.020)	80.3	0.309 (0.248)	0.154 (0.031)	69.5
	100	10	0.462 (0.085)	0.082 (0.011)	93.9	0.459 (0.090)	0.086 (0.011)	93
		30	0.457 (0.092)	0.086 (0.011)	91.2	0.373 (0.121)	0.109 (0.012)	83.4
		50	0.427 (0.112)	0.103 (0.014)	90.8	0.329 (0.166)	0.133 (0.022)	76.8
	200	10	0.472 (0.060)	0.058 (0.006)	94	0.461 (0.062)	0.061 (0.006)	94.3
		30	0.460 (0.063)	0.062 (0.007)	93.6	0.370 (0.087)	0.082 (0.009)	78.5
		50	0.456 (0.081)	0.077 (0.009)	93.8	0.336 (0.119)	0.106 (0.013)	76.6
0.651	50	10	0.640 (0.092)	0.089 (0.018)	92	0.628 (0.095)	0.095 (0.021)	91.8
		30	0.609 (0.100)	0.100 (0.019)	95.1	0.518 (0.149)	0.130 (0.025)	82.6
		50	0.535 (0.137)	0.123 (0.022)	83.6	0.466 (0.212)	0.154 (0.034)	77.5
	100	10	0.646 (0.062)	0.062 (0.010)	93.9	0.631 (0.067)	0.068 (0.012)	96.1
		30	0.634 (0.067)	0.068 (0.011)	95.9	0.536 (0.099)	0.097 (0.017)	85
		50	0.600 (0.092)	0.088 (0.015)	91.2	0.505 (0.139)	0.128 (0.024)	81.3
	200	10	0.650 (0.044)	0.044 (0.006)	95.1	0.635 (0.046)	0.047 (0.006)	94.7
		30	0.640 (0.047)	0.048 (0.006)	94.9	0.543 (0.070)	0.070 (0.010)	71.9
		50	0.630 (0.064)	0.062 (0.009)	93.8	0.513 (0.099)	0.097 (0.015)	75.8
0.804	50	10	0.790 (0.059)	0.060 (0.016)	93.6	0.784 (0.066)	0.064 (0.020)	94.9
		30	0.765 (0.066)	0.072 (0.017)	95.1	0.704 (0.112)	0.101 (0.030)	90
		50	0.688 (0.130)	0.109 (0.025)	86.7	0.663 (0.159)	0.137 (0.042)	86.7
	100	10	0.799 (0.039)	0.041 (0.008)	95.7	0.795 (0.041)	0.044 (0.010)	95.5
		30	0.780 (0.044)	0.048 (0.009)	95.7	0.720 (0.069)	0.070 (0.017)	87.3
		50	0.746 (0.065)	0.070 (0.014)	91.6	0.683 (0.105)	0.102 (0.029)	86.5
	200	10	0.802 (0.027)	0.028 (0.004)	96.1	0.794 (0.031)	0.030 (0.005)	93.6
		30	0.792 (0.031)	0.032 (0.005)	95.9	0.721 (0.050)	0.049 (0.008)	68.8
		50	0.767 (0.046)	0.047 (0.007)	92.6	0.698 (0.070)	0.070 (0.017)	76.2

表2

基于500次模拟运行的离散克莱顿模型模拟的具有离散生存时间的修正加权kappa估计的模拟结果，与基于完全观测的样本kappa估计器的比较

κ^w个_克	样本大小	审查%	拟定kappa估计器			的样本估计器仅包含完整的obs
κ^w个_克	样本大小	审查%	平均值（SD）	引导SE平均值（SD）	覆盖率问题。	样本估计平均值（SD）	Bootstrap SE平均值（SD）	覆盖率问题。
0.472	50	10	0.455 (0.120)	0.112 (0.016)	91.6	0.461 (0.120)	0.115 (0.017)	92
		30	0.436 (0.129)	0.116 (0.016)	88.7	0.356 (0.165)	0.137 (0.022)	81.6
		50	0.373 (0.200)	0.127 (0.020)	80.3	0.309 (0.248)	0.154 (0.031)	69.5
	100	10	0.462 (0.085)	0.082 (0.011)	93.9	0.459 (0.090)	0.086 (0.011)	93
		30	0.457 (0.092)	0.086 (0.011)	91.2	0.373 (0.121)	0.109 (0.012)	83.4
		50	0.427 (0.112)	0.103 (0.014)	90.8	0.329 (0.166)	0.133 (0.022)	76.8
	200	10	0.472 (0.060)	0.058 (0.006)	94	0.461 (0.062)	0.061 (0.006)	94.3
		30	0.460 (0.063)	0.062 (0.007)	93.6	0.370 (0.087)	0.082 (0.009)	78.5
		50	0.456 (0.081)	0.077 (0.009)	93.8	0.336 (0.119)	0.106 (0.013)	76.6
0.651	50	10	0.640 (0.092)	0.089 (0.018)	92	0.628 (0.095)	0.095 (0.021)	91.8
		30	0.609 (0.100)	0.100 (0.019)	95.1	0.518 (0.149)	0.130 (0.025)	82.6
		50	0.535 (0.137)	0.123 (0.022)	83.6	0.466 (0.212)	0.154 (0.034)	77.5
	100	10	0.646 (0.062)	0.062 (0.010)	93.9	0.631 (0.067)	0.068 (0.012)	96.1
		30	0.634 (0.067)	0.068 (0.011)	95.9	0.536 (0.099)	0.097 (0.017)	85
		50	0.600 (0.092)	0.088 (0.015)	91.2	0.505 (0.139)	0.128 (0.024)	81.3
	200	10	0.650 (0.044)	0.044 (0.006)	95.1	0.635 (0.046)	0.047 (0.006)	94.7
		30	0.640 (0.047)	0.048 (0.006)	94.9	0.543 (0.070)	0.070 (0.010)	71.9
		50	0.630 (0.064)	0.062 (0.009)	93.8	0.513 (0.099)	0.097 (0.015)	75.8
0.804	50	10	0.790 (0.059)	0.060 (0.016)	93.6	0.784 (0.066)	0.064 (0.020)	94.9
		30	0.765 (0.066)	0.072 (0.017)	95.1	0.704 (0.112)	0.101 (0.030)	90
		50	0.688 (0.130)	0.109 (0.025)	86.7	0.663 (0.159)	0.137 (0.042)	86.7
	100	10	0.799 (0.039)	0.041 (0.008)	95.7	0.795 (0.041)	0.044 (0.010)	95.5
		30	0.780 (0.044)	0.048 (0.009)	95.7	0.720 (0.069)	0.070 (0.017)	87.3
		50	0.746 (0.065)	0.070 (0.014)	91.6	0.683 (0.105)	0.102 (0.029)	86.5
	200	10	0.802 (0.027)	0.028 (0.004)	96.1	0.794 (0.031)	0.030 (0.005)	93.6
		30	0.792 (0.031)	0.032 (0.005)	95.9	0.721 (0.050)	0.049 (0.008)	68.8
		50	0.767 (0.046)	0.047 (0.007)	92.6	0.698 (0.070)	0.070 (0.017)	76.2

κ^w个_克	样本大小	审查%	提议的kappa估计器			样本估计值仅包含完整的obs
κ^w个_克	样本大小	审查%	平均值（SD）	Bootstrap SE平均值（SD）	覆盖率问题。	样本估计平均值（SD）	Bootstrap SE平均值（SD）	覆盖率问题。
0.472	50	10	0.455 (0.120)	0.112 (0.016)	91.6	0.461 (0.120)	0.115 (0.017)	92
		30	0.436 (0.129)	0.116 (0.016)	88.7	0.356 (0.165)	0.137 (0.022)	81.6
		50	0.373 (0.200)	0.127 (0.020)	80.3	0.309 (0.248)	0.154 (0.031)	69.5
	100	10	0.462 (0.085)	0.082 (0.011)	93.9	0.459 (0.090)	0.086 (0.011)	93
		30	0.457 (0.092)	0.086 (0.011)	91.2	0.373 (0.121)	0.109 (0.012)	83.4
		50	0.427 (0.112)	0.103 (0.014)	90.8	0.329 (0.166)	0.133 (0.022)	76.8
	200	10	0.472 (0.060)	0.058 (0.006)	94	0.461 (0.062)	0.061 (0.006)	94.3
		30	0.460 (0.063)	0.062 (0.007)	93.6	0.370 (0.087)	0.082 (0.009)	78.5
		50	0.456 (0.081)	0.077 (0.009)	93.8	0.336 (0.119)	0.106 (0.013)	76.6
0.651	50	10	0.640 (0.092)	0.089 (0.018)	92	0.628 (0.095)	0.095 (0.021)	91.8
		30	0.609 (0.100)	0.100 (0.019)	95.1	0.518 (0.149)	0.130 (0.025)	82.6
		50	0.535 (0.137)	0.123 (0.022)	83.6	0.466 (0.212)	0.154 (0.034)	77.5
	100	10	0.646 (0.062)	0.062 (0.010)	93.9	0.631 (0.067)	0.068 (0.012)	96.1
		30	0.634 (0.067)	0.068 (0.011)	95.9	0.536 (0.099)	0.097 (0.017)	85
		50	0.600 (0.092)	0.088 (0.015)	91.2	0.505 (0.139)	0.128 (0.024)	81.3
	200	10	0.650 (0.044)	0.044 (0.006)	95.1	0.635 (0.046)	0.047 (0.006)	94.7
		30	0.640 (0.047)	0.048 (0.006)	94.9	0.543 (0.070)	0.070 (0.010)	71.9
		50	0.630 (0.064)	0.062 (0.009)	93.8	0.513 (0.099)	0.097 (0.015)	75.8
0.804	50	10	0.790 (0.059)	0.060 (0.016)	93.6	0.784 (0.066)	0.064 (0.020)	94.9
		30	0.765 (0.066)	0.072 (0.017)	95.1	0.704 (0.112)	0.101 (0.030)	90
		50	0.688 (0.130)	0.109 (0.025)	86.7	0.663 (0.159)	0.137 (0.042)	86.7
	100	10	0.799 (0.039)	0.041 (0.008)	95.7	0.795 (0.041)	0.044 (0.010)	95.5
		30	0.780 (0.044)	0.048 (0.009)	95.7	0.720 (0.069)	0.070 (0.017)	87.3
		50	0.746 (0.065)	0.070 (0.014)	91.6	0.683 (0.105)	0.102 (0.029)	86.5
	200	10	0.802 (0.027)	0.028 (0.004)	96.1	0.794 (0.031)	0.030 (0.005)	93.6
		30	0.792 (0.031)	0.032 (0.005)	95.9	0.721 (0.050)	0.049 (0.008)	68.8
		50	0.767 (0.046)	0.047 (0.007)	92.6	0.698 (0.070)	0.070 (0.017)	76.2

来自的模拟结果之间的比较表1和2结果表明，对于真正离散的生存时间，所提出的kappa估计器的性能通常优于分组时间。对于分组时间，kappa估计在小样本量下表现出复杂的模式；例如，对于低截尾，估计器似乎有向上的偏差，但对于重截尾，估计器似乎有向下的偏差。解释是，在基于分组生存时间估计kappa系数时，有两个偏差来源。偏差的第一个来源是审查。对于中等到重度审查，该方法低估了kappa。分组时间和真正离散的时间都存在审查导致的偏差。第二个偏差来源仅存在于分组时间，这是由于根据连续生存模型生成的分组数据估计离散的双变量分布。为了证明分组导致的偏差，我们在没有审查的情况下生成了分组时间和真正离散的生存时间，并评估了估计的离散双变量分布和kappa估计中的偏差。中的结果表3结果表明，对于真正离散的时间，偏差可以忽略不计，但对于小到中等样本量的成组生存时间，偏差是显著的。更具体地说，我们发现，对于分组时间，估计的离散分布往往在对角线上被高估，即(T型₁,T型₂) 秒.t吨.T型₁=T型₂，并且在非对角线上有负偏差（从其他双变量生存函数（如Gumbel模型）分组连续时间时也观察到类似的趋势）。因此，在没有审查的情况下，分组数据的估计kappa是正偏差的。基于分组数据的离散分布估计导致的额外变异源导致基于分组生存时间的kappa估计准确性降低。此外，这两个偏差源具有相反的方向，导致kappa估计量中的复杂模式，且分组时间在小样本中。在存在光审查（10%）的情况下，由于分组而产生的正偏差占主导地位，因此kappa估计值向上偏移。当审查比例增加时，由于审查而产生的负偏差变得更加突出，因此kappa估计显示出向下偏差。然而，审查和分组偏差都随着样本量的增加而减小。我们的模拟研究使用了更多样本大小的场景（Web表1)结果表明，对于较大样本量的成组生存时间，该估计器表现出了良好的性能。

表3

两种不同机制产生的离散生存时间的比较

κ^w个_克	样本大小	分组生存时间^一		真正离散的生存时间^b
κ^w个_克	样本大小		估计的离散联合分布中的偏差（%）^*		估计的离散联合分布中的偏差（%）^*
0.472	50	0.518	19.4	0.469	3.8
	100	0.507	13.5	0.470	2.7
	200	0.483	4.8	0.471	1.4
	1000	0.475	2.6	0.473	0.4
0.651	50	0.686	17.8	0.651	4.2
	100	0.678	12	0.650	2.5
	200	0.659	5.6	0.651	2
	1000	0.654	2.7	0.651	0.9
0.804	50	0.825	26.8	0.801	6.3
	100	0.818	14.7	0.802	7.7
	200	0.808	9.5	0.804	3.9
	1000	0.806	8.1	0.804	2.3

κ^w个_克	样本大小	分组生存时间^一		真正离散的生存时间^b
κ^w个_克	样本大小		估计的离散联合分布中的偏差（%）^*		估计的离散联合分布中的偏差（%）^*
0.472	50	0.518	19.4	0.469	3.8
	100	0.507	13.5	0.470	2.7
	200	0.483	4.8	0.471	1.4
	1000	0.475	2.6	0.473	0.4
0.651	50	0.686	17.8	0.651	4.2
	100	0.678	12	0.650	2.5
	200	0.659	5.6	0.651	2
	1000	0.654	2.7	0.651	0.9
0.804	50	0.825	26.8	0.801	6.3
	100	0.818	14.7	0.802	7.7
	200	0.808	9.5	0.804	3.9
	1000	0.806	8.1	0.804	2.3

^一连续克莱顿模型生成的连续生存时间分组(克莱顿，1978年).

^b离散克莱顿模型生成的离散生存时间(Shih，1998年).

*偏差（%）定义为⁠.

表3

两种不同机制产生的离散生存时间的比较

κ^w个_克	样本大小	分组生存时间^一		真正离散的生存时间^b
κ^w个_克	样本大小		估计的离散联合分布中的偏差（%）^*		估计的离散联合分布中的偏差（%）^*
0.472	50	0.518	19.4	0.469	3.8
	100	0.507	13.5	0.470	2.7
	200	0.483	4.8	0.471	1.4
	1000	0.475	2.6	0.473	0.4
0.651	50	0.686	17.8	0.651	4.2
	100	0.678	12	0.650	2.5
	200	0.659	5.6	0.651	2
	1000	0.654	2.7	0.651	0.9
0.804	50	0.825	26.8	0.801	6.3
	100	0.818	14.7	0.802	7.7
	200	0.808	9.5	0.804	3.9
	1000	0.806	8.1	0.804	2.3

κ^w个_克	样本大小	分组生存时间^一		真正离散的生存时间^b
κ^w个_克	样本大小		估计的离散联合分布中的偏差（%）^*		估计的离散联合分布中的偏差（%）^*
0.472	50	0.518	19.4	0.469	3.8
	100	0.507	13.5	0.470	2.7
	200	0.483	4.8	0.471	1.4
	1000	0.475	2.6	0.473	0.4
0.651	50	0.686	17.8	0.651	4.2
	100	0.678	12	0.650	2.5
	200	0.659	5.6	0.651	2
	1000	0.654	2.7	0.651	0.9
0.804	50	0.825	26.8	0.801	6.3
	100	0.818	14.7	0.802	7.7
	200	0.808	9.5	0.804	3.9
	1000	0.806	8.1	0.804	2.3

^一连续克莱顿模型生成的连续生存时间分组(克莱顿，1978年).

^b离散克莱顿模型生成的离散生存时间(Shih，1998年).

*偏差（%）定义为⁠.

3.2多变量生存时间

在本节中，我们通过对连续时间分组获得的离散三变量生存时间的模拟研究，评估了广义修正加权κ系数的性能。连续三变量生存时间是由具有单位指数边缘的连续多变量Clayton模型生成的，

(11)

然后通过将连续时间分组为间隔来创建离散生存时间。使用与双变量模拟中相同的θ参数考虑了三组模拟。我们认为样本大小为100、200和350。表4提供了三变量模拟研究的统计信息摘要。广义修正加权kappa系数的估计与双变量修正kappa的估计表现出相似的性能。

表4

基于500次模拟运行的三变量生存模型下广义修正加权kappa估计的仿真结果

真κ^w个_克	样本大小	审查%	意思是	标准偏差	Bootstrap SE测试。平均值（SD）	95%覆盖概率
0.472	100	10	0.483	0.061	0.064 (0.012)	95.5
		30	0.475	0.067	0.079 (0.022)	96.7
		50	0.431	0.070	0.085 (0.016)	89.4
	200	10	0.480	0.046	0.046 (0.009)	95.3
		30	0.480	0.059	0.067 (0.026)	96.7
		50	0.463	0.063	0.069 (0.020)	94.7
	350	10	0.479	0.036	0.037 (0.011)	95.5
		30	0.486	0.034	0.047 (0.015)	94.5
		50	0.484	0.050	0.063 (0.021)	98.6
0.651	100	10	0.656	0.050	0.051 (0.010)	94.9
		30	0.631	0.055	0.067 (0.023)	94.1
		50	0.570	0.064	0.077 (0.014)	86.6
	200	10	0.651	0.033	0.036 (0.006)	96.1
		30	0.634	0.060	0.058 (0.028)	94.7
		50	0.592	0.086	0.068 (0.024)	86.5
	350	10	0.653	0.026	0.027 (0.008)	95.7
		30	0.645	0.038	0.044 (0.021)	97.1
		50	0.621	0.061	0.071 (0.031)	95.7
0.804	100	10	0.802	0.033	0.036 (0.008)	96.5
		30	0.775	0.043	0.052 (0.021)	87.3
		50	0.704	0.060	0.068 (0.015)	80.9
	200	10	0.801	0.024	0.025 (0.005)	96.3
		30	0.782	0.045	0.047 (0.029)	89.5
		50	0.738	0.047	0.059 (0.022)	80.2
	350	10	0.805	0.017	0.019 (0.006)	95.7
		30	0.789	0.062	0.044 (0.031)	93
		50	0.757	0.071	0.065 (0.033)	90.4

真κ^w个_克	样本大小	审查%	意思是	标准偏差	Bootstrap SE测试。平均值（SD）	95%覆盖概率
0.472	100	10	0.483	0.061	0.064 (0.012)	95.5
		30	0.475	0.067	0.079 (0.022)	96.7
		50	0.431	0.070	0.085 (0.016)	89.4
	200	10	0.480	0.046	0.046 (0.009)	95.3
		30	0.480	0.059	0.067 (0.026)	96.7
		50	0.463	0.063	0.069 (0.020)	94.7
	350	10	0.479	0.036	0.037 (0.011)	95.5
		30	0.486	0.034	0.047 (0.015)	94.5
		50	0.484	0.050	0.063 (0.021)	98.6
0.651	100	10	0.656	0.050	0.051 (0.010)	94.9
		30	0.631	0.055	0.067 (0.023)	94.1
		50	0.570	0.064	0.077 (0.014)	86.6
	200	10	0.651	0.033	0.036 (0.006)	96.1
		30	0.634	0.060	0.058 (0.028)	94.7
		50	0.592	0.086	0.068 (0.024)	86.5
	350	10	0.653	0.026	0.027 (0.008)	95.7
		30	0.645	0.038	0.044 (0.021)	97.1
		50	0.621	0.061	0.071 (0.031)	95.7
0.804	100	10	0.802	0.033	0.036 (0.008)	96.5
		30	0.775	0.043	0.052 (0.021)	87.3
		50	0.704	0.060	0.068 (0.015)	80.9
	200	10	0.801	0.024	0.025 (0.005)	96.3
		30	0.782	0.045	0.047 (0.029)	89.5
		50	0.738	0.047	0.059 (0.022)	80.2
	350	10	0.805	0.017	0.019 (0.006)	95.7
		30	0.789	0.062	0.044 (0.031)	93
		50	0.757	0.071	0.065 (0.033)	90.4

表4

基于500次模拟运行的三变量生存模型下广义修正加权kappa估计的仿真结果

真κ^w个_克	样本大小	审查%	意思是	标准偏差	Bootstrap SE测试。平均值（SD）	95%覆盖概率
0.472	100	10	0.483	0.061	0.064 (0.012)	95.5
		30	0.475	0.067	0.079 (0.022)	96.7
		50	0.431	0.070	0.085 (0.016)	89.4
	200	10	0.480	0.046	0.046 (0.009)	95.3
		30	0.480	0.059	0.067 (0.026)	96.7
		50	0.463	0.063	0.069 (0.020)	94.7
	350	10	0.479	0.036	0.037 (0.011)	95.5
		30	0.486	0.034	0.047 (0.015)	94.5
		50	0.484	0.050	0.063 (0.021)	98.6
0.651	100	10	0.656	0.050	0.051 (0.010)	94.9
		30	0.631	0.055	0.067 (0.023)	94.1
		50	0.570	0.064	0.077 (0.014)	86.6
	200	10	0.651	0.033	0.036 (0.006)	96.1
		30	0.634	0.060	0.058 (0.028)	94.7
		50	0.592	0.086	0.068 (0.024)	86.5
	350	10	0.653	0.026	0.027 (0.008)	95.7
		30	0.645	0.038	0.044 (0.021)	97.1
		50	0.621	0.061	0.071 (0.031)	95.7
0.804	100	10	0.802	0.033	0.036 (0.008)	96.5
		30	0.775	0.043	0.052 (0.021)	87.3
		50	0.704	0.060	0.068 (0.015)	80.9
	200	10	0.801	0.024	0.025 (0.005)	96.3
		30	0.782	0.045	0.047 (0.029)	89.5
		50	0.738	0.047	0.059 (0.022)	80.2
	350	10	0.805	0.017	0.019 (0.006)	95.7
		30	0.789	0.062	0.044 (0.031)	93
		50	0.757	0.071	0.065 (0.033)	90.4

真κ^w个_克	样本大小	审查%	意思是	标准偏差	Bootstrap SE测试。平均值（SD）	95%覆盖概率
0.472	100	10	0.483	0.061	0.064 (0.012)	95.5
		30	0.475	0.067	0.079 (0.022)	96.7
		50	0.431	0.070	0.085 (0.016)	89.4
	200	10	0.480	0.046	0.046 (0.009)	95.3
		30	0.480	0.059	0.067 (0.026)	96.7
		50	0.463	0.063	0.069 (0.020)	94.7
	350	10	0.479	0.036	0.037 (0.011)	95.5
		30	0.486	0.034	0.047 (0.015)	94.5
		50	0.484	0.050	0.063 (0.021)	98.6
0.651	100	10	0.656	0.050	0.051 (0.010)	94.9
		30	0.631	0.055	0.067 (0.023)	94.1
		50	0.570	0.064	0.077 (0.014)	86.6
	200	10	0.651	0.033	0.036 (0.006)	96.1
		30	0.634	0.060	0.058 (0.028)	94.7
		50	0.592	0.086	0.068 (0.024)	86.5
	350	10	0.653	0.026	0.027 (0.008)	95.7
		30	0.645	0.038	0.044 (0.021)	97.1
		50	0.621	0.061	0.071 (0.031)	95.7
0.804	100	10	0.802	0.033	0.036 (0.008)	96.5
		30	0.775	0.043	0.052 (0.021)	87.3
		50	0.704	0.060	0.068 (0.015)	80.9
	200	10	0.801	0.024	0.025 (0.005)	96.3
		30	0.782	0.045	0.047 (0.029)	89.5
		50	0.738	0.047	0.059 (0.022)	80.2
	350	10	0.805	0.017	0.019 (0.006)	95.7
		30	0.789	0.062	0.044 (0.031)	93
		50	0.757	0.071	0.065 (0.033)	90.4

4.示例

前列腺癌是美国男性最常见的癌症。根据患者的人口统计学和疾病特征，可提供各种治疗。治疗和监测前列腺癌的一个主要困难是缺乏治疗后疾病自由的标准定义。人们普遍认为，治疗后疾病状态反映在前列腺特异性抗原（PSA）中，高水平PSA表明复发。然而，对于确定疾病复发的PSA水平的确切模式，并没有普遍的共识。针对不同的治疗提出了不同的定义，基于这些定义的无病生存率被用作医生选择治疗的重要指导。由于无病生存率在很大程度上取决于无病定义，定义之间的潜在差异可能导致关于治疗效果的不同结论。因此，在比较不同定义得出的无病生存率之前，评估不同定义之间的一致性非常重要。

根治性前列腺切除术和放射治疗是前列腺癌常用的两种治疗方法(Critz、Tarlton和Holladay，1995年). 对于根治性前列腺切除术，疾病自由度的定义是达到并保持不可检测的PSA最低值，范围为0.2 ng/ml至0.5 ng/ml(Critz等人，1996年). 对于辐照，根据美国放射肿瘤治疗学会（ASTRO）共识标准（1997年）治疗后的疾病自由度表现为PSA未升高，PSA升高定义为间隔6个月测量的连续三次PSA升高。多年来，这两种治疗方法的无病率一直存在争议。一些研究人员声称，放射治疗比根治性前列腺切除术治愈的患者更少，而另一些人则认为这两种治疗方法同样有效(Critz等人，1996年). 为了建立两种治疗方法之间无病生存率的可比性，研究人员(Critz等人，1996年)有兴趣研究两种疾病自由定义之间的一致性。此外，不同协变量亚组之间一致性强度的潜在差异也令人感兴趣。

在这项研究中，1305名前列腺癌患者通过将碘125前列腺植入物与后续的外照射相结合，接受了同步照射。外照射治疗后每6个月对所有受试者的病情进行评估。生存时间被定义为从照射结束到前列腺癌复发所经过的时间，这是根据两个不同的定义确定的。明确地，T型*₁是患者治疗后PSA水平超过最低值0.2 ng/ml的时间，而T型*₂基于ASTRO定义，表示照射后PSA达到最低值的时间与PSA水平连续三次升高中的第一次出现的时间之间的中点。生存时间以月为单位进行测量。由于对一名患者的随访结束，这两个癌症复发时间受到审查。在研究期间，156名受试者根据这两个定义都经历了前列腺癌复发，64名受试人根据其中一个定义经历了癌症复发，约占审查的80%。基于这两种定义的观测时间之间的绝对差异在0到108个月之间，平均值为1.9个月。

在前列腺癌研究中，癌症复发时间是以离散的方式收集的，因为受试者仅每6个月评估一次。因此，建议的修正kappa可用于评估两种定义测量的癌症复发时间之间的一致性。由于事件稀少，我们将生存时间分组T型*₁和T型*₂分为五个间隔：不超过30个月、31–60个月、61–90个月、91–162个月和>162个月中，由此产生的离散生存时间表示为T型₁和T型₂.在不丧失通用性的情况下，T型_j个 = 1、2、…、5用于j个 = 1、2，对应五个时间间隔。二次加权函数的估计修正kappa为0.842，bootstrap SE为0.021（基于200个bootstrat样本）。基于bootstrap样本估计值的2.5%和97.5%经验百分位数，修正加权kappa系数的95%置信区间为（0.798，0.882）。因此，在前列腺癌数据中，通过这两种定义测量的复发时间之间存在着相当强的一致性。由于对前列腺数据进行了大量的删失，我们进行了一项模拟研究，以确认我们提出的方法在这种情况下的适用性。我们评估了样本量为1300且删失比例为80%的kappa估计量的性能，这是与前列腺数据示例类似的设置（见Web表2）对于所有kappa水平，所提出的估计器在重截尾率下表现得相当好。更具体地说，对于κ=0.804，它代表了与我们的数据相似的一致性强度，kappa估计的偏差约为6%，覆盖概率接近90%（Web表2).

作为另一种方法，我们还使用Lin的CCC（Lin，1998）测量了两个定义之间的一致性，处理了未分组的数据T型*_j个(j个 = 1，2）作为连续生存时间。一个非参数估计(Guo和Manatunga，2007年)用于容纳审查后的观察结果。未分组数据的CCC估计值为0.792，非常接近分组数据的修正kappa估计值。在这两种情况下，我们得出结论，基于前列腺癌数据中的两个定义，癌症复发时间之间有很强的一致性。

5.讨论

在本文中，我们建议将科恩（1968）衡量离散生存时间之间一致性的加权kappa系数。据我们所知，之前还没有将kappa系数调整为生存结果的工作。为了适应截尾观察，我们首先估计两个生存时间的联合生存函数，然后将截尾观察的质量重新分配给那些可能发生未观察事件的细胞。该方法的一个关键假设是，截尾分布与联合生存函数无关。这种假设确保了可以根据估计的生存函数适当地重新分配删失观测的质量。在生存函数的各种估计中，我们选择普伦蒂斯和蔡氏（1992）估计器，因为它对于大多数实际用途来说都是足够的，并且比许多替代方案更有效(Kalbfleisch和Prentice，2002年). 此外，Prentice–Cai估计量可以合并单变量和双变量审查，这比仅适用于单变量审查的估计量更具优势(Lin和Ying，1993年;蔡和克劳利，1998年).

提出的修正加权kappa用于测量离散生存时间之间的一致性。然而，在某些情况下，它对持续结果也很有用；例如，当生存时间是以离散的方式实际测量的，或者当事件在原始连续时间尺度上过于稀疏时。在这些情况下，可以离散连续时间，并应用所提出的修正加权kappa来衡量分组生存时间之间的一致性。我们建议使用几个离散化准则。如果可能，我们建议将生存时间分组为与临床解释相关的实际有意义的间隔。例如，糖尿病发病时间可分为青少年、成人和老年糖尿病。第二个准则是离散化应捕获观测事件的经验分布，以便离散生存时间的分布能够合理地表示潜在的连续生存分布。例如，不希望将大多数观察到的事件分组为几个间隔，而其余间隔为空。在这种情况下，估计的修正加权kappa是基于列联表中的几个非空单元格计算的，因此可能无法正确反映原始时间之间的一致性。最后，我们建议将最后一次观察到的事件之后的时间分组为一个或两个间隔，其中最后一个间隔要么是单侧的，要么是在可能发生相关事件的最大时间点结束的。在实践中，不同的离散化不可避免地影响估计kappa的大小，因为已知kappa依赖于边际分布(库克，1998年). 上述指南可以帮助估计的kappa正确反映原始生存时间之间的一致性。或者，可以使用为连续刻度定义的一致性度量。持续成果的一个流行协议指数是CCC(林，1989). 针对生存时间，提出了一种CCC的非参数估计方法，该方法能够适应截尾观测(Guo和Manatunga，2007年).

修正加权kappa和广义修正加权kapba的建议估计在低到中等截尾下的性能令人满意。在重截尾下，估计更具偏差，在中小型样本中的覆盖概率相对较低。随着样本量的增加，估计器的性能得到了提高。需要指出的是，由于生存函数的右尾很难估计，基于生存函数构造的统计量的估计偏差在重截尾情况下是不可避免的。例如，林和英（1993）在存在严重删失的情况下估计两个生存时间之间的相关系数时注意到的偏差。

当两个生存时间测量值之间的一致性较差时，我们可以评估列联表中观察到的事件的经验分布，以找出不一致的原因；例如，如果建议的kappa是基于从连续时间分组的离散生存时间计算的。人们可能想通过遵循我们上面提出的建议准则来检查当前的离散化是否合适，以及在选择更合适的离散化时是否会改进一致性。当研究人员有兴趣调整两个测量值以减少它们之间的差异时，尤其是当一个测量值与另一个测量结果始终存在偏差时，对分歧原因的评估可以提供有用的信息。

正如一位评论家指出的，所提出的一致性方法可能对多时间尺度问题有用。在许多生存研究中，可以使用多种看似合理的量表来测量事件发生的时间。通常，第一个时间刻度是一个失败主题的原始时间或年龄。第二种替代时间尺度基于时变协变量，例如使用或暴露度量，通常被视为操作时间。一个经典的例子是，汽车的寿命可以通过其年龄或行驶里程来衡量。在多时间尺度问题中，第一个时间尺度很容易定义，而操作时间尺度的定义通常不明显。现有方法(《永别了，考克斯》，1979年;奥克斯，1995年;Kordonsky和Gertsbakh，1997年;公爵夫人和劳利斯，2000年)目的选择一个时间尺度，以“捕获”给定时间相关协变量的故障时间中的大多数变化。公爵夫人和劳利斯（2000）已经证明，方差平方系数最小的时间尺度是某些生存分布族中的理想时间尺度。与现有方法相比，我们提出的一致性方法有助于确定一个理想的时间尺度，该尺度与测量感兴趣事件的原始时间尺度等效。我们提出了以下方案：首先，在存在自然或有意义网格的时间尺度上固定分区。其次，划分操作时间的范围，并使用改进的加权kappa度量两个离散时间尺度之间的一致性。对不同的分区重复第二步，并选择使修改后的加权kappa最大化的时间尺度。然后，可以使用与原始时间刻度最一致的理想刻度来解释与操作时间刻度相关的风险，以及与时间刻度相关联的风险。

6.补充资料

第2、3和4节中引用的Web附录和表格可在生物计量学网站http://www.biometrics.tibs.org.

致谢

我们感谢审稿人、副主编和主编的宝贵意见，这些意见使原稿有了实质性的改进。这项工作得到了NIH拨款R01-MH079448-01的支持。

工具书类

美国放射治疗和肿瘤学会共识小组

. (

1997

).

共识声明：放射治疗后PSA指南

.

国际放射肿瘤学、生物学、物理学杂志

37

,

1035

–

1041

.

公共医学

OpenURL占位符文本

奇凯蒂

,

直流电。

和

艾利森

,

T。

(

1971

).

一种评估脑电图睡眠记录评分可靠性的新方法

.

美国脑电图技术杂志

11

,

101

–

109

.

克莱顿

,

D.G.公司。

(

1978

).

双变量生命表的关联模型及其在慢性病家族倾向流行病学研究中的应用

.

生物特征

65

,

141

–

151

.

科恩

,

J。

(

1960

).

标称刻度的一致系数

.

教育和心理测量

20

,

37

–

46

.

科恩

,

J。

(

1968

).

加权kappa：名义规模协议，提供规模分歧或部分信贷

.

心理学公报

70

,

213

–

220

.

厨师

,

R·J。

(

1998

). Kappa及其对边际利率的依赖性。在

生物统计学百科全书

,

第页。

阿米蒂奇

和

T。

科尔顿

（编辑），

2166

–

2168

.

纽约

:

威利

.

克里茨

,

联邦航空局。

,

塔尔顿

,

钢筋混凝土。

、和

荷兰

,

D.A.博士。

(

1995

).

前列腺特异性抗原监测联合放射治疗前列腺癌

.

癌症

75

,

2383

–

2391

.

克里茨

,

联邦航空局。

,

莱文森

,

K。

,

威廉姆斯

,

W.H.公司。

、和

荷兰

,

D.A.博士。

(

1996

).

前列腺特异性抗原nadir：前列腺癌放疗后的最佳水平

.

临床肿瘤学杂志

14

,

2893

–

2900

.

公爵夫人

,

T。

和

无法无天的

,

J。

(

2000

).

替代时间尺度和故障时间模型

.

终身数据分析

6

,

157

–

179

.

再会

,

V.T.公司。

和

考克斯

,

D.R.公司。

(

1979

).

关于寿命试验中多时间尺度的注记

.

应用统计学

28

,

73

–

75

.

弗莱斯

,

J.L公司。

(

1971

).

衡量许多评分员之间的名义规模一致性

.

心理学公报

76

,

378

–

382

.

弗莱斯

,

J.L公司。

和

科恩

,

J。

(

1973

).

加权kappa和类内相关系数作为可靠性度量的等价性

.

教育和心理测量

33

,

613

–

619

.

郭

,

年。

和

马纳通加

,

答：K。

(

2005

).

基于kappa系数的离散双变量生存时间一致性建模

.

终身数据分析

11

,

309

–

332

.

郭

,

年。

和

马纳通加

,

答：K。

(

2007

).

单变量删失下一致相关系数的非参数估计

.

生物计量学

,

63

,

164

–

172

.

卡尔布弗雷希

,

J·D·。

和

普伦蒂斯

,

共和国。

(

2002

).

失效时间数据的统计分析。

新泽西州霍博肯

:

约翰·威利父子公司

.

国王

,

T.秒。

和

青椒

,

V.米。

(

2001

).

连续和分类数据的广义一致相关系数

.

医学统计学

20

,

2131

–

2147

.

克拉尔

,

N。

,

利普希茨

,

S.R.公司。

、和

易卜拉欣

,

J。

(

2000

).

kappa建模的估计方程方法

.

生物医学杂志

42

,

45

–

58

.

科尔登斯基

,

英国。

和

格茨巴赫

,

一、。

(

1997

).

多时间尺度和寿命变化系数：工程应用

.

终身数据分析

三

,

139

–

156

.

Korten公司

,

答：E。

,

乔姆

,

A.F.公司。

,

亨德森

,

A.S.公司。

,

麦库斯克

,

E.公司。

、和

折痕

,

H。

(

1992

).

阿尔茨海默病病例对照研究中暴露史的控制效应一致性

.

国际流行病学杂志

21

,

1121

–

1131

.

克莱默

,

高压断路器。

(

1980

).

卡伯系数的扩展

.

生物计量学

36

,

207

–

216

.

兰迪斯

,

J.R.公司。

和

科赫

,

G.G.公司。

(

1977

).

类别数据的观察者一致性度量

.

生物计量学

33

,

159

–

174

.

林

,

D.Y.博士。

和

应

,

Z.公司。

(

1993

).

一元删失下二元生存函数的一个简单非参数估计

.

生物特征

80

,

573

–

581

.

林

,

拉丁美洲。

(

1989

).

用于评估再现性的一致性相关系数

.

生物计量学

45

,

255

–

268

.

麦克卢尔

,

M。

和

威利特

,

西海岸。

(

1987

).

kappa统计的误解和误用

.

美国流行病学杂志

126

,

161

–

169

.

橡树

,

D。

(

1989

).

脆弱性诱发的双变量生存模型

.

美国统计协会杂志

84

,

487

–

493

.

橡树

,

D。

(

1995

).

生存分析中的多个时间尺度

.

终身数据分析

1

,

7

–

18

.

普伦蒂斯

,

共和国。

和

蔡

,

J。

(

1992

).

基于截尾多变量失效时间数据的协方差和生存函数估计

.

生物特征

79

,

495

–

512

.

施

,

J.H。

(

1998

).

多元离散故障时间数据建模

.

生物计量学

54

,

1115

–

1128

.

济

,

W.Y.公司。

和

克劳利

,

J。

(

1998

).

关于单变量删失下二元生存函数非参数估计的一个注记

.

生物特征

85

,

573

–

580

.