4
$\开始组$

我正在查看雪茄烟的影响,我很难解释一些结果。研究链接如下:书房

具体来说,我对下表3有疑问:表3

在Primay雪茄系列中,50-64岁、每天使用1-2支的人群的RR为1.1。然而,综合指数为1.02(0.97-1.07)(95%置信区间)。

我知道,与从不吸烟者相比,每天使用1-2次的人的综合CI可以解释为全因死亡率增加2%,但在统计上并不显著。

我可以仅将组合CI推断到50-64组吗?换言之,我可以说“与从不吸烟者相比,每天消费1-2支雪茄的50-64岁人群的全因死亡率增加了10%,但风险在统计上并不显著”吗?

$\端组$

2个答案2

重置为默认值
6
$\开始组$

不,您不能这样推断置信区间——为50-64组计算的置信区间可能会排除null。

作为一个例子,这种解释更明显是错误的,考虑3-4支雪茄80支以上的估计值0.95。您不能在此处使用组合CI 1.02-1.15,因为它甚至不包含估计值!

除非有很好的理由预计只有50-64岁的人会有这种联系,否则我会说,“对风险的最佳单一估计是,55-64岁、消费1-2支雪茄的人的风险要高10%,但(考虑到所有年龄段的数据)这一估计比不确定性要小,而且没有令人信服的证据表明这一群体的人数会增加”。或者是其他什么。1-2支雪茄系列非常不令人信服。

$\端组$
4
  • $\开始组$ 是什么让1-2行不令人信服?我的直觉和你的想法一致,但我对更可靠的推理感到好奇。 $\端组$ 评论 5月22日0:44
  • $\开始组$ 年龄组的差异和年龄组合的事实基本上没有关联。 $\端组$ 评论 5月22日2:14
  • $\开始组$ 但是,如果你把所有的年龄合并在一起,并跟踪队列足够长的时间,最终,所有原因死亡率的OR应该是1,不是吗?还是我在放屁? $\端组$
    – 戴维姆
    评论 5月22日18:10
  • $\开始组$ 如果你对所有年龄段的OR取平均值,你就会得到一个特定年龄段的平均OR,很容易大于1。值>1意味着在每个特定的年龄,你死亡的几率(如果你到了那个年龄)都会更高。 $\端组$ 评论 5月23日0:49
2
$\开始组$

在这种情况下,您可能能够获得其他置信区间的一些粗略估计,但不能像您建议的那样“推断组合CI”。你当然不应该用这些估计来推断已发表的研究,但如果你想设计一个类似的研究,它们可能会有所帮助。

您会注意到,所有“组合”值的CI基本上与点估计值对称。情况并非总是如此。例如,生存分析中报告的风险比CI与点估计值不对称;对称性通常是log-hazard尺度。然而,在本表中,可以合理假设CI与其他点估计值对称。

问题是如何宽的CI是否是关于不同的点估计。

您不能仅仅“推断”组合CI值的一个原因是,CI的宽度取决于观察值的数量,即使您将其围绕不同的点估计值重新定心。它往往随着观测次数的平方根而减小。例如,如果50-64岁年龄组代表了组合观察值的1/4,则该年龄组的CI大约是“组合”CI的两倍。请注意,相关的“观察数”也取决于结果变量的性质。在这类研究中,重要的可能是死亡人数,而不是总人数。

这项研究似乎只是一份死亡报告,它是年龄范围和吸烟史的函数,仅限于白人男性。在一项更为复杂的研究中,使用回归方法来调整其他变量,如种族和性别,这种简单的方法值得怀疑;CI也可能取决于其他变量的分布。

即使对这种类型的表应用这种简化的方法也有一个问题:多重比较问题。你做的比较越多,就越有可能偶然出现“具有统计意义”的比较。如果你选择评估一个特定的点估计值,部分是因为它看起来“很大”,那么你就更有可能误导自己。

如果你试图根据文献中的信息设计一项新的研究,这种方法可能会很有用。在设计一项新的研究时,你需要知道你想要检测的净效应的大小以及该效应的可变性。如果你没有更多基于自己工作的直接信息,那么其他人的类似调查报告可能是你能做的最好的。

$\端组$

你的答案

单击“发布您的答案”,表示您同意我们的服务条款并确认您已阅读我们的隐私政策

不是你想要的答案吗?浏览标记的其他问题问你自己的问题