一旦你把两个数字加在一起求和,就无法判断是用哪两个数字求和的。然而,您可以尝试插值,如果不使用软件进行解释,这将非常繁琐。例如,让我们先用Mathematica语言演示一次脏兮兮的尝试,以重建2020年的数字来源:
y={302714435100021775553062351529028921775};x={17、22、27、32、37、42、47、52、57};f[x]=转置[Join[{x,y}]];插值[f[x]]绘图[InterpolatingFunction[{{17,57}},{5,3,0,{9},},0,0,自动,{}、{},错误},{{17、22、27、32、37、42、47、52、57}}\{{3027}, {14435}, {10002}, {7755}, {5306}, {2351}, {5290}, \{2892},{1775}},}自动}][\[FormalX]],{\[FormaliX],17,57}];显示[%,ListPlot[f[x],PlotStyle->Red]]
这就产生了,
请注意,>60 y/o类别未包括在内,插值仅从17岁延伸至57岁,因为在相反的情况下,我们将进行推断。要使用此方法,您需要求解特定年龄(如18岁)的插值函数。是/否,然后它会给出一个答案,表明一个以18岁为中心的五岁年龄组会包含什么。岁。要找出以18岁为中心的一年利率,你可以用这个数字除以5,如下所示(同样在Mathematica中)
插值[f[x],18.]/5
结果是1488.24,现在显然不存在0.24这样的人,而1488.24是一个粗略的估计,它大于605.4的估计值或17岁的预期人数。(15-19岁的中年除以5。)
请注意,Interpolation函数调用有一个名为“InterpolationOrder->3”的默认平滑,其中直线段插值将为“->1”。还有一些方法选项,例如,埃尔米特插值。有关更多信息,请参阅Mathematica的插值文档。
最后,请注意,如果有人如实回答他们是17岁,那就意味着他们已经完成了17岁$^\text{th}$他们出生后的第二年或平均年龄约为17.5岁,因此,尽管单年17岁左右的间隔可能被认为在16.5至17.5岁之间,因为年龄被截断,17岁的“插值”实际上包括17至18岁之间的间隔。这为数据引入了一个步长函数粒度,年龄只有两个有效数字,虽然没有五年分组那么严重,但表明最佳实践是收集出生日期和学习时间(数据收集日期)以及研究计划和数据收集之前应先进行统计思考。