msSPChelpR包简介-从长数据集到SIR分析

玛丽安·埃贝尔

2020年10月26日

介绍

本小插曲解释了如何使用这些功能:

对于某些函数,同一函数有多个变量使用不同的框架。它们给出了相同的结果,但在执行时间和内存使用:

SIR背后的理论

在这个小插曲的下一个版本中,理论考虑因素本章将解释SIR的计算方法。

示例

SEER肺癌

步骤1-长数据集

图书馆(dplyr)
#>
#>正在附加包:“dplyr”
#>以下对象从“package:stats”中屏蔽:
#>
#>过滤器,滞后
#>以下对象从“package:base”中屏蔽:
#>
#>相交,setdiff,setequal,并集
图书馆(马格里特)
图书馆(msSPChelpR)
#加载癌症患者的合成数据集以演示包功能
数据(“us_second_cancer”)

#这个数据集是长格式的,所以每个肿瘤在数据中都是一个单独的行
美国第二癌症
#>#A桥:113999×16
#>fake_id SEQ_NUM注册表性别种族日期出生t_datediag t_site_icd t_dco
#><chr><int><chr>
#>1 100004 1 SEER注册…1926-01-01 1992-07-15 C50历史…
#>2 100004 2 SEER注册…1926-01-01 2004-01-15 C54历史…
#>3 100004 3 SEER注册…男白人1926-01-01 2006-06-15 C34历史…
#>4 100004 4 SEER Reg…男白人1926-01-01 2018-06-15 C14 DCO…
#>5 100034 1 SEER注册…男白人1979-01-01 2000-06-15 C50历史…
#>6 100037 1 SEER注册…Fema…White 1938-01-01 1996-01-15 C54 hist…
#>7 100038 1 SEER注册…男白人1989-01-01 1991-04-15 C50历史…
#>8 100038 2 SEER Reg…男白人1989-01-01 2000-03-15 C80历史…
#>9 100039 1 SEER注册…Fema…White 1946-01-01 2003-08-15 C50 hist…
#>10 100039 2 SEER注册…Fema…White 1946-01-01 2011-04-15 C34 hist…
#> # 113989多行
#> # 还有7个变量:t_hist<int>、fc_age<int>和datedeath<date>,
#>#p_alive<chr>,p_dodmin<date>,fc_agegroup<chr>,t_yeardiag<chr>

步骤2-筛选长数据集

#肺癌过滤器
身份证<-美国第二癌症%>%
  #检测肺癌患者的ids
  滤波器(t_site_icd)== “C34”)%>%
  选择(fake_id)%>%
  as.矢量()%>%
  未命名()%>%
  未列入名单()

过滤的usdata<-美国第二癌症%>%
  #根据上述检测到的ids过滤任何肺癌诊断
  滤波器(fake_id%单位:%ID)%>%
  安排(fake_id)

过滤的usdata
#>#A桥:62661×16
#>fake_id SEQ_NUM注册表性别种族日期出生t_datediag t_site_icd t_dco
#><chr><int><chr>
#>1 100004 1 SEER注册…1926-01-01 1992-07-15 C50历史…
#>2 100004 2 SEER Reg…男白色1926-01-01 2004-01-15 C54历史…
#>3 100004 3 SEER注册…男白人1926-01-01 2006-06-15 C34历史…
#>4 100004 4 SEER Reg…男白人1926-01-01 2018-06-15 C14 DCO…
#>5 100039 1 SEER注册…Fema…White 1946-01-01 2003-08-15 C50 hist…
#>6 100039 2 SEER注册…Fema…White 1946-01-01 2011-04-15 C34 hist…
#>7 100039 3 SEER注册…女性…白色1946-01-01 2018-01-15 C80历史…
#>8 100073 1 SEER Reg…男白人1960-01-01 1993-11-15 C44历史…
#>9 100073 2 SEER注册…男白人1960-01-01 2003-12-15 C34历史…
#>10 100143 1 SEER Reg…男白人1944-01-01 1992-03-15 C50历史…
#> # 62651多行
#> # 还有7个变量:t_hist<int>、fc_age<int>和datedeath<date>,
#>#p_alive<chr>、p_dodmin<date>、fc_agegroup<chr]、t_yeardiag<chr

第3步-重新编号时间id

重新编号的usdata<-过滤的usdata%>%
  重新编号时间id(新时间变量= “t_tumid”,
                   数据类型= “预言家”,
                   案例_变量= “fake_id”)

重新编号的usdata%>%
   选择(假id、性别、站点id、日期诊断、图米德)
#>#A台:62661×5
#>fake_id性别t_site_icd t_datediag t_tumid
#><chr><chr><chr<date><int>
#>1 100004男C50 1992-07-15 1
#>2 100004男C54 2004-01-15 2
#>3 100004男C34 2006-06-15 3
#>4 100004男C14 2018-06-15 4
#>5 100039女C50 2003-08-15 1
#>6 100039女C34 2011-04-15 2
#>7 100039女C80 2018-01-15 3
#>8 100073男C44 1993-11-15 1
#>9 100073男C34 2003-12-15 2
#>10 100143男C50 1992-03-15 1
#> # 62651多行

步骤4-重塑宽数据集

美国数据范围<-重新编号的usdata%>%
  重塑宽度tidyr(案例_变量= “fake_id”,时间_变量= “t_tumid”,时间变量最大值= 10)

#现在,数据采用了许多包函数所需的宽格式。
#这意味着,每个病例是一行,每个病例ID有几个肿瘤
#使用timeid作为列名后缀向数据添加新列。
美国数据范围
#>#A桥:31997×136
#>fake_id SEQ_NUM.1注册表.1性别.1种族.1出生日期.1 t_datediag.1
#><chr><int><chr><chr><chr><date><date>
#>1 100004 1 SEER Reg 20-Detroi…男白人1926-01-01 1992-07-15
#>2 100039 1 SEER Reg 02-Connec…Fema…White 1946-01-01 2003-08-15
#>3 100073 1 SEER Reg 01-San Fr.…男白人1960-01-01 1993-11-15
#>4 100143 1 SEER Reg 02-Connec…男白人1944-01-01 1992-03-15
#>5 100182 1 SEER Reg 02-Connec…男其他1927-01-01 1991-09-15
#>6 100197 1 SEER Reg 02-Connec…Fema…White 1945-01-01 2012-06-15
#>7 100208 1 SEER Reg 02-Connec…男白人1970-01-01 2019-11-15
#>8 100230 1 SEER Reg 01-San Fr.…男白人1947-01-01 1992-11-15
#>9 100234 1 SEER Reg 01-San Fr.…男白人1988-01-01 2010-02-15
#>10 100266 1 SEER Reg 01-San Fr.…Fema…White 1956-01-01 2010-07-15
#> # 31987行
#> # 129个变量:t_site_icd.1<chr>,t_dco.1<chr>,t_hist.1<int>,
#>#fc_age.1<int>,datedeath.1<date>,p_alive.1<chr>,p_dodmin.1<date>,
#>#fc_agegroup.1,t_yeardiag.1,SEQ_NUM.2,registry.2,注册表,
#>#sex.2<chr>,race.2<chr>,datebirth.2<date>,t_datediag.2<date>,
#>#t_site_icd.2<chr>,t_dco.2<chr>,t_hist.2<int>,fc_age.2<int,
#>#datedeath.2<date>,p_alive.2<chr>,p_dodmin.2<date>…

步骤5-重新计算p_spc


美国数据范围<-美国数据范围%>%
数字播放器::突变(p_spc=数字播放器::案例_时间(国际标准编号(t_site_icd).2)~ “无SPC”,
                         !国际标准编号(t_site_icd).2)~ “SPC开发”,
                         真的 ~ NA_字符_))%>%
  #创建与数字变量countspc相同的信息
数字播放器::突变(count_spc(计数_秒)=数字播放器::案例_时间(国际标准编号(t_site_icd).2)~ 1,
                            真的 ~ 0))
美国数据范围%>%
数字播放器::选择(fake_id,性别.1,p_spc,计数_spc,t_site_icd.1,
t_datediag(日期诊断).1,_站点ID.2,t_日期诊断.2)
#>#A桥:31997×8
#>fake_id性别。1 p_spc计数_站点id。1 t日期诊断。1 t站点id。2
#><chr><chr>
#>1 100004 Male SPC开发0 C50 1992-07-15 C54
#>2 100039女性SPC开发0 C50 2003-08-15 C34
#>3 100073男性SPC开发0 C44 1993-11-15 C34
#>4 100143 Male SPC开发了0 C50 1992-03-15 C34
#>5 100182男性SPC开发0 C18 1991-09-15 C34
#>6 100197女性SPC开发0 C34 2012-06-15 C50
#>7 100208男No SPC 1 C34 2019-11-15<NA>
#>8 100230 Male SPC开发0 C44 1992-11-15 C34
#>9 100234男No SPC 1 C34 2010-02-15<NA>
#>10 100266女No SPC 1 C34 2010-07-15<NA>
#> # 增加31987行
#> # 还有一个变量:t_datediag.2<date>

步骤6-在FU结束时确定患者状态

美国数据范围<-美国数据范围%>%
  帕特状态(.,结束(_E)= "2017-12-31",数据类型= “预言家”,
             状态变量= “p_status”,生命值(_V)= “p_alive.1”,
             spc_var值= “p_spc”,出生日期变量= “出生日期。1”,
             寿命数据变量= “datedeath.1”,fcdat变量= “t_datediag.1”,
             spcdat变量= “t_datediag.2”,生活_状态_生活= “活着”,
             生命状态数据= “死亡”,spc_stat_是= “SPC开发”,
             spc_stat_no(统计编号)= “无SPC”,生命数据(_fu_end)= "2019-12-31",
             使用lifedatmin= 错误的,检查= 真的,
             作为标签因子= 真的)
#>#A台:10×3
#>p_alive。1 p_status n
#><chr><fct><int>
#>1名在FC后存活的患者(在…5986后有或无SPC)
#>2名SPC 11421后存活的患者
#>3 Alive NA-患者未在FU结束前出生4
#>4 Alive NA-患者在FU 873结束前未发生癌症
#>5名FC后存活的死亡患者(909年后是否进行SPC)
#>SPC 1294后6名患者死亡
#>7名患者在FC 6116后死亡
#>SPC 5286后8名患者死亡
#>9死亡NA-患者在FU结束前未发生癌症44
#>10死亡NA-患者死亡日期缺失64
#>#A tibble:7×2
#>p_状态n
#><fct><int>
#>1名患者在FC后存活(FU结束后有或无SPC)6895
#>2名SPC 12715后存活的患者
#>3名患者在FC 6116后死亡
#>4名患者在SPC 5286后死亡
#>5不适用-患者未在FU结束前出生4
#>6 NA-患者在FU 917结束前未发生癌症
#>7不适用-患者死亡日期缺失64

美国数据范围%>%
数字播放器::选择(fake_id、p_status、p_alive.1,日期死亡.1,_站点ID.1,t_datediag.1,
_站点ID.2,t_日期诊断.2)
#>#A桥:31997×8
#>fake_id p_status p_alive.1日期死亡.1 t站点识别码.1 t日期诊断码.1 t站点标识码.2
#><chr><fct><chr><日期><chr><日期>
#>1 100004患者…Alive NA C50 1992-07-15 C54
#>2 100039患者…活着NA C50 2003-08-15 C34
#>3 100073患者…死亡2012-06-01 C44 1993-11-15 C34
#>4 100143患者…Alive NA C50 1992-03-15 C34
#>5 100182患者…活着NA C18 1991-09-15 C34
#>6 100197患者…活着NA C34 2012-06-15 C50
#>7 100208 NA-宾夕法尼亚州…死亡2019-11-15 C34 2019-11-15<NA>
#>8 100230患者…活着NA C44 1992-11-15 C34
#>9 100234患者…活着NA C34 2010-02-15
#>10 100266患者…死亡2010-07-15 C34 2010-07-15<NA>
#> # 31987行
#> # 还有一个变量:t_datediag.2<date>

#或者,您可以使用lifedatminvar插补死亡日期
美国数据范围%>%
  帕特状态(.,结束(_E)= "2017-12-31",数据类型= “预言家”,
             状态变量= “p_status”,寿命变量= “p_alive.1”,
             spc_var值= “p_spc”,出生日期变量= “出生日期。1”,
             寿命数据变量= “死亡日期。1”,fcdat变量= “t_datediag.1”,
             spcdat变量= “t_datediag.2”,生活_状态_生活= “活着”,
             生命状态数据= “死亡”,spc_stat_是= “SPC开发”,
             spc_stat编号= “无SPC”,生命数据(_fu_end)= "2019-12-31",
             使用lifedatmin= 真的,寿命数据最小值= “p_dodmin.1”,
             检查= 真的,作为标签因子= 真的)
#>#A台:9×3
#>p_alive。1 p_status n
#><chr><fct><int>
#>1名FC后存活的患者(例如5986后有或无SPC)
#>2名SPC 11421后存活的患者
#>3 Alive NA-患者未在FU结束前出生4
#>4 Alive NA-患者在FU 873结束前未发生癌症
#>5名FC后存活的死亡患者(如913后有或无SPC)
#>SPC 1295后6名死亡患者存活
#>7名患者在FC 6138之后死亡
#>8名患者在SPC 5323后死亡
#>9死亡NA-患者在FU结束前未发生癌症44
#>#A台:6×2
#>p_状态n
#><fct><int>
#>1名患者在FC后存活(FU结束后有或无SPC)6899
#>2名SPC 12716后存活的患者
#>3名患者死于FC 6138
#>4名患者在SPC 5323后死亡
#>5不适用-患者未在FU结束前出生4
#>6 NA-患者在FU 917结束前未发生癌症
#>#A桥:31997×139
#>fake_id SEQ_NUM.1注册表.1性别.1种族.1出生日期.1 t_datediag.1
#><chr><int><chr><chr><chr><date><date>
#>1 100004 1 SEER Reg 20-Detroi…男白人1926-01-01 1992-07-15
#>2 100039 1 SEER Reg 02-Connec…Fema…White 1946-01-01 2003-08-15
#>3 100073 1 SEER Reg 01-San Fr.…男白人1960-01-01 1993-11-15
#>4 100143 1 SEER Reg 02-Connec…男白人1944-01-01 1992-03-15
#>5 100182 1 SEER Reg 02-Connec…男其他1927-01-01 1991-09-15
#>6 100197 1 SEER Reg 02-Connec…Fema…White 1945-01-01 2012-06-15
#>7 100208 1 SEER Reg 02-Connec…男白人1970-01-01 2019-11-15
#>8 100230 1 SEER Reg 01-San Fr.…男白人1947-01-01 1992-11-15
#>9 100234 1 SEER Reg 01-San Fr.…男白人1988-01-01 2010-02-15
#>10 100266 1 SEER Reg 01-San Fr.…Fema…White 1956-01-01 2010-07-15
#> # 31987行
#> # 132个其他变量:tsite_icd.1<chr>,tdco.1<chr>,t_hist.1<int>,
#>#fc_age.1<int>,datedeath.1<date>,p_alive.1<chr>,p_dodmin.1<date>,
#>#fc_agegroup.1,t_yeardiag.1,SEQ_NUM.2,registry.2,注册表,
#>#sex.2<chr>,race.2<chr>,datebirth.2<date>,t_datediag.2<date>,
#>#t_site_icd.2<chr>,t_dco.2<chr>,t_hist.2<int>,fc_age.2<int,
#>#datedeath.2<date>,p_alive.2<chr>,p_dodmin.2<date>…

步骤6b-根据地位

美国数据范围<-美国数据范围%>%
数字播放器::滤波器(!p_status(状态)%单位:% c(“NA-患者未在FU结束前出生”,
                                 “NA-患者在FU结束前未发生癌症”,
                                 “NA-患者死亡日期缺失”))

美国数据范围%>%
数字播放器::计数(p_status)
#>#A台:4×2
#>p_状态n
#><fct><int>
#>1名患者在FC后存活(FU结束后有或无SPC)6895
#>2名SPC 12715后存活的患者
#>3名患者死于FC 6116
#>4名患者在SPC 5286后死亡

步骤7-计算FU时间

美国数据范围<-美国数据范围%>%
   计算_无效时间(.,futme_var_new公司= “p_futimeyrs”,结束(_E)= "2017-12-31",
               数据类型= “预言家”,时间单位= “年”,
               寿命数据变量= “datedeath.1”,
               fcdat变量= “t_datediag.1”,spcdat变量= “t_datediag.2”)
#>#A台:4×5
#>p_status意味着使用时间最小使用时间最大使用时间中位数使用时间
#><fct><dbl><dbl
#>1名患者术后存活(9.56 0.0438 27.0 8.29
#>2名SPC后存活的患者8.70 0 26.9 7.50
#>3患者在FC 8.60 0 25.9 7.54后死亡
#>4名患者在SPC 6.29 0 25.3 5.17后死亡

美国数据范围%>%
数字播放器::选择(fake_id、p_status、p_futmeyrs、p_alive.1,日期死亡.1,t_datediag.1,t_datediag.2)
#>#A桥:31012×7
#>fake_id p_status p_futmeyrs p_alive.1日期死亡.1日期诊断.1日期诊断.2
#><chr><fct><dbl><chr><date><date>
#>1 100004患者…11.5 Alive NA 1992-07-15 2004-01-15
#>2 100039患者…7.67 Alive NA 2003-08-15 2011-04-15
#>3 100073患者…10.1死亡2012-06-01 1993-11-15 2003-12-15
#>4 100143患者…3.33 Alive NA 1992-03-15 1995-07-15
#>5 100182患者…7.08 Alive NA 1991-09-15 1998-10-15
#>6 100197患者…4.83 Alive NA 2012-06-15 2017-04-15
#>7 100230患者…11.0活的NA 1992-11-15 2003-11-15
#>8 100234患者…7.87 Alive NA 2010-02-15 NA
#>9 100266患者…0死亡2010-07-15 2010-07-15NA
#>10 100274患者…7.38死亡2011-06-01 2004-01-15 NA
#> # 31002多行

步骤8-计算SIR

sircalc结果<-美国数据范围%>%
  先生_比弗提姆(
    数据类型= “预言家”,
    ybreak变量= c(“比赛.1”,“t_dco.1”),
    xbreak变量= “无”,
    徒劳的断裂= c(0,1/12,2/12,1,5,10,Inf公司),
    count_var(计数变量)= “count_spc”,
    refrates_df(参考.df)=美国兄弟会2,
    calc_total_低= 真的,
    计算_总计_ fu= 真的,
    区域_var= “注册表.1”,
    年龄变量= “fc_年龄组.1”,
    性别变量= “性别。1”,
    年份变量= “t_yeardiag.1”,
    race_var(赛车变量)= “比赛.1”,
    站点(_var)= “t_site_icd.1”,#使用按第二癌症发病率分组
    无效变量= “p_futmeyrs”,
    阿尔法= 0.05)
#>
计算SIR■■■■18%|预计到达时间:5秒

计算SIR■■■■■■■■23%|预计到达时间:5秒

计算SIR■■■■■■■■■27%|预计到达时间:4秒

计算SIR■■■■■■■■■■■32%|预计到达时间:4秒

计算SIR■■■■■■■■■■■■36%|预计到达时间:4秒

计算SIR■■■■■■■■■■■■■41%|预计到达时间:4秒

计算SIR■■■■■■■■■■■■■■■45%|预计到达时间:3秒

计算SIR■■■■■■■■■■■■■■■■50%|预计到达时间:3秒

计算SIR■■■■■■■■■■■■■■■■■55%|预计到达时间:3秒

计算SIR■■■■■■■■■■■■■■■■■■■59%|预计到达时间:2秒

计算SIR■■■■■■■■■■■■■■■■■■■■64%|预计到达时间:2秒

计算SIR■■■■■■■■■■■■■■■■■■■■■68%|预计到达时间:2秒

计算SIR■■■■■■■■■■■■■■■■■■■■■■■73%|预计到达时间:2秒

计算SIR■■■■■■■■■■■■■■■■■■■■■■■■77%|预计到达时间:1秒

计算SIR■■■■■■■■■■■■■■■■■■■■■■■■■■82%|预计到达时间:1秒

计算SIR■■■■■■■■■■■■■■■■■■■■■■■■■■■86%|预计到达时间:1秒

计算SIR■■■■■■■■■■■■■■■■■■■■■■■■■■■■91%|预计到达时间:1秒

计算SIR■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■95%|预计到达时间:0秒

                                                                 
[信息案例0PYARs]地层与0跟随-正常运行时间有数据在里面观察。
#> 受影响地层30层。
#>-这可能是由SPC与第一次癌症发生在同一天的病例引起的。
#>-您可以通过排除wide_df中的所有病例来检查这一点,其中首次诊断的日期相等。
#> ! 检查结果的属性“problems_not_empty”,查看受影响的层。
#>[信息意外情况]结果文件中有观察到的情况,但refrates_df中没有出现。
#> 2665个地层受到影响。
#>可能的解释是:
#>-DCO案例或
#>-第二次癌症的诊断发生时间与第一次癌症不同
#> ! 检查结果的“notes_refcases”属性,查看受影响的地层。
#>

sircalc结果%>% 打印(n个= 100)
#>#A整理表:421430×22
#>年龄区域性竞赛年份yvar_name yvar_label fu_time t_site观察
#><chr><chr>
#>1 00-…SEER…Fema…Black 1990…total_var整体达到1米…C14 0
#>200-…SEER…Fema…Black 1990…total_var整体达到1米…C18 0
#>3 00-…SEER…Fema…Black 1990…total_var整体达到1米…C34 0
#>400-…SEER…Fema…Black 1990…total_var整体达到1米…C44 0
#>5 00-…SEER…Fema…Black 1990…total_var整体达到1米…C50 0
#>6 00-…SEER…Fema…Black 1990…total_var总高度为1米…C54 0
#>7 00-…SEER…Fema…Black 1990…total_var整体达到1米…C64 0
#>8 00-…SEER…Fema…Black 1990…total_var整体达到1米…C80 0
#>9 00-…SEER…Fema…Black 1990…total_var整体0.0833…C14 0
#>10 00-…SEER…Fema…Black 1990…total_var整体0.0833…C18 0
#>11 00-…SEER…Fema…Black 1990…total_var整体0.0833…C34 0
#>12 00-…SEER…Fema…Black 1990…total_var整体0.0833…C44 0
#>13 00-…SEER…Fema…Black 1990…total_var整体0.0833…C50 0
#>14 00-…SEER…Fema…Black 1990…total_var整体0.0833…C54 0
#>15 00-…SEER…Fema…Black 1990…total_var整体0.0833…C64 0
#>16 00-…SEER…Fema…Black 1990…total_var整体0.0833…C80 0
#>17 00-…SEER…Fema…Black 1990…total_var整体0.167-…C14 0
#>18 00-…SEER…Fema…Black 1990…total_var整体0.167-…C18 0
#>19 00-…SEER…Fema…Black 1990…total_var整体0.167-…C34 0
#>20 00-…SEER…Fema…Black 1990…total_var整体0.167-…C44 0
#>21 00-…SEER…Fema…Black 1990…total_var整体0.167-…C50 0
#>22 00-…SEER…Fema…Black 1990…total_var整体0.167-…C54 0
#>23 00-…SEER…Fema…Black 1990…total_var整体0.167-…C64 0
#>24 00-…SEER…Fema…Black 1990…total_var整体0.167-…C80 0
#>25 00-…SEER…Fema…Black 1990…total_var整体1-5年…C14 0
#>26 00-…SEER…Fema…Black 1990…total_var整体1-5年…C18 0
#>27 00-…SEER…Fema…Black 1990…total_var整体1-5 ye…C34 0
#>28 00-…SEER…Fema…Black 1990…total_var整体1-5年…C44 0
#>29 00-…SEER…Fema…Black 1990…total_var整体1-5年…C50 0
#>30 00-…SEER…Fema…Black 1990…total_var整体1-5年…C54 0
#>31 00-…SEER…Fema…Black 1990…total_var整体1-5年…C64 0
#>32 00-…SEER…Fema…Black 1990…total_var整体1-5 ye…C80 0
#>33 00-…SEER…Fema…Black 1990…total_var整体5-10年…C14 0
#>34 00-…SEER…Fema…Black 1990…total_var整体5-10年…C18 0
#>35 00-…SEER…Fema…Black 1990…total_var整体5-10年…C34 0
#>36 00-…SEER…Fema…Black 1990…total_var整体5-10年…C44 0
#>37 00-…SEER…Fema…Black 1990…total_var整体5-10年…C50 0
#>38 00-…SEER…Fema…Black 1990…total_var整体5-10年…C54 0
#>39 00-…SEER…Fema…Black 1990…total_var整体5-10年…C64 0
#>40 00-…SEER…Fema…Black 1990…total_var整体5-10年…C80 0
#>41 00-…SEER…Fema…Black 1990…total_var整体10+ye…C14 0
#>42 00-…SEER…Fema…Black 1990…total_var整体10+ye…C18 0
#>43 00-…SEER…Fema…Black 1990…total_var整体10+ye…C34 1
#>44 00-…SEER…Fema…黑色1990…total_var整体10+ye…C44 0
#>45 00-…SEER…Fema…Black 1990…total_var整体10+ye…C50 0
#>46 00-…SEER…Fema…Black 1990…total_var整体10+ye…C54 0
#>47 00-…SEER…Fema…Black 1990…total_var整体10+ye…C64 0
#>48 00-…SEER…Fema…Black 1990…total_var整体10+ye…C80 0
#>49 00-…SEER…Fema…Black 1990…total_var总计…C14 0
#>50 00-…SEER…Fema…Black 1990…total_var总计…C18 0
#>51 00-…SEER…Fema…Black 1990…total_var总体…C34 1
#>52 00-…SEER…Fema…Black 1990…total_var总体…C44 0
#>53 00-…SEER…Fema…Black 1990…total_var总计…C50 0
#>54 00-…SEER…Fema…Black 1990…total_var总计…C54 0
#>55 00-…SEER…Fema…Black 1990…total_var总体…C64 0
#>56 00-…SEER…Fema…Black 1990…total_var总计…C80 0
#>5700-…SEER…Fema…Black 1990…种族。1黑人对1米…C14 0
#>5800-…SEER…Fema…Black 1990…种族。1黑人对1米…C18 0
#>5900-…SEER…Fema…Black 1990…种族。1黑人对1米…C340
#>60 00-…SEER…Fema…Black 1990…种族。1黑人对1米…C44 0
#>6100-…SEER…Fema…Black 1990…种族。1黑人对1米…C50 0
#>6200-…SEER…Fema…Black 1990…种族。1黑人对1米…C540
#>63 00-…SEER…Fema…Black 1990…种族。1黑人对1米…C64 0
#>64 00-…SEER…Fema…Black 1990…种族。1黑人对1米…C80 0
#>65 00-…SEER…Fema…黑色1990…种族。1黑色0.0833…C14 0
#>6600-…SEER…Fema…Black 1990…种族。1黑人0.0833…C18 0
#>67 00-…SEER…Fema…Black 1990…种族.1黑色0.0833…C34 0
#>68 00-…SEER…Fema…Black 1990…种族。1黑人0.0833…C44 0
#>69 00-…SEER…Fema…Black 1990…种族。1黑人0.0833…C50 0
#>70 00-…SEER…Fema…Black 1990…种族。1黑人0.0833…C54 0
#>71 00-…SEER…Fema…Black 1990…种族.1黑色0.0833…C64 0
#>72 00-…SEER…Fema…Black 1990…种族.1黑色0.0833…C80 0
#>7300-…SEER…Fema…Black 1990…种族.1黑色0.167-…C14 0
#>74 00-…SEER…Fema…黑色1990…种族。1黑色0.167-…C18 0
#>75 00-…SEER…Fema…Black 1990…种族.1黑色0.167-…C34 0
#>76 00-…SEER…Fema…Black 1990…种族.1黑色0.167-…C44 0
#>77 00-…SEER…Fema…黑色1990…种族。1黑色0.167-…C50 0
#>78 00-…SEER…Fema…Black 1990…种族.1黑色0.167-…C54 0
#>7900-…SEER…Fema…Black 1990…种族.1黑色0.167-…C64 0
#>80 00-…SEER…Fema…Black 1990…种族.1黑色0.167-…C80 0
#>81 00-…SEER…Fema…Black 1990…种族。1黑人1-5岁…C14 0
#>8200-…SEER…Fema…黑色1990…种族。1黑色1-5 ye…C18 0
#>83 00-…SEER…Fema…Black 1990…种族。1黑人1-5岁…C34 0
#>84 00-…SEER…Fema…Black 1990…种族。1黑人1-5岁…C44 0
#>85 00-…SEER…Fema…Black 1990…种族。1黑人1-5岁…C50 0
#>86 00-…SEER…Fema…Black 1990…种族。1黑人1-5岁…C54 0
#>8700-…SEER…Fema…Black 1990…种族。1 Black 1-5 ye…C64 0
#>88 00-…SEER…Fema…Black 1990…种族。1黑人1-5岁…C80 0
#>89 00-…SEER…Fema…Black 1990…种族。1黑人5-10岁…C14 0
#>90 00-…SEER…Fema…Black 1990…种族.1黑人5-10岁…C18 0
#>91 00-…SEER…Fema…Black 1990…种族.1黑人5-10岁…C34 0
#>92 00-…SEER…Fema…Black 1990…种族.1黑人5-10岁…C44 0
#>93 00-…SEER…Fema…Black 1990…种族。1黑人5-10岁…C50 0
#>94 00-…SEER…Fema…Black 1990…种族。1黑人5-10岁…C54 0
#>95 00-…SEER…Fema…Black 1990…种族.1黑人5-10岁…C64 0
#>96 00-…SEER…Fema…Black 1990…种族.1黑人5-10岁…C80 0
#>97 00-…SEER…Fema…Black 1990…种族。1黑人10+ye…C14 0
#>9800-…SEER…Fema…Black 1990…种族。1黑人10+ye…C18 0
#>99 00-…SEER…Fema…Black 1990…种族.1黑人10+ye…C34 1
#>100 00-…SEER…Fema…Black 1990…种族。1黑人10+ye…C44 0
#> # 421330多行
#> # 还有12个变量:预期<dbl>、sir<dbl]、sirlci<dbl>siruci<dbl、,
#>#pyar<dbl>,n_base<dbl],ref_inc_cases<dbl>,ref_population_pyar<dbl,
#>#ref_inc_crude_rate<dbl>,fu_time_sort<int>,yvar_sort<int>,
#>#警告<chr>

步骤9-总结SIR结果

#摘要功能是多功能的。例如,输出最小的摘要

sircalc结果%>%
  #总结不同地区、年龄、年份和地点的结果
  汇总_最终结果(.,
                        summarize_groups(摘要组)= c(“地区”,“年龄”,“年”,“比赛”),
                        摘要_站点= 真的,
                        输出= “长”,输出信息= “最小”,
                        添加总计行= “仅”,加总fu= “否”,
                        塌陷_ci= 错误的,shorten_total_cols(缩短总计颜色)= 真的,
                        fubreak变量名称= “定时(_T)”,ybreak变量名称= “yvar_name”,
                        xbreak变量名称= “无”,站点变量名称= “t_site”,
                        阿尔法= 0.05
)%>%
数字播放器::选择(-区域,-年龄,-年,-比赛,-性别,-yvar_name)
#>警告:结果文件“sir_df”包含i_observed中观察到的案例,这些案例在refrates_df(ref_inc_cases)中没有出现。
#>因此,变量n_base和ref_population_pyar的计算是不明确的。
#>我们取每个变量的第一个值。预计跨地层计算n_base、ref_population_pyar和ref_inc_crude_rate时会出现小的不一致。
#> ! 如果您想了解更多信息,请查看`sir_df`的`warnings`列。
#>#A整理表:7×8
#>yvar_label fu_time fu_time_stort t_site观测到预期sirci
#><chr><chr><int><chr><dbl><dbl><chr
#>1总计1个月1总计306 20.6 14.9 13.25…
#>2总计0.0833-0.167年…2总计74 20.4 3.62 2.84年…
#>3总计0.167-1年3总计717 196年。3.65 3.39 …
#>4总体1-5年4总体2995 760。3.94 3.8 -…
#>5总共5-10年5总共3113 605年。5.14 4.96 …
#>6总计10年以上6总计4254 502。8.47 8.22 …
#>7总计0至Inf…7总计11459 2105。5.44 5.34 …

使用构建

sessionInfo(会话信息)()
#>R版本4.3.2(2023-10-31 ucrt)
#>平台:x86_64-w64-mingw32/x64(64位)
#>运行于:Windows 11 x64(内部版本22631)
#>
#>矩阵产品:默认
#>
#>
#>区域设置:
#>[1]LC_COLLATE=C
#>[2]LC_CTYPE=英语_美国.utf8
#>[3]LC_MONETARY=英语_美国.utf8
#>[4]LC_NUMERIC=C
#>[5]LC_TIME=英语_美国.utf8
#>
#>时区:欧洲/柏林
#>tzcode源:内部
#>
#>附加的基本包:
#>[1]stats graphics grDevices utils datasets方法库
#>
#>其他附加包:
#>[1]msSPChelpR_0.9.1磁头_2.0.3 dplyr_1.1.4
#>
#>通过命名空间加载(未附加):
#>[1]jsonlite_1.8.8编译器4.3.2 tidyselect_1.2.0字符串_1.5.1
#>[5]tidytable_0.10.2 tidyr_1.3.0 jquerylib_0.1.4 yaml_2.3.8
#>[9]fastmap_1.1.1 R6_2.5.1一般_0.1.3标记_1.2.0
#>[13]knitr_1.45 for cats_1.0.0 tibble_3.2.1洞察力_0.19.7
#>[17]杂交_1.9.3 bslib_0.6.1柱_1.9.0 rlang_1.1.3
#>[21]utf8_1.2.4字符串_1.8.3缓存_1.0.8 xfun_0.41
#>[25]sass_0.4.8 timechange_0.2.0 cli_3.6.2 withr_3.0.0
#>[29]消化_0.6.34 rstudioapi_0.15.0 haven_2.5.4 hms_1.1.3
#>[33]生命周期_1.0.4 vctrs_0.6.5数据表_1.14.10评估_0.23
#>[37]胶_1.7.0风扇_1.0.6 rmarkdown_2.25 purr_1.0.2
#>[41]工具_4.3.2 pkgconfig_2.0.3 htmltools_0.5.7