摘要
实验鼠在生物医学研究中被广泛用作动物模型。有许多菌株表现出各种各样的表型。在中央数据库中捕获这些表型为研究人员选择合适的菌株进行研究提供了一种简单的方法。现有资源已经为大鼠表型数据库提供了一些初步工作。然而,现有资源存在动物数量少、缺乏更新、web界面查询受限以及缺乏标准化元数据等问题。大鼠基因组数据库(RGD)PhenoMiner工具通过标准化和整合单个研究的数据,为这项工作迈出了第一步。我们的工作主要利用RGD中收集的数据,包括以下关键步骤:(i)我们开发了一个荟萃分析管道,自动整合来自异质来源的数据,并在不同实验条件下为不同菌株和表型生成预期范围(标准化表型范围);(ii)我们创建了工具来可视化单个菌株和菌株组的预期范围。我们开发了一个元分析管道和一个交互式web界面,总结并可视化了元分析管道产生的预期范围。管道的自动化允许在其他数据可用时进行更新。交互式网络界面为馆长和研究人员提供了一个平台,用于确定和验证各种定量表型的预期范围。数据分析结果和可视化工具将促进对大鼠疾病模型的理解,指导研究人员根据其研究需要选择最佳菌株,并鼓励不同研究中心的数据共享。这些资源也有助于促进研究的重复性。本项目中创建的互动平台将继续为翻译研究工作提供宝贵的资源。
介绍
模型生物
模型生物是生物医学研究的重要工具。利用模式生物进行的研究有可能揭示疾病的分子机制(1–5)在人类中。模型生物表型和基因型数据的大规模比较分析可以进一步揭示基因型与疾病之间的新关联(6–10). 这种分析在传统上并没有在人类中广泛进行。
褐家鼠160多年来,或实验室大鼠,已被广泛用作生理学、免疫学、肿瘤发生学、药理学、毒理学、营养学和行为研究的动物模型(11). 大量的大鼠品系已经培育出来,以展示常见疾病的表型,无论是自发的还是通过饮食、环境或其他条件的应用。2004年完成的大鼠基因组测序项目(12)极大地改变了研究范式,为鉴定大鼠疾病表型的基因和途径创造了难得的机会。大鼠研究的结果可以转化为人类的结果。
为了利用大鼠的力量进行此类研究,需要清楚地了解单个大鼠品系和常用对照品系的表型特征。表型是指个体在特定学习环境下可观察到的形态、生理和行为特征(13). 在个体的整个生命周期中,许多表型特征的严重性可能出现或消失,或增加或减少。表型变异是基因型的表达,或个体遗传结构和环境暴露的总和。数千种人类疾病与表型和遗传变异有关。在大鼠身上观察到的表型通常与在特定人类疾病中观察到的相似,研究人员将根据这些观察结果选择特定菌株作为疾病模型。然而,这些选择通常是基于以前的实验、研究人员对该菌株的熟悉程度或接触程度,或社区通常将其视为特定疾病的模型这一事实。此外,由于资源的限制,个别研究人员经常关注给定菌株中数量有限的表型,记录这些少数的值,而没有记录该菌株的综合表型图谱。
比较菌株之间表型值的统计分析通常在单个实验中完成。然而,与临床医生不同的是,大鼠研究人员在对单个菌株或基于多项研究的常用对照菌株进行定量表型测量时,没有获得综合预期(正常或异常)范围的好处。大量大鼠菌株的统计确定的定量表型谱的可用性将为研究人员提供为其研究选择最佳菌株所需的数据,并有助于识别具有与患有特定疾病的人类相似的谱的菌株。作为代表人类多样性的一种手段,越来越多地在表型和基因型方面使用不同的菌株组合。获得全面的定量表型图谱并与预期范围进行比较,将有助于组装此类菌株面板。
现有资源
已多次尝试整合小鼠和大鼠等模型生物的数量表型数据,以向研究人员提供跨实验的数据视图。目前用于大鼠的资源包括(i)日本国家大鼠生物资源项目(NBRP)的大鼠表型项目,(ii)PhysGen和PhysGen敲除项目,以及(iii)大鼠基因组数据库(RGD)PhenoMiner项目。日本NBRP的大鼠表型项目、PhysGen项目和PhysGen-Knockout项目包括一些最全面的鼠表型测量研究。
NBRP大鼠表型项目(http://www.anim.med.kyoto-u.ac.jp/nbr/phenome.aspx) (14)考虑到这些研究构建了具有相同数量动物(六只大鼠)和两性动物的测量组,这是对大鼠生理学的一个很好的参考。研究人员可以比较不同菌株的相同表型,并且可以通过使用相同数量的动物来控制研究之间的差异。此外,由于测量是在相同的条件和年龄下进行的,因此关于表型性别差异的结论将更容易得出。
然而,NBRP大鼠表型项目存在一些缺陷:(i)他们使用的动物数量(六只大鼠)很少,导致研究内方差相对较大;(ii)其他实验室可能无法使用NBRP使用的测量方法。因此,NBRP表型测量可能不具有代表性,使研究人员很难将自己的结果与NBRP测量结果进行比较;(iii)他们的项目是针对每个菌株的一次性工作。然而,由于环境的影响,即使是近交系大鼠也可能在其遗传结构或生理特性上发生漂移。这再次使得研究人员很难将自己的结果与NBRP测量结果进行比较。因此,必须持续测量大鼠的表型,然后将旧的测量值与新的测量值进行比较或组合。
威斯康星州医学院的PhysGen基因组应用程序利用各种近交系和交配系大鼠产生了大规模的表型数据。这些共群菌株的综合特征(434 845个生理数据点),每个菌株都携带一条来自已测序的Brown Norway菌株的染色体,可以在不需要遗传杂交的情况下立即将性状映射到特定染色体(15). 允许在PhysGen敲除程序中添加突变菌株体内研究基因在肺、心血管、血管和肾脏疾病中的作用。PhysGen项目的优势在于,它创建了一个联邦数据库,其中包含来自不同实验室的大鼠的精心测量以及对不同大鼠品系(近交系、突变系和交配系)的研究。PhysGen程序开发了网络工具,可以查询特定表型的实验。PhysGen网站通过统计分析显示了多个菌株的个体表型结果。它还提供了总结单个菌株的一般和表型数据的菌株概况(16).
然而,PhysGen数据表示有几个缺点:(i)web界面仅支持特定协议或实验中的查询,例如生化、心脏、肾和呼吸。然而,在多种方案中测量了一些表型。例如,因为静息心率高、心率变异性低的人患肾病的风险增加(17),“心率”是在心脏和肾脏测量的,这使得基于表型的比较和整合变得困难;(ii)缺乏可见的数据标准化过程,因此在这些数据点之后,所用大鼠的测量方法、实验条件和年龄仍不清楚。用户需要参考协议才能获得此信息。这再次使得很难真正比较来自不同来源和不同实验的数据。
RGD公司(rgd.mcw.edu公司)是实验鼠最全面的数据存储库和信息平台(18). RGD管理并整合来自已发表文献、个人研究项目以及基因组应用PhysGen计划的数据(19)和日本NBRP鼠群项目(14). 数据包括数百个菌株的菌株信息、数量性状位点(QTL)和实验表型测量。为了更好地管理和查询来自异构数据源的综合实验数据,RGD启动了PhenoMiner项目(https://rgd.mcw.edu/rgdweb/phenominer/home.jsp) (20). RGD网站上介绍了有关如何有效使用此数据库的视频教程(https://rgd.mcw.edu/wg/home/rgd_rat_community_videos/rgd-tool和网站-videos/),王在随附的论文中描述了新工具的更新等。(20)在这个问题上。
PhenoMiner的优点是(i)它使用本体论标准化了大鼠菌株的定量表型记录、临床测量、测量方法和实验条件[大鼠菌株本体论(RSO)](21)临床测量本体、测量方法本体和实验条件本体(22,23),分别];(ii)这种标准化允许整合大规模和小型表型项目的数据;(iii)用户可以从多个实验中查询和检索数据并可视化结果;以及(iv)用户还可以下载检索到的数据。
虽然PhenoMiner中的系统数据集成和可视化支持跨实验的定量表型比较,但当前PhenoMiner门户的缺点是其数据统计集成能力有限。使用标准化统计工具进行进一步的定量分析将为从疾病模型的角度理解大鼠菌株提供更多见解。此外,研究人员需要对总体菌株表型测量进行综合分析,以更好地了解跨菌株差异。目前,研究人员通常使用有限数量的实验数据点或根据可用性、先前使用或熟悉程度选择菌株作为疾病模型。多个单独菌株的定量表型的统计确定的预期范围的可用性,对于那些经常用作对照的菌株和一般大鼠,这将提高研究人员为其研究目的选择合适菌株的能力,并帮助他们检查可能导致测量变化的潜在因素。预期范围还将为不同实验室的实验结果提供标准解释。
动机和目标
因此,我们工作的动机是利用RGD中大量的定量表型数据来建立不同鼠种的预期范围。为了实现这一目标,我们的工作涉及以下关键步骤:(i)使用荟萃分析方法建立不同大鼠菌株的标准化表型范围,以及(ii)创建工具来挖掘和可视化单个菌株和跨菌株的数据。第一步,我们进行了荟萃分析,以有效地合成PhenoMiner数据库中存档的表型数据;根据菌株(近交/远交/同源/转基因/突变)、性别、年龄等对每个群体进行分层。;并产生重要生理表型(如心脏重量和收缩压)的可比预期范围。还将进行统计测试,以评估某些表型的不同菌株之间的差异。这项工作的结果将极大地有利于研究人员使用大鼠模型来确定合适的菌株、年龄、性别和所有相关参数。
材料和方法
荟萃分析是一个强大的工具,可以在多个实验中确定特定表型测量的预期范围。这种方法涉及统计技术,用于结合独立研究的测量值或结果,以获得对特定研究问题的见解。它通常通过结合来自几个随机对照试验的数据来评估临床治疗的有效性。它提供了治疗效果的精确估计,克服了检查单个研究时可能出现的偏差,并提供了实验数据的系统综合。最近的一项研究表明,大样本量的单实验室研究产生的结果更精确,但精确度较低,因此重现性较差(24). 相比之下,包括两到四个实验室的多实验室设计将覆盖率提高了42个百分点,而不需要更大的样本量。他们还证明了研究中的标准化是研究之间重复性差的主要原因(24).
作为荟萃分析的第一步,系统回顾方法至关重要。系统审查的目的是对现有研究进行平衡和公正的总结,从而能够综合所有相关研究的适当质量(25). 这强调了需要付出巨大的努力和谨慎,找到所有相关研究(已发表和未发表),并评估每项研究的设计和执行的方法质量(26). RGD的标准化和综合数据是系统管理实验表型测量的良好资源。它既包括来自当前生物医学文献中已发表研究的数据,也包括来自PhysGen等大鼠社区存储库的大规模数据(19)和鼠酚项目(14).
元分析不仅仅是一个单一的统计分析;在进行最终的统计荟萃分析之前,它涉及到初步分层、探索性决策(发表偏倚和敏感性分析)。RGD PhenoMiner数据分析管道由四个主要组件组成(图1). 在下面的部分中,我们将介绍管道中每个步骤的方法,以及相应的结果,因为每个步骤的结果都有助于确定下一步使用的方法。除了为每个组件开发算法外,还创建了一个用户界面,以便于确定适当的参数,并动态实现分析所需的工作流(下文将进一步详细介绍)。
图1
用于荟萃分析的系统管道。(1) 初步分层:根据初步分层选择表型测量子集,包括菌株(包括不同地点和亚系的近交相似菌株)、性别、年龄组和表型测量方法。(2) 发表偏见:一个关键问题是发表偏见,这是因为与那些强调支持假设的结果的实验相比,负面结果的实验不太可能被发表。我们使用漏斗图来检查任何出版偏见。(3) 敏感性分析:非系统性原因导致的数据质量较差通常是元分析中的一个问题,因此数据的选择、包含和整合(或人口分层)是需要考虑的重要因素,可以通过敏感性分析完成。(4) 荟萃分析结果摘要:结果将显示在森林地块中。这个x个-轴是测量值或效果大小。每个基准面都显示为一个斑点或正方形。斑点或正方形的大小与样本大小成正比。通过每个研究的正方形中心画一条表示95%置信区间的水平线,以表示测量的不确定性。
初步分层
首先,有必要根据初步分层选择表型测量的子集,包括菌株(包括不同地点和亚系的相似菌株)、性别、年龄组和表型测量方法。图2显示了为动态执行初步分层步骤而创建的界面。菌株和表型测量方法的选择取决于所分析的主要表型。年龄组划分由专家对年轻、成年和老年大鼠的启发式定义决定。然而,对于不同的表型,幼鼠和成年鼠年龄组可能具有非常不同的表型测量值,这总是导致高度异质性并影响荟萃分析质量。因此,年龄组划分是一种数据驱动的启发式评分,专家输入提供了预先定义。
图2
PhenoMiner体重初步分层。创建接口是为了动态地进行初步分层步骤。菌株和表型测量方法的选择取决于所分析的主要表型。年龄组划分由专家对年轻、成年和老年大鼠的启发式定义决定。年龄组划分可以不同。例如,对于体重而言,20-79天和80-99天可能是划分幼年和成年大鼠的好方法,但对于其他心血管表型而言,20-69天和70-99天是划分幼鼠和成年大鼠类的好方法。
漏斗图的出版偏倚
由于本研究中包含的大部分数据来自已发表的研究,一个关键问题是发表偏见,这是因为与那些强调支持假设的结果的实验相比,负面结果的实验不太可能发表(27). 漏斗图可用于评估出版偏差的存在(28)通过将meta分析中包含的研究显示在测量值或效应大小(在统计分析部分中详细解释)与样本大小或另一种精度度量的图中(29,30). 预期图片应为对称倒漏斗(31). 这与较小的研究比较大的研究更有可能发生变异的假设相一致。图1和2英寸(32)是对称和非对称漏斗的示例。不对称图表明(i)较小的研究表明可能没有遗漏任何影响,或(ii)较小的研究往往具有较大的影响大小(33). 第一条揭示了真实的出版偏见,而第二条则没有。由于对不对称性的适当解释存在争议,因此对漏斗图的使用也存在争议(34–36). 例如,研究人群的真实异质性(由于具有不同干预效果的亚组)将导致漏斗图不对称(36). 此外,由于生物医学领域的大多数荟萃分析中包含的研究很少,机会对于解释漏斗图不对称性也至关重要(37). 因此,在得出出版偏见的结论之前,我们需要仔细研究(38).
1997年,艾格等。(28)提出了一种用于可视化漏斗图中不对称性的估计器。除了对不对称性进行简单的可视化之外,他们还使用回归测试来定量测量不对称性。回归测试是归一化效应大小估计值(值/SD)与精度(1/SD)的线性回归。回归测试的假设是,一组均匀的试验(没有发表偏倚)将向穿过原点(截距,0)的直线回归,斜率表示影响的大小和方向(39). 当回归线穿过原点时,它表示一个对称的漏斗图。然而,Egger测试的假阳性率相对较高(I型错误率较高)。
不对称得分是指回归线的截距与被分析组测量值的平均值之比(图3):|$\mathrm{Asy}=\frac{\mathrm{intercept}}{\mathr{average}\_\mathrm-value}}$|.
图3
公布体重偏差检查演示。回归测试是归一化效应大小估计值(值/SD)与精度(1/SD)的线性回归。当回归线穿过原点时,它表示一个对称的漏斗图。不对称得分是指回归线的截距与被分析组测量值的平均值之比。
荟萃分析质量控制的最佳实验次数
为了确保荟萃分析的质量,我们需要为我们的荟萃分析模型分配一个置信水平(这里我们使用了一个值为“置信”和“低置信”的二元参数),并在给定一组特定表型测量数据的情况下得出结果(在单个荟萃分析中)。虽然每个荟萃分析都基于一个独特的表型-菌株对,但对于不同的表型-菌种对,实验总数可能会有显著差异。因此,我们检查了发表偏倚分析中的不对称得分(Asy)与实验总数(在单个荟萃分析中)之间的关系,以确定我们分析中的潜在偏倚。下面的示例使用了体重数据(图4). 结果表明,使用四或在一个荟萃分析中进行多个实验。
图4
不对称评分与体重实验总数的关系。虽然每个荟萃分析都基于一个独特的表型-序列对,但对于不同的表型-队列对,实验总数可能会有显著差异。上述结果表明,不对称评分(Asy)随着四或在一个荟萃分析中进行多个实验。
我们还研究了范围分布及其与实验总数的关系(在一项荟萃分析中)。图4表明不同meta分析数据集的数据范围也会随着每个meta分析的实验总数而变化。范围定义为所有研究的最大值与所有研究的最小值之间的差异。对于实验较少的荟萃分析,研究之间的范围可能会错误地小。这表明,没有足够实验的荟萃分析可能会有虚假的负异质性表征(异质性未被揭示),因此荟萃分析模型的选择可能是错误的(固定效应或随机效应)。
森林样地敏感性分析
非系统性原因导致的数据质量较差通常是荟萃分析中的一个问题,因此数据的选择、纳入和整合(或人口分层)是需要考虑的重要因素。这些决定可能会影响主要发现,因此研究人员通常在整合数据之前进行一些敏感性分析。敏感性分析中显示数据的常用方法是绘制森林图。这显示了每个单独研究的结果,使用斑点或正方形(40); 这个x个-轴是测量值或效果大小。斑点或正方形的大小与样本大小成正比。通过每个研究的正方形的中心绘制一条代表95%置信区间的水平线,以表示测量的不确定度。荟萃分析结果显示为菱形。
在探索研究队列的森林样地后,可以通过改变整合方法(或人口分层)来改变主要发现。有效的敏感性分析将探索排除各类研究的效果,例如异常数据(出于正当理由,需要排除异常数据)、没有特定性别信息的数据或未发表研究的数据。它还可以检查不同亚组之间结果的一致性(可能由受试者人群分层、测量方法或条件的类型定义)。
有用的敏感性分析是一系列重复的荟萃分析,通常一次省略一项研究。计算异质性得分,并根据异质性得分选择元分析模型(固定效应或随机效应)。Bax的这种“排除敏感性图”等。(41)揭示对荟萃分析结果有特别大影响(离群值)的任何研究/观察。我们工具中的交互式界面为用户提供了在进行分析的下一步之前决定是否将任何研究/观察纳入荟萃分析的能力。此外,管道用户可以在其数据中确定子组,并可以通过排除一组研究/观察结果和创建新的分层标准来决定采用修改的敏感性分析。例如,用户可能会发现子串a/X和a/Y具有不同的表型T测量值。用户可能希望使用子串特征进一步分层人群,而不是使用菌株A的所有数据分析表型T。经过初步分析,我们发现异常值的较大值是由于样本年龄所致。就体重而言,65天可能不是年轻大鼠组的同质组成员,尽管它可能对另一种表型是可以接受的。
统计荟萃分析
科克伦Q表示异质性
在荟萃分析中,我们需要评估不同研究的结果是否可以“组合”。这包括检查异质性。通常用于测试异质性的统计数据包括基于χ的Cochrane Q2测试和我2统计的。Cochrane的Q检验旨在提供不同测量值之间的标准化异质性比较,类似于t吨-测试。但这并不令人满意,因为它在很大程度上依赖于测量尺度,并且没有用于比较的绝对解释。因此我2统计更具吸引力,因为它的异质性得分在0%到100%之间,25%对应低异质性,50%对应中等异质性,75%对应高异质性(42). 它解释了研究间异质性导致的总方差的百分比。然而,当异质性实际存在时,这两种方法有时可能无法检测到异质性(43). 此外,荟萃分析参数非常依赖于数据;我们提出了一种可视化方法来为特定数据集找到最佳的截止阈值。
如果亚群体的研究结果相对一致,我们可以使用一般的荟萃分析方法(固定效应模型)整合结果。如果存在异质性,我们可以根据概念分层方法(例如,根据年龄和性别分层)或使用随机效应模型元分析对当前的子人群进行进一步分层。如果异质性纯粹是由研究之间的系统差异引起的,那么我们需要定义特殊的统计参数(随机效应模型中使用的研究间方差)来解释结果的系统异质性。
我2统计截止阈值
在前一步中,当实验总数低于四个时,我们决定排除或降低荟萃分析的置信度。在这一步中,我们需要确定我2统计来决定每个meta分析的模型选择。在中的示例中图5,我们可以看到我2 =0.85(用红线表示)是分离高异质性和低异质性数据集的最佳截止阈值。中的四个象限图5表示每个meta分析任务的数据集的不同特征。象限1(右上角)表示高度不对称分数和高度异质性,这可能是由出版物偏见或真实异质性(例如极端离群值)引起的。象限2代表高不对称分数和低异质性,这可能表明真实的出版偏见。象限3代表低不对称分数和低异质性,这表明我们应该选择固定效应模型。象限4代表低不对称分数和高异质性,这表明我们应该选择随机效应模型。从这个总图中,我们可以确定象限3和象限4中数据的模型选择。对于象限1和象限2中的数据,在得出任何结论之前,我们需要进一步确认出版偏见的存在。
图5
体重数据不同荟萃分析结果的不对称评分和I2统计散点图(x个:不对称得分;年:I2统计)。四个象限代表每个荟萃分析任务的数据集的不同特征。象限1(右上角)表示高度不对称分数和高度异质性,这可能是由出版物偏见或真实异质性(例如极端离群值)引起的。象限2代表高不对称分数和低异质性,这可能表明真实的出版偏见。象限3代表低不对称分数和低异质性,这表明我们应该选择固定效应模型。象限4代表低不对称分数和高异质性,这表明我们应该选择随机效应模型。从这个总结图中,我们可以确定我2 = 0. 85(由红线表示)是分离高异质性和低异质性数据集的最佳截止阈值。
固定效应模型与随机效应模型
异质性的存在或缺失会影响后续的分析方法。如果不存在异质性,则分析采用固定效应模型。这假设所有研究中的系统效应大小是固定的,研究之间的变化是完全随机的。然而,由于研究的规模和方差通常不同,因此每项研究被认为具有不同的精度。在荟萃分析中,关键概念是在综合结果时为每个研究分配权重。统计学家普遍认为,基于100名受试者的研究比基于10名受试对象的研究提供了更“准确”的估计。因此,与较小的研究相比,较大的研究在分析中应具有更大的“权重”。这种基于样本大小的方法很简单。更好的方法是通过逆方差来分配权重(|${w} _ i=\frac{1}{{{\mathrm{s}}_{\mathr{i}}^2}$|).因此,荟萃分析的平均值为|${\mathrm{m}}_{\mathrm{w}}$|=|$\sum_{\mathrm{i}}{\mathr m{w}}{!\大/\!\求和$|和方差|$\operatorname{var}\Big({\mathrm{m}}_{\mathrm{w}}\Bing)=1\!\大/\!\sqrt{\sum{\mathrm{i}}{\mathr{w}}{.
理想情况下,人口分层应该足以消除异质性,并且我们应该能够使用上述固定效应模型构建我们的元分析模型,并使用负方差。
另一种更常用的方法是采用随机效应模型。随机效应模型假设治疗效果因研究而异。观察到的测量|${\mathrm{y}}_{\mathrm{i}}$|,来自我-该研究由两个附加成分组成:真实测量,|${\theta}_{\mathrm{i}$|,以及采样误差,|${\mathrm{e}}_{\mathr{i}$|也就是说,|${\mathrm{y}}_{\mathr{i}}$|=|${\theta}_{mathrm{i}}$|+|${\mathrm{e}}_{\mathr{i}}$|i=1,…,k|${\mathrm{e}}_{\mathr{i}$|,可以通过以下公式进行估算|${{\mathrm{s}}_{\mathrm{i}}^2$|此外,公式中必须考虑研究间方差。DerSimonian和Laird于1986年提出了第一个也是最广泛采用的荟萃分析随机效应模型(44). 这种方法现在被认为是医学和临床研究中荟萃分析的“标准方法”。在他们的模型中,他们还采用了反方差权重。然而,总方差是研究中方差的总和(|${{\mathrm{s}}_{\mathr{i}}^2$|)和研究间方差(|${\tau}^2$|),导致重量为|${w}_{\mathrm{i}}=\frac{1}{\tau^2+{\mathr{s}}_{\mathm{i}{^2}$|.|${\tau}^2$|我们分析中使用的是来自DerSimonian和Laird的(44)非迭代估计。
元分析工作流
前面的部分描述了我们用于确定元分析工作流中参数的分析方法。工作流的决策树如所示图6.
图6
元分析工作流。总之,我们的工作流程由以下关键步骤组成:(a)按年龄、性别、方法和实验条件进行初步分层。(b) 进行探索性分析,检查发表偏倚和实验总数。(c) 进行探索性分析,以确定纳入/排除荟萃分析中的个别研究/观察。(d) 利用基于χ的Cochrane Q检验异质性2测试和我2统计的。(e) 固定效应和随机效应模型选择阈值设置为我2=0.85,这被认为是区分由有限记录数或真实研究间方差引起的异质性的最佳阈值。(f) 分析中表型的所有汇总值均显示在汇总森林图中。
总之,我们的工作流程由以下关键步骤组成:
i.按年龄、性别、方法和实验条件进行初步分层(图6a).
ii、。执行探索性分析(图6b)检查发表偏倚和实验总数。为了检查发表偏倚,我们使用了原始的Egger检验,考虑了功率和I型错误率之间的权衡|不对称得分|>1.5或实验总数<4是潜在偏差样本的标志。因此,荟萃分析的结论可能不可信。为了进行分析,我们需要获取更多数据。
iii.进行探索性分析(图6c)确定meta分析中个人研究/观察的纳入/排除。
iv.异质性检查(图6d)使用基于χ的Cochrane Q统计2测试和我2统计的。对于每组符合荟萃分析条件的实验,我们计算了Q和我2,用于确定下一步的模型选择。
v.选择荟萃分析模型(固定效应或随机效应)。固定效应和随机效应模型选择阈值设置为我2=0.85,这被认为是区分由有限记录数或真实研究间方差引起的异质性的最佳阈值。
vi.分析中表型的所有汇总值均显示在汇总森林图中(例如,参见图7). 方框的中心表示荟萃分析平均值和由荟萃分析值上下一个标准偏差确定的范围。盒子的颜色显示了组成荟萃分析范围的实验总数。这是结果表型范围的信心标志。右侧的图例显示了范围所代表的品种和性别。在括号中,我们还注意到考虑到实验总数的分析置信水平(<4,低置信;≥4,置信)。
结果
分析管道用作管理工具,因此无法公开。预期范围工具(https://rgd.mcw.edu/rgdweb/peonminer/phenminerExpectedRanges/views/home.html)可以从RGD主页上的表型和模型图标访问。我们决定将重点放在心血管领域的用例上,因为大鼠主要用于心血管研究。我们的荟萃分析提供了24种心血管相关表型的预期范围。我们分析了所有可用的菌株,每个表型都有完整的基因组序列。就非序列菌株而言,我们主要关注MWF,因为大多数非序列菌株对这些表型区域的可用数据有限。
图7
(a) “收缩压”荟萃分析总结的森林图。方框的中心表示荟萃分析平均值和由荟萃分析值上下一个标准偏差确定的范围。盒子的颜色显示了组成荟萃分析范围的实验总数。这是结果表型范围的信心标志。右侧的图例显示了范围所代表的品种和性别。在括号中,我们还注意到了考虑实验总数的分析置信水平(<4,low_confidence;≥4,confidence)。(b) 不同性别具有不同指示形状的森林图。用户可以在(a)和(b)之间选择显示。
在第一步中,我们的荟萃分析仅使用了近交种控制条件下的实验记录。这样,荟萃分析范围可以被视为特定菌株或菌株组的“预期范围”。一种类型的菌株群是通过根据RSO将所有子系分组到某个亲本菌株名称下而创建的。根据官方标准,当一个菌株在不同的设施或实验室中繁殖20代或20代以上时,它会被赋予子系名称。例如,应变组“ACI”包括子串“ACI/Eur”、“ACI/Kun”、“AC I/N”、“ACI/SegHsd”、“ACI/Ti”和“ACI/Ztm”。对照菌株组也是根据其作为对照动物的广泛使用以及作为正常测量值的接受程度而创建的。例如,“正常收缩压应变组”由被视为在血压实验中常用作对照的应变组成,并显示出“正常收缩血压”。“正常收缩压菌株组”是由在大规模表型项目中具有丰富经验的领域专家通过迭代过程创建的:(i)根据经验和先前知识确定常用作对照的菌株,并指定为“创始对照菌株”,例如。长期用作控制模型的BN和WKY。(ii)根据这些“创始”菌株的表型范围,使用之前确定的每个菌株的预期范围的最高和最低值,构建初始“预期范围”。(iii)检查先前确定的其他菌株的预期范围与该初始“对照预期范围”的重叠,以确定是否可以将其他菌株纳入正常表型菌株组。(iv)使用添加到正常表型菌株组的所有菌株构建更新的“控制预期范围”。
除了构建一般的“预期范围”外,当数据适用于不同的年龄、性别或方法时,我们还按年龄、性别和测量方法对分析进行了分层。然后,我们使用相同的工作流程构建了特定于年龄、性别和方法的“预期范围”。构建表型“预期范围”的结果将在下文第一节中讨论。
在使用自交系构建了24个表型的初始“预期范围”之后,当有足够的数据时,我们还对远交系和突变系进行了荟萃分析。我们还评估了在非对照条件下使用近交系进行分析的适用性,在该近交系中,以测量的食盐为实验条件。为特定实验条件创建这样的预期范围将进一步帮助研究人员为特定实验选择模型菌株,并为开发工具和统计过程提供数据,使他们能够分析自己的数据。
表型数据可用于近交系、系外系、同源系、同源系、突变体和转基因菌株。然而,对于本研究,算法和工作流程的初始开发以及表型的预期范围仅使用近交系建立。此外,本研究最初并未使用表型记录,其中的实验条件相当于“幼稚对照”,而涉及实验饮食、运动、药物或化学品的应用或其他操作条件的表型记录。图7显示了为不同年龄组的“收缩压”生成的森林图摘要的示例。然后,我们能够从图中识别出预期范围在或重叠先前构建的“控制预期范围”内的菌株(ACI、BN、BUF、DA、F344、GK、LE、LEW、LN、M520、MNS、MR、MWF和WKY),以及预期范围超出构建的“控制预期范围”的菌株(GH、LH、MHS、SHR和SHRSP)。图9显示了在原始控制条件下,超亲和突变菌株的“收缩压”表型预期范围。
图8
RGD表型预期在幼稚对照条件下,远交株和突变株的“收缩压”范围。虚线表示基于14个用作该表型对照的近交系的“对照菌株组”的预期范围。
图9
“收缩压”总结显示,性别模式并不总是正确的:SHRSP的性别特异模式与常见模式相反,因为女性SHRSP发病率较高。另一方面,SHR表现出共同的模式。
补充信息我包括24种心血管表型的所有荟萃分析摘要(血红蛋白水平、舒张压、左心室重量与体重比、左心室湿重、心率、右心室重量与左心室重量比、右心室湿重,心脏重量占体重的百分比、心脏重量与体重的比率、心脏湿重、红细胞压积、,平均动脉血压、平均红细胞体积、血浆总胆固醇水平、血浆甘油三酯水平、红细胞计数、血清天冬氨酸转氨酶活性水平、血清钙水平、血清氯化物水平、血清游离脂肪酸水平、血清钾水平、血清总胆固醇水平和血清甘油三酸酯水平、,收缩压)。有关24种表型的异常、正常和幼稚对照菌株的信息,请访问补充信息二.
如果在“所有年龄”分析中观察到显著的年龄或性别差异,我们还为不同年龄组(年龄1:<70天,年龄2:70-99天,年龄3:100+天)和性别组创建了单独的摘要。例如,在图7男性和女性之间的收缩压不同,并显示出明显的模式(通常女性血压较低)。经过分析,我们决定,我们应该为性别和每个年龄组制作一份单独的摘要。同样的情况也适用于舒张压、心脏重量占体重的百分比、心脏重量与体重的比率、心率、心脏湿重和平均动脉血压等表型。这些表型有足够的年龄和性别分层数据,同时仍能产生有意义的荟萃分析结果。与心室重量和血液代谢物测量相关的表型缺乏分层数据(即右心室重量与左心室重量比、右心室湿重、血浆总胆固醇水平、血浆甘油三酯水平、血清天冬氨酸转氨酶活性水平、血清钙水平、血清氯化物水平、血清游离脂肪酸水平和血清钾水平只有一个年龄组的数据)。
一位领域专家对荟萃分析的结果进行了审查,该专家此前曾根据作为对照菌株和非对照菌株的广泛使用和特征,将菌株分类为可能在“正常”预测参考范围内和“正常”以外的菌株。荟萃分析结果与领域专家的分类之间存在分歧。通过比较专家分类(“正常”和“正常”之外的分类)和我们的工具提供的分类结果来确定分歧。一致同意的案例百分比计算为98%(补充信息三). 分歧的一些可能原因可能是(i)缺乏某些菌株的数据,(ii)发表偏见(例如,传统高血压菌株的测量结果可能会偏向于更高的血压)和(iii)某些菌株固有的(菌株的表型通过多代近交漂移)。
我们还发现,对于一些被认为表现出“正常”表型的菌株,尽管meta分析平均值在总体预期范围内,但其单个范围的上限或下限超出了“正常”的总体预期范围,这可能表明(i)需要更多研究所提供更多数据,才能对个体预期范围得出更可靠的结论,或者(ii)这些菌株群的变异可能是由于潜在的遗传漂变,从而使亚系的基因型变得更加多样化,或者(iii)某些菌株可能更容易受到外界影响,例如住房,处理者和其他环境因素对表型的影响。例如,ACI_Female、BUF_Male和WAG_Female/Male/Beath图7我们还发现,男性和女性之间的常见模式(即女性血压较低)有时并不成立。例如,在图9SHRSP的性别特异性模式与常见模式相反,因为女性SHRSP发病率较高。另一方面,SHR表现出共同的模式。
超出总体预期范围或表现出奇怪模式的汇总数据通常来自实验数量有限的荟萃分析(通常<5)。这表明荟萃分析结果的可信度较低,这表明需要更多的实验数据来确定可信范围。这也证明了对于荟萃分析来说,研究的数量对于消除随机实验错误和产生可信的结果至关重要。总的来说,研究数量比每个研究中的动物数量更重要。我们的分析方法证明了其潜力,可用于(i)提供大鼠表型的预期范围,以及(ii)通过可视化当前差距并提出填补差距的潜在研究方向来促进研究规划。此外,我们的工具可以潜在地用于(i)数据管理质量控制(通过对图7馆长可以识别出明显错误的结果)和(ii)发表偏倚检查,这可以促进更好的研究行为并确保协议的一致性。
从该管道创建的一个用例资源将用于高血压研究。由于高血压有几种亚型,研究人员可能只对收缩压升高而舒张压正常的高血压感兴趣。研究人员可以参考RGD网站上的两个预期范围表,发现在所有高血压菌株(GH、LH、MHS、SHR和SHRSP)中,MHS的舒张压接近正常范围,因此在这种情况下,MHS将是更好的选择。
结论
我们成功地实现了一个带有用户界面的分析管道,以生成表型的预期范围。管道和接口提供了以下方法:(i)通过定制用户请求确定预期范围,(ii)在没有足够数据来确定预期范围的情况下确定表型,以便通过与研究人员直接接触或从已发表的文献中摘录来优先获取这些表型,以及(iii)提醒RGD工作人员PhenoMiner中的新表型数据和预期范围内的潜在变化,以便可以运行管道以使用最新可用数据更新预期范围。
基于该项目的成功,RGD将进一步开发一个精确模型门户网站,以展示这些数据并链接到其他人,为研究人员提供丰富的资源。本研究的结果将用于数据采集和分析的表型区域。目标是提供基于所有主要生理系统表型预期范围的综合概况。许多菌株序列和变异数据的可用性将为提供与表型图谱互补的基因型图谱提供机会,以提高研究人员基于基因型和表型选择模型的能力。
利益冲突。未申报。
数据库URL:网址:https://rgd.mcw.edu/
工具书类
1霍达
,首席执行官。
,Kljuic公司
,答:。
,奥肖内西
,R。
等(
2004
)披针形毛鼠表型是由桥粒蛋白4基因钙协调位点的错义突变引起的
.基因组学
,83
,747
–756
. 2施泰尼格尔
,B。
,斯特林
,O。
,斯克里巴
,答:。
等(
2001
)大鼠单核细胞在急性移植排斥反应中的表型和功能
.免疫学。版次。
,184
,38
–44
. 三。罗查
,R。
,鲁道夫
,A.电子。
,弗里迪奇
,通用电气公司。
等(
2002
)醛固酮诱导大鼠心脏血管炎症表型
.美国生理学杂志。心。循环。生理学。
,283
,H1802型
–H1810型
. 4.蒙特
,医学博士。
,巴迪亚
,医学博士。
,塞拉诺
,文学硕士。
等(
2001
)杂交WIF-B9细胞合成胆汁酸代谢途径中人与大鼠表型的优势
.生物化学。生物物理学。《学报》。
,1534
,45
–55
. 5Szyf公司
,M。
,织布工
,内部控制。
,香槟
,联邦航空局。
等(
2005
)通过DNA甲基化对大鼠类固醇受体表达和表型的母体编程
.前面。神经内分泌。
,26
,139
–162
. 6格雷戈里
,S.G.公司。
,施密特
,美国。
,塞斯
,第页。
等(
2007
)白细胞介素7受体α链(IL7R)显示与多发性硬化症的等位基因和功能关联
.自然遗传学。
,39
,1083
–1091
. 7.哈吉里
,T。
,汉族
,X。X。
,博宁
,答:。
等(
2002
)脂肪酸摄取缺陷对CD36-null小鼠胰岛素反应性和饮食代谢反应的调节
.临床杂志。投资。
,109
,1381
–1389
. 8横井
,N。
,科米达
,英国。
,王
,H.-Y.公司。
等(
2002
)Cblb是大鼠1型糖尿病的主要易感基因
.自然遗传学。
,31
,391
–394
. 9麦克默里
,A.J.公司。
,莫拉莱霍
,D.H.公司。
,奎特克
,A.电子。
等(
2002
)1型糖尿病BB大鼠模型中的淋巴细胞减少是由于一个新的免疫相关核苷酸(Ian)相关基因突变所致
.基因组研究。
,12
,1029
–1039
. 10罗盛中
,第页。
,霍姆伯格
,J。
,托德森
,J。
等(
2003
)大鼠关节炎严重程度调节基因Ncf1的定位鉴定
.自然遗传学。
,33
,25
–32
. 11雅各布
,H.J.公司。
(
1999
)功能基因组学和大鼠模型
.基因组研究。
,9
,1013
–1016
. 12吉布斯
,注册会计师。
,温斯托克
,总经理。
,梅兹可
,英里/小时。
等(
2004
)Brown Norway大鼠的基因组序列揭示了哺乳动物的进化
.自然
,428
,493
–521
. 13史密斯
,C.L.公司。
和Eppig公司
,J.T.公司。
(
2012
)哺乳动物表型本体作为实验和高通量表型数据的统一标准
.妈妈。基因组
,23
,653
–668
. 15考利
,答:。
,梁
,M。
,古罗马的
,R。
等(
2004
)生理基因组学的大鼠模型系统
.《学报》。Physiol扫描。
,181
,585
–592
. 16德温内尔
,M.R.公司。
(
2010
)了解老鼠生理学的在线工具
.简介。生物信息。
,11
,431
–439
. 17小川
,英国。
,石原
,R。
,前田
,T。
等(
2009
)心率变异性对肾衰竭血液透析患者的预后价值
.国际心脏病杂志。
,131
,370
–377
. 18下山县
,M。
,De Pons公司
,J。
,海曼
,G.T.公司。
等(
2014
)2015年大鼠基因组数据库:基因组、表型和环境变异与疾病
.核酸研究。
,43
,D743号
–D750型
.. 20王
,S.-J.公司。
,劳勒德金
,S.J.公司。
,海曼
,G.T.公司。
等(
2015
)PhenoMiner:实验室大鼠的定量表型数据库,褐家鼠.在高血压和肾脏疾病中的应用
.数据库(牛津)
,2015
,鲍128
. 21尼日利亚
,R。
,蒙森梅尔
,D.H.公司。
,沃西姆
,E.A.公司。
等(
2013
)大鼠菌株本体:结构化受控词汇,旨在促进RGD菌株数据的访问
.J.生物识别。语义学。
,4
,1
. 22下山县
,M。
,尼日利亚
,R。
,麦金托什
,L.S.公司。
等(
2012
)定义表型测量数据的三个本体
.前面。基因。
,三
,87
. 23史密斯
,J.R.公司。
,公园
,首席执行官。
,尼日利亚
,R。
等(
2013
)临床测量、测量方法和实验条件本体:扩展、改进和新应用
.J.生物识别。语义学。
,4
,1
. 24.沃尔克尔
,B。
,沃格特
,L。
,塞纳
,E.S.公司。
等(
2018
)临床前动物研究的再现性随着研究样本的异质性而提高
.《公共科学图书馆·生物》。
,16
,e2003693。 25Bailar公司
,《印度货币学协会期刊》。
(
1997
)meta分析的前景和问题
.北英格兰。医学杂志。
,337
,559
–561
. 26莫罗
,客户尽职调查。
(
1994
)系统审查的理由
.BMJ公司
,309
,597
. 27桑顿
,答:。
和李
,第页。
(
2000
)荟萃分析中的发表偏倚:原因和后果
.临床杂志。流行病。
,53
,207
–216
. 28艾格
,M。
,史密斯
,总直径。
,施耐德
,M。
等(
1997
)通过简单的图形测试检测到的荟萃分析中的偏差
.BMJ公司
,315
,629
–634
. 29Sterne公司
,联合国。
和艾格
,M。
(
2001
)荟萃分析中检测偏差的漏斗图:轴选择指南
.临床杂志。流行病。
,54
,1046
–1055
. 30彼得斯
,法学博士。
,萨顿
,A.J.公司。
,琼斯
,D.R.公司。
等(
2006
)meta分析中两种检测发表偏倚方法的比较
.日本汽车制造商协会
,295
,676
. 31艾格
,M。
和史密斯
,总直径。
(
1995
)误导性荟萃分析
.BMJ公司
,311
,753
. 32斯特恩
,联合国。
,萨顿
,A.J.公司。
,约安尼迪斯
,J.P.公司。
等(
2011
)在随机对照试验的荟萃分析中检查和解释漏斗图不对称性的建议
.BMJ公司
,343
,d4002型
. 33斯特恩
,联合国。
,艾格牌手表
,M。
和史密斯
,总直径。
(
2001
)调查和处理荟萃分析中的出版物和其他偏见
.英国医学杂志。
,323
,101
. 34刘
,J。
,约安尼迪斯
,注册会计师。
,泰兰
,N。
等(
2006
)误导性漏斗图案例
.BMJ公司
,333
,597
–600
. 35泰兰
,N。
,施密德
,C.H.公司。
和刘
,J。
(
2005
)在漏斗图的实证评估中,研究人员无法直观地识别出版偏见
.临床杂志。流行病学。
,58
,894
–901
. 36约安尼迪斯
,注册会计师。
(
2008
)荟萃分析中异质性和偏差测试的解释
.J.评估。临床。实际。
,14
,951
–957
. 37斯特恩
,亚洲期刊。
,加瓦根
,D。
和艾格
,M。
(
2000
)荟萃分析中的出版和相关偏见:统计检验的力量和文献中的流行率
.临床杂志。流行病。
,53
,1119
. 38刘
,J。
,约安尼迪斯
,J.P.公司。
,泰兰
,N。
等(
2006
)误导性漏斗图案例
.BMJ公司
,333
,597
–600
. 39加尔布雷斯
,钢筋混凝土。
(
1988
)关于几个临床试验中估计优势比的图形表示的注释
.统计医学。
,7
,889
–894
. 40刘易斯
,美国。
和克拉克
,M。
(
2001
)林地:试图看到树林和树木
.英国医学杂志。
,322
,1479
. 41Bax公司
,L。
,于
,L.M.有限公司。
,池田
,N。
等(
2006
)MIX的开发和验证:因果研究数据荟萃分析的综合自由软件
.BMC医学研究方法。
,6
,50
. 42希金斯
,J。
和汤普森
,S.G.公司。
(
2002
)荟萃分析中异质性的量化
.统计医学。
,21
,1539
–1558
. 43埃万耶卢
,E.公司。
,约安尼迪斯
,J.P.公司。
和帕索普洛斯
,不适用。
(
2007
)荟萃分析中异质性估计的不确定性
.BMJ公司
,335
,914
–916
. 44德西蒙阶
,R。
和莱尔德
,N。
(
1986
)临床试验的荟萃分析
.控制。临床。试验
,7
,177
–188
.
©2019年作者。牛津大学出版社出版。