多样性、祖先和坚韧的种族概念:GA4GH的GigaScience

GA4GH增加了多样性多样性、祖先和坚韧的种族观
全球基因组学与健康联盟(GA4GH公司)是一个制定政策和技术标准的组织,致力于在人权框架内实现负责任的基因组数据共享。Giga科学组织成员,他们的会议经常与美国遗传学会的会议同时举行,该学会有时也会参与这项倡议(参见在GigaBlog上写文章). 今年的GA4GH第八届全体会议是一次虚拟会议,来自60多个国家的230多名与会者于2020年9月29日和30日举行。Giga科学数据科学家克里斯·阿米特(Chris Armit)出席了关于为什么基因组数据的多样性是一个热门且有争议的话题的讲座和报告。多样性是今年全体会议的一个重要议题,虚拟会议是增加全球声音和参与的一种特别有用的方式。

查尔斯·罗蒂米NIH的创始人非洲人类遗传学学会,发表了题为“基因组科学的多样性:科学和社会正义的迫切性”的特别开幕式主题演讲。正如查尔斯解释的那样,在探索多样性时,“非洲是一个很好的起点”。“作为一个物种,大约99%的人类进化经历是在非洲度过的,大约10万年前,一些人移居到世界其他地方。这段共同的历史就是为什么世界各地的人类分享了我们99%以上的遗传基因”。Charles进一步解释了瓶颈效应,这是这次非洲外移民的一个关键特征,即具有显著遗传变异的父母群体仍然留在非洲。查尔斯强调,“非洲是研究这些变异的唯一地方”,人类遗传学将从非洲人口抽样中获得巨大收益。

查尔斯·罗蒂米在其主题演讲中强调了非洲人口的基因组多样性。

在一项关于非洲致病性和临床相关变异的引人入胜的研究中,Charles强调疾病是基因组水平人群变异的强大驱动因素。举一个例子说明,镰状细胞病是非洲人群中普遍存在的一种常染色体隐性遗传疾病。这里的概念是遗传权衡,因为镰状细胞特性的杂合携带者对疟疾具有保护优势。这解释了为什么这种特性在疟疾流行地区很常见。正如Charles所解释的,还有其他例子,编码血清因子APOL1的基因变异与非洲人群的肾脏疾病有关。APOL1是一种血清因子,可以裂解单细胞锥虫,并防止致命的非洲昏睡病。这似乎是另一个遗传权衡,因为在约鲁巴人中流行的APOL1变异体SNP rs73885319与肾脏疾病的高风险相关。Charles进一步解释了移植过程中APOL1基因座变异的社会影响,因为拥有两个APOL1变异拷贝的个体作为肾脏捐赠者也会有很高的失败风险。

作为遗传学如何帮助我们了解非洲热带病的另一个例子,查尔斯提供了一个关于足粪病这种被忽视的疾病是一种非丝虫性象皮病,它不是由病原体感染引起的,而是赤脚长期暴露在火山岩形成的红粘土中的反应。足孢子虫病具有高度的遗传性,HLAⅡ类基因座变异之间的全基因组关联(GWAS)表明该病可能是T细胞介导的炎症性疾病。这些宝贵的见解将帮助我们了解非洲人口的疾病易感性以及非洲人口的基因流动。

基因组数据多样性的重要性

在这次主题演讲之后,举行了关于“基因组数据多样性的重要性”的小组讨论。爱丽丝·波佩霍伊(斯坦福大学)解释说,“没有对多样性衡量标准的标准定义”,并进一步解释了种族、族裔和祖先等有问题的概念。遗传学家和生物医学科学家主要对祖先感兴趣,祖先是DNA的生物遗传,可以使用基因型数据通过基因组进行追踪。然而,在美国,患者经常被邀请宣布其种族归属,这是一种社会政治分类机制,正如爱丽丝解释的那样,“通常与地位和权力有关”。在欧洲国家,患者经常被邀请宣布他们的种族,从基因组学和健康的角度来看,这也是一个麻烦的分类,因为正如爱丽丝解释的那样,“这是一个与社区、宗教、语言有关的文化结构”。在这两种情况下,祖先都被边缘化了。

Alice Popejoy在她的专题演讲中强调了基于血统的标准化多样性测量的必要性。

这条消息得到了回应康苏洛·威尔金斯(范德比尔特大学),他阐述了“种族和族裔往往是解释健康差异的其他结构的替代物”,康苏洛认为,社会经济地位、教育和获得医疗保健的机会是这些结构中经常与种族相关的部分。事实上,正如康苏洛解释的那样,“种族是我们在人类研究中使用的最不精确的变量之一”。显然有必要用生物多样性和血统的概念取代这种过时的种族概念。

在她的专题演讲中,Consuelo Wilkins解释了种族和族裔如何经常被用作解释健康差异的其他概念的替代品。

乔治·西鲁戈宾夕法尼亚大学(University of Pennsylvania)以双卵(异卵)双胞胎为例,强调了存在问题的种族概念。在英国出生的双胞胎兄弟姐妹中,一个是深色皮肤和深棕色头发,另一个是雪白皮肤和红色头发,乔治奥提出了一个引人注目的例子,即亲缘关系密切的个体可能看起来很不一样。因此,如果我们倾向于根据人们的“长相”来定义种族,那么这也是一个问题,因为有明显的例子表明,即使是关系非常密切的个人,在具有标志性的“种族”特征方面看起来也大相径庭。了解具有不同表型的兄弟姐妹是否在其遗传结构中表现出更大的多样性,或者其他表观遗传因素是否对观察到的表型外显率的变异性负责,这将是一个有趣的问题。

Giorgio Sirugo在他的专题演讲中强调了在兄弟姐妹甚至兄弟双胞胎中可以观察到的表型多样性。

乔治奥进一步探讨了遗传发现在不同人群中的转移性,涉及单基因(单基因)疾病、寡基因疾病(复杂性状)和多基因疾病(多基因),并强调了连锁不平衡(LD)通过不同人群中不同SNP标记常见致病变异体,将对我们在不同人群中传递对多基因疾病的理解产生重大影响。

继续多元化主题,劳拉·帕利奥内(Spherical Cow Group)在其题为“构建标准开发意向性社区”的主题演讲中深入探讨了GA4GH的核心目标,并解释说“包容性必须是我们所有人的优先事项”。劳拉通过强调美国的一个案例,提供了一个与缺乏包容性相关的问题的有见地的例子,在该案例中,临床试验中女性与男性的不平衡导致了误导性的结果。劳拉删去了“长相相似的团队,达成长相相似的解决方案”这句话,劳拉强烈主张在基因组卫生界实现包容性和多样性,以此来改善基因组数据的收集、管理和访问方式。

在她的主题演讲中,Laura Paglione详细介绍了包容性的好处以及在基因组学和健康领域建立一个有意识的社区的重要性。

GA4GH工具和标准的真实实施

全体会议的第2天探讨了工具和标准的实际实现。全球联盟团队详细介绍了基因组和健康相关数据共享的计划。核心概念是数据通过联邦网络分布,单个web服务注册为节点。通过使用服务注册中心,研究人员可以同时查询多个数据集,确保快速高效的联邦查询。然后可以通过API或基于云的分析来检索数据集,这些分析步骤来源于不同的分析步骤。后者特别重要,因为它确保研究人员能够检查他们的生物信息分析是否按照他们的期望进行。

Elixir主任Niklas Blomberg提出了一个问题:“我们离完整研究数据访问周期的全面实施/演示还有多远?”对此,迈克尔·鲍迪斯(苏黎世大学)解释说,我们不应将拟议的GA4GH数据共享机制视为一个完整的平台,而应将其视为一套工具,该项目成功的一个主要因素是研究人员与GA4GH-全球联盟开发的各种工具保持一致的程度。在本说明中,关于“工具和标准的现实世界实施”的小组讨论内容特别丰富谢赫·法汉·拉希德(CanDIG)强调需要“授权签证模式”,以及奥古斯托·伦登(英国基因组学)声明“我们的数据是只读的……您无法下载原始数据”。

从欧洲、加拿大、巴西、日本和澳大利亚各研究所描述的实际实施情况来看,普遍强调了基因组和健康相关数据的保密性,各研究所进一步解决了研究人员获取研究所需基因组数据的机制需求。GA4GH的主要好处之一是,它将使研究人员能够在研究中使用其他国家的基因组数据。在她题为“创业板日本——现实世界的实施”的演讲中,Takako Takai先生(日本医学研究与发展署)提供了GA4GH的使命宣言,即“我们可以带来以前几乎没有实现的新的研究协调”。

GA4GH工作流管理器讨论了GA4GH标准如何支持全球学习健康系统。

Giga科学,我们期待着GA4GH将带来的研究成果,作为组织成员,我们将关注工具和标准的发展,并在可能的时候尝试实施它们。