生成摘要
发布版本:20230706150541
新增:我们很高兴介绍NCBI ALFA Release 3(版本20230706150541),它是最大和最全面的聚合变体数据库之一,包括等位基因和基因型频率。这个版本结合了新的基因型频率和哈代-温伯格平衡(HWE)概率,以帮助您更有效地进行分析。所有这些信息现在都在我们的文件传输协议文件夹。
##FORMAT=<ID=HWEP,Number=1,Type=Integer,Description=“int(-log(HWE分数测试p-value));-1表示无法计算HWE得分测试p-value”>##FORMAT=<ID=GR,Number=1,Type=Integer,Description=“基因型纯合子参考等位基因(AA)计数;在极少数情况下可能不是GRCh参考等位蛋白”>##FORMAT=<ID=GV,Number=1,Type=Integer,Description=“基因型杂合ref/alt(A/B)计数;报告可能包含或不包含参考等位基因的最常见两个等位基因”>##FORMAT=<ID=GA,Number=1,Type=Integer,Description=“基因型纯合子替代等位基因(B/B)计数;可以是任何非双等位基因变异等位基因。”>
这个参考SNP网站已经报道了此次发布的等位基因频率。我们计划更新RefSNP页面,以包括基因型频率和Hardy-Weinberg平衡(HWE)概率。
输入和输出计数
输入 |
计数 |
研究 |
82 |
学科 |
204,108 |
基因型 |
5,773,169,974,362 |
输出 |
计数 |
RefSNP总数 |
904,666,942 |
存在于dbSNP 156中 |
904,113,309 |
新颖 |
553,633 |
*不同分析来源的受试者计数可能重叠。
人口 |
生物样本ID |
学科 |
站点总数 |
MAF=0 |
空气流量>=0.01 |
0.01>MAF>=0.001 |
空气流量<0.001 |
辛格尔顿 |
欧洲的 |
SAMN10492695号 |
170,432 |
897,795,726 |
790,467,870 |
12,698,121 |
10,217,165 |
874,880,440 |
55,468,196 |
非洲其他国家 |
SAMN10492696号 |
330 |
889,789,877 |
867,263,040 |
16,189,977 |
6,336,860 |
867,263,040 |
6,693,257 |
东亚 |
SAMN10492697号 |
2,515 |
889,359,780 |
877, 818, 106 |
11,382,903 |
133,481 |
877,843,396 |
3,530,766 |
非裔美国人 |
SAMN10492698号 |
8,860 |
890,733,488 |
823,801,666 |
17,221,278 |
17, 452, 425 |
856,059,785 |
25,341,328 |
拉丁美洲1 |
SAMN10492699号 |
817 |
889, 296, 648 |
869,911,354 |
12,614,612 |
6,770,380 |
869,911,656 |
6,683,777 |
拉丁美洲2 |
SAMN10492700号 |
4,703 |
889,338,588 |
862,580,163 |
9,603,034 |
17,148,712 |
862,586,842 |
11,064,663 |
其他亚洲国家 |
SAMN10492701标准 |
1, 000 |
889,157,433 |
880,613,029 |
8,495,071 |
41,203 |
880,621,159 |
2, 585, 443 |
南亚 |
SAMN10492702号 |
2,619 |
889,137,055 |
875,447,223 |
13,542,288 |
139,843 |
875,454,924 |
4,210,232 |
其他 |
SAMN11605645号 |
12,832 |
897, 815, 333 |
859,256,511 |
14,990,800 |
22,453,126 |
860,371,407 |
14,080,922 |
非洲(注1) |
SAMN10492703号 |
9,190 |
890,733,974 |
822,797,281 |
17,256,003 |
17,786,640 |
855,691,331 |
25,853,998 |
亚洲人(注2) |
SAMN10492704号 |
3,515 |
889,379,475 |
876,472,062 |
9,016,798 |
3,858,978 |
876,503,699 |
4,097,403 |
总计(注3) |
SAMN10492705号 |
204,108 |
897,855,544 |
736, 676, 981 |
15,200,441 |
17,592,488 |
865,062,615 |
81,123,968 |
笔记:
-
非裔美国人和非洲其他人总数;参见人口描述.
-
东亚和其他亚洲国家总计;参见人口描述.
-
独特受试者总数,不包括上述非洲和亚洲冗余计数。
列说明:
输出总体-见计算的ALFA人口
生物样本ID-人群生物样本登录ID
受试者-按人口统计的唯一受试者数量
站点总数-报告的唯一变体站点总数
MAF=0——参考等位基因的位点纯合子,从当前受试者样本量中未检测到变异等位基因;如果受试者大小>100,则可能罕见
MAF>=0.01-MAF的常见变量>=0.01
0.01>MAF>=0.001-罕见变异
MAF<0.001-极罕见变体
单一-次要等位基因发现一次