在Entrez中搜索dbSNP
目录
如何构造查询
dbSNP是NCBI Entrez数据库网络的一部分。与这些其他数据库一样,只需在数据库SNP搜索框。链接在dbSNP搜索框下方的Advanced Search页面可以帮助构建复杂的查询。要构造复杂查询,请使用以下语法指定搜索词、其字段和要对这些词执行的布尔运算:
术语[字段]操作员术语[字段
哪里学期
是搜索词,领域
是搜索字段,并且操作员
是布尔运算符('AND'、'OR'、'NOT';必须大写)。
常见查询字段和示例
字段全名 |
字段别名 |
描述 |
搜索词值和规则 |
例子 |
所有字段 |
所有人* |
搜索所有可搜索(索引)字段 |
搜索词中的星号(*)不被解释为通配符 |
SNV与致病性 |
基准位置 |
SNPPOS位置 |
GRCh38上的染色体碱基位置(当前) |
一个自然数,表示SNP在其染色体上最新组合的起始坐标(即GRCh38)。与CHR字段结合使用时最有用。 |
19956018【位置】和8【CHR】 |
上一个基准位置 |
位置GRCH37,CHRPOS_PREV_ASSM |
GRCh37上的染色体碱基位置(之前) |
代表SNP在前一组染色体上的起始坐标的自然数(即GRCh37)。与CHR字段结合使用时最有用。 |
19813529【位置_ GRCH37】和8【CHR】 |
染色体 |
CHR、CHRNUM |
染色体 |
1-22、X、Y、MT之一 |
7[瑞士法郎] |
临床意义 |
临床 |
具有明确临床效果或意义的变异 |
16个搜索词值,为相对较小的SNP子集定义。 |
“可能致病” |
过滤器 |
过滤,过滤,子集,某人,过滤 |
限制返回的记录 |
有多种过滤器,包括功能、位置、源等。 |
获取所有dbSNP记录“所有[某人]”或子集“splice 5 snp”[过滤器] |
函数类 |
FXN,函数类,FUNC,FUNCT,Function_class |
函数类 |
定义了21个功能类 |
“frameshift”[函数类] |
基因名称 |
基因,基因_符号 |
Entrez基因符号 |
对应于Entrez基因资源中的官方符号字段 |
MAPK1【基因】 |
基因ID |
GENE_ID(发电机ID) |
Entrez基因UID |
引用Entrez基因ID的数字ID |
5594[基因ID] |
全球次要等位基因频率 |
GMAF公司 |
来自全球人口的次要等位基因频率(即1000G);也可以是非全球人口的全研究MAF |
当作为范围输入时最有用,如示例中所示 |
(0.0[GMAF]:0.01[GMAF]) |
项目或提交人处理 |
HAN,项目 |
提交人句柄或项目名称 |
提交人实验室或项目名称,包括1000基因组、GnomAD和DebNick |
1000个基因组[提交人处理]或1000个基因组【项目】 |
参考SNP ID |
RS、SNPID |
聚类SNP ID(rs) |
数字ID必须以“rs”为前缀。还检索已合并到指定SNP中的SNP。 |
rs328码 |
SNP等级 |
SCLS、SNPCLASS |
SNP等级 |
可能的值有:“del”、“delins”、”ins“、”mnv“和”snv“。 |
删除 |
提交人SNP ID |
不锈钢、不锈钢编号 |
提交时分配给SNP每个报告的ID |
必须以“ss”为前缀。请注意,查询仍然返回Reference SNP,而不是Submitter SNP。 |
ss329[不锈钢] |
验证状态 |
验证,验证 |
验证状态 |
可能的值为:“按簇”或“按频率” |
“按群集”[验证状态] |
复杂查询和其他
HGVS搜索
用户可以使用HGVS名称搜索dbSNP,如示例所示:NM_000237.3:c.1421C>G或NG_013007.1:G.7147G>A
ALFA频率
ALFA频率的所有SNP
要检索具有ALFA频率信息的变体的完整列表,我们可以使用此查询:所有[sb]AND by alfa[验证]
“by-ALFA”平面
“验证状态”过滤器下有一个“by-ALFA”方面,可用于进一步筛选搜索结果。
“ALFA”链接
对于搜索结果中的每个RefSNP,都有一个“ALFA”链接,该链接按人口显示频率。
蛋白质位置
也可以在蛋白质序列水平上通过氨基酸变异进行搜索。下图显示了搜索字符串“Glu7Gly”的结果。