~#靶向基因座研究(TLS)
A类靶向基因座研究(TLS)是一个针对来自多个生物体的单个基因位点或来自单个生物体的多个保守元素的大规模靶向测序项目(>2500个序列)。
单个TLS提交中包含的所有序列都链接在单个TLS中生物项目并包括生物样本对于提交中包含的每个隔离源。TLS研究的所有要素都分组在一起,并在序列集浏览器.
TLS研究可以容纳从环境来源或人群中单个基因分离的大量16S核糖体RNA提交。这些可以来自未培养或培养的生物体。这些研究也可以由保守元素组成,例如从单个物种分离的超保守元素(UCEs)。
TLS项目看起来像什么?
与其他国际核苷酸序列数据库合作(INSDC)大型项目一样,TLS项目由具有以下特征的主记录组成:
- 每个定义行开头的标签“TLS:”。
- DBLINK(数据库链接)
- 关键词:TLS;靶向基因座研究
每个TLS项目都分配了一个稳定的4个字母的TLS加入前缀,该前缀不会随着项目的更新而更改。除了TLS登录前缀外,序列标识符还具有与特定TLS项目更新相对应的版本号。最后,为项目中的每个序列分配一个唯一的登录号,前缀为TLS登录前缀和版本号。例如,如果TLS项目的指定登录号为XXXX00000000,则该项目的第一个版本将为XXXX01000000,该版本的第一个序列将为XXXX1000001(此ID的最后六位数字标识每个单独的序列)。
TLS主记录的示例如下KBUV00000000。
TLS序列记录由所有三个INSDC数据库共享,可以使用Entrez核苷酸和Entrez蛋白质中的典型搜索方法找到。
提交要求
- 提交来自不同生物体/环境样本的单个位点(例如16S rRNA)或来自单个生物体的一组保守位点(例如,从单个鸟类分离的UCE)的binned序列。
- 对于环境样本序列调查,每个序列应代表样本中存在的单个藻型、OTU或“bin”。
- TLS提交文件应包括为单个大规模研究或生物项目隔离的所有序列。单个项目中可以包含多个生物样本。
- 每个序列必须由一个以上的重叠序列组合而成,这些序列是从提交者实验确定的数据中读取的。
- 应对序列进行载体污染筛查,并删除任何载体/连接序列。这包括去除测序引物。
- 序列长度应大于150bp。
- 向提交序列读取SRA公司强烈推荐。如果不提交阅读资料,请将研究和环境元数据提供给生物项目和生物样品.
TLS不可接受
- 从公共存储库下载的读取的程序集。
- 尚未组装的序列。
- 总序列少于2500个的项目。
如何提交到TLS
通过NCBI提交门户.应使用提交工具将所有其他序列类型提交给GenBank表2asn。提交详细信息可在TLS提交指南.
如何更新现有TLS提交
请联系gb-admin@ncbi.nlm.nih.gov我们将提供更新序列的原因以及如何更新的说明。
如何搜索TLS项目