美国国旗

美国政府的官方网站

NCBI书架。美国国立卫生研究院国家医学图书馆的一项服务。

GenBank提交手册[互联网]。贝塞斯达(医学博士):美国国家生物技术信息中心;2011-.

  • 本出版物仅供历史参考,信息可能已过时。

本出版物仅供历史参考,信息可能已过时。

GenBank提交资料手册封面

GenBank提交手册[互联网]。

显示详细信息

使用特定NCBI提交工具提交序列

创建:上次更新时间:2014年11月3日.

预计阅读时间:13分钟

使用BankIt提交

如何使用BankIt创建提交给GenBank的文件?

1

查看 通过BankIt提交GenBank的要求,并确保您可以提供提交所需的信息。

2

如果您从未提交给GenBank扫描 GenBank样本记录 熟悉GenBank记录字段定义.

三。

有关GenBank提交的特定类型的示例,请参阅GenBank注释示例第页。

4

登录MyNCBI:

a。

转到 BankIt主页,然后单击页面顶部右侧黄色框中的“登录以使用BankIt”。你会去MyNCBI登录第页。

b。

如果您还没有NCBI帐户,单击“注册NCBI帐户”位于登录文本框下方。标有星号(*)的框表示我们为您创建帐户所需的最低信息量。输入所需信息,然后单击“创建帐户”按钮。

5

登录BankIt并开始提交。提交过程中有明确的步骤,提示您提供联系信息和数据。

6

这个BankIt主页包含指向序列注释示例的链接。

使用Sequin提交

如何使用Sequin创建提交?

1

下载Sequin程序来自Sequin网站:

a。

转到Sequin主页,然后单击侧栏上的“下载Sequin”链接。您将转到Sequin FTP站点,在那里可以下载适用于您的操作系统的正确文件。

b。

如果您不确定要使用哪个FTP文件,请参阅“选择下载类型“第页获取特定操作系统的下载说明。

c。

如果在下载或安装Sequin时遇到问题,请参阅故障排除指南.

2

准备格式正确的FASTA文件序列数据的:

a。

FASTA格式是以定义行开头的原始序列:
定义行以>号开始,紧接着是序列的名称(您自己的本地标识码或序列ID)和描述序列的标题。创建FASTA文件时,请务必使用文本编辑器。
有关FASTA序列格式的更多信息,请参阅FASTA部分Sequin的帮助文件.

b。

在定义行的标题部分嵌入重要信息,Sequin将使用这些信息帮助构建序列记录。例如:

  • 您可以输入有机体和菌株或克隆信息在核苷酸定义行的标题部分,使用方括号包围的name=value对:[有机体=Drosophila melanogaster][菌株=Oregon R]
  • 您可以输入基因和蛋白质信息在蛋白质定义行的标题部分,使用方括号包围的名称=值对:[基因=eIF4E][蛋白质=真核生物起始因子4E-I]
三。

启动Sequin。在Sequin提交过程中,Sequin将提示您提供我们处理您提交内容所需的信息。

  • Sequin有上下文相关的屏幕帮助启动Sequin时会自动打开。因为它是上下文相关的,所以在您完成程序的过程中,帮助文本将更改并遵循您的步骤。
4

以ASN.1的形式提交完成的Sequin文件而不是作为一个平面文件:

  • 请确保在保存文件之前检查并修复验证问题。
  • 要将文件保存为ASN.1,您可以单击记录查看器上的“完成”按钮,或转到“文件”菜单并选择“准备提交”,这也会将文件另存为ASN.1。
  • 我们不能接受平面文件格式,因为平面文件格式只是一种显示格式。
5

完成提交过程后,您必须将Sequin程序生成的.sqn提交文件通过电子邮件发送至 vog.hin.mln.ibcn@总线bg,因为Sequin在Sequin过程结束时不会自动为您传输完成的文件(Sequin提交过程结束时会出现一个对话框,指示您通过电子邮件发送提交文件)。注意:发送之前不要对文件进行编码。

6

当我们收到新的Sequin提交文件时,将生成一个自动回复,并发送到用于提交给GenBank的电子邮件地址。此自动回复确认我们已收到您的提交,并表示您将在两个工作日内收到GenBank提交人员的回复。

如果我已经使用Sequin创建了提交文件,我应该提交什么文件——平面文件还是ASN.1文件?

要将文件保存为ASN.1,您可以单击记录查看器上的“完成”按钮,或转到“文件”菜单并选择“准备提交”,这也会将文件另存为ASN.1。确保在保存文件之前检查并修复验证问题。

我们不能接受平面文件格式,即使它是用Sequin制作的,因为平面文件格式只是一种显示格式。

使用tbl2asn提交

什么时候tbl2asn是Sequin的好替代品,你能给我一个使用tbl2as n创建提交给GenBank的分步说明吗?

tbl2asn(待定) 是一个程序,允许具有以下功能的用户:

  • 大批量序列
  • 大量注释
  • 完整基因组
  • 全基因组枪式投稿

创建Sequin(.sqn)文件以供提交,而无需经历使用Sequin程序的逐步过程。

使用tbl2asn程序所需的全部操作是:

  • 将数据放在适当格式的文件中
  • 下载并运行tbl2asn程序
  • 命令tbl2asn程序使用数据文件生成.sqn文件,您可以通过电子邮件将其提交给GenBank。

Sequin和tbl2asn的主要区别Sequin是一个带有图形用户界面的菜单驱动程序,而tbl2asn是一种命令行程序,用户通过键入命令来执行特定任务,从而与tbl2as软件进行交互。

下面是使用tbl2asn创建.sqn文件的分步说明。如果您需要有关此过程任何部分的更多信息,请参阅tbl2asn主页tbl2asn文档可在NCBI工具箱中找到文件传输协议站点:

答:。

将数据放入适当格式的数据文件中,并将数据文件放在单个目录中:

1

tbl2asn可以使用6种类型的数据文件来构建Sequin提交.3是必需的,3是可选的:
所需文件:

  • 模板文件(参见下面的步骤“B”)包含文本ASN.1 Submit-block对象(使用文件后缀.sbt)
  • 美国金融服务贸易协会的文件核苷酸序列数据(使用文件后缀.fsa)
  • 功能表文件(使用文件后缀.tbl)。[仅当包含注释时才需要]

    可选文件:
  • 质量得分文件(使用文件后缀.qvl)
  • 源表file(使用文件后缀.src)[在提交具有不同值的源限定符的多个记录时很有用]
  • 蛋白质序列文件(使用文件后缀.pep)[这些文件很少需要]
2

不同文件的前缀(基本名称)(.sbt文件除外)您将一起使用来构造提交,该提交应该与.fsa文件的提交相同因为tbl2asn将查找与.fsa文件具有相同前缀的.tbl、.src和.qvl文件,以生成Sequin文件。例如:

  • 模板.sbt(这是唯一前缀不同的文件。保留前缀不变)。
  • chr01.fsa公司
  • chr01.tbl公司
  • chr01.qvl
三。

将要使用的文件保存在单个目录中 在同一目录中构造提交.

B。

创建提交模板文件:
(您可以使用联机提交模板页面或使用Sequin创建此文件。)

1

使用在线提交模板页面:

a。

转到联机创建提交模板第页。

b。

在“Contact Information”、“Sequence Authors”和“Reference Information”部分中填写必填(*)和可选文本框。

c。

单击页面底部的“创建模板”按钮。

d。

将文件另存为模板.sbt到包含要用于提交的其他文件的同一目录。

2

使用Sequin:

a。

加载Sequin公司安装到您的计算机上。

b。

点击Sequin启动页面上的“开始新提交”按钮。

c。

如果需要,输入手稿标题,然后单击“下一页”按钮。

d。

输入您的联系信息并单击“下一页”按钮。

e、。

输入作者信息并单击“下一页”按钮。

f、。

输入隶属关系信息并单击“下一页”按钮。

g、。

单击白色提交选项卡返回提交窗口。

小时。

点击提交窗口左上角的“文件”,激活下拉菜单并选择“导出提交人信息”。

i、。

将文件另存为template.sbt。

C、。

下载适用于您的操作系统的tbl2asn程序:

1

转到tbl2asn文件传输协议现场。

2

单击适合您的操作系统的文件进行下载。

三。

解压缩使用适当的zip实用程序创建tbl2asn文件。

4

重命名文件tbl2asn(待定),并根据操作系统的需要设置权限。

D。

打开 命令行解译器 适用于Windows或Mac操作系统。因为tbl2asn是一个命令行程序,您不能像使用Sequin这样的标准图形界面程序一样单击tbl2as图标来打开它。你首先必须打开一个命令行解译器对于您的操作系统,进入命令行解释器后,您可以命令计算机运行tbl2asn程序:

  • 在Windows操作系统(OS)中,命令行界面称为“命令提示符”,您可以通过执行以下操作找到它:
    a。

    转到“开始”菜单。

    b。

    单击“所有程序”以释放菜单。

    c。

    单击“Accessories”(附件)以释放菜单。

    d。

    单击“命令提示符”打开“命令提示符”命令行解释器。

  • 在Mac操作系统(OS)中,命令行界面称为“终端”,您可以通过执行以下操作找到它:
    a。

    转到“Applications”文件夹。

    b。

    双击“Utilities”文件夹将其打开。

    c。

    双击“终端”打开“终端”命令行解释器。

  • 在Linux操作系统(OS)中,打开一个shell并使用chmod+x允许执行下载的程序。(使用FTP传输文件不会保留UNIX文件权限。)
E.公司。

将tbl2asn.exe移到计算机在输入 tbl2asn(待定) 命令。将tbl2asn.exe移动到自动搜索的目录的好处是您只需输入命令tbl2asn(待定)在提示后,无需每次使用tbl2asn.exe时都键入一个冗长的路径。

Windows操作系统:

a。

转到在步骤D中打开的“命令提示符”命令行解释器。

b。

类型路径按照提示,然后单击“Enter”按钮。当您在命令行界面中输入命令时,计算机将列出它自动搜索的所有路径(PATH目录)。

c。

例如:
C: \文档和设置\所有者>路径
路径=C:\WINDOWS\System32;C: \WINDOWS;WINDOWS\System32\Wbem窗口


从上述响应中,您可以看到,对于示例计算机,WINDOWS目录是用户输入命令时自动搜索的目录之一(PATH目录)。因此,如果您将tbl2asn.exe放在此目录中,如果您键入以下命令,计算机将查找并运行tbl2as n.exetbl2asn(待定)遵循提示。

d。

将tbl2asn移动到上一步中提到的PATH目录。

Mac操作系统:

a。

打开Applications文件夹。

b。

创建一个新文件夹,并为其指定一个可识别的名称。对于本例,我们将文件夹命名为:Command_line_apps。

c。

将步骤C中下载的tsb2asn文件移到Command_line_apps文件夹中。

d。

转到在步骤D中打开的“终端”命令行解释器,然后输入以下命令:
export PATH=/Applications/Command_line_apps:$PATH

此时,您可以使用以下命令在命令行解释器中启动tbl2asn程序tbl2asn(待定).
注意:您必须为每个新的Mac“终端”会话重复这些说明的步骤d,才能使用该命令tbl2asn(待定),因为从一个“终端”会话到下一个会话不会记住步骤d中给出的命令。

F、。

将命令行界面的默认目录更改为包含数据文件的目录。将命令行界面上的目录更改为包含数据文件的目录的好处是,您可以输入tbl2asn命令,而无需键入包含您使用的每个命令的文件所在目录的长路径:

1

在提示之后,键入cd(更改目录),后跟空格,然后键入包含数据文件的目录的路径。点击“回车”按钮。

2

提示应更改以反映新目录(在以下示例中称为Sequence_Data):

  • cd命令后接新提示符的示例(更改以反映新目录)在Windows OS命令行解释器中。在本例中,数据文件位于名为“Sequence_data”的文件中,而该文件又位于名为《我的文档》的目录中:
    C: \Documents and Settings\Owner\>cd C:\Documents和
    +设置\所有者\我的文档\序列数据
    C: \Documents and Settings\Owner\My Documents\Sequence_Data>
  • cd命令后接新提示符的示例(已更改以反映新目录)在Mac OS命令行解释器中。在此示例中,数据文件位于名为“Sequence_data”的文件中:
    Apple1:~用户名$cd Documents/Sequence_Data
    Apple1:~/Documents/Sequence_Data用户名$


    其中Apple 1=Mac操作系统中的计算机名称;每个计算机的名称都不同,因为它反映了每个计算机的名称。
G.公司。

在命令行解释器中运行tbl2asn并访问所有当前的tbl2as命令。
上提供了最常用的tbl2asn命令的列表和定义tbl2asn主页。您可以通过执行以下操作访问所有tbl2asn命令的完整列表(这些指令适用于所有操作系统):

1

打开操作系统的命令行解释器。

2

类型tbl2asn(待定)在命令行解释器提示符后加上空格和连字符:
提示>tbl2asn-

三。

按“回车”键显示所有tbl2asn命令。

4

在下面的示例中,将使用以下TBL2ASN命令创建亮片文件使用最低要求的文件:FASTA文件、要素表和模板文件。

  • -p指定表和序列文件的路径
    [必需]
  • -t指定模板文件(包括路径)[必需]
  • -j允许添加与每次提交相同的源限定符
    示例:-j“[有机体=酿酒酵母][菌株=S288C]”
  • -V是与以下内容结合时的验证功能:
    v执行验证[可选,但强烈建议]
    b生成带有.gbf后缀的GenBank平面文件
    (示例命令行:-V vb)。注:平面文件格式仅供查看。无法提交。
H。

使用tbl2asn命令使用所需的数据文件创建Sequin(.sqn)文件.注释:如果您打算在一次提交中提交多个序列,请在开始之前参阅此问题的步骤H6。下面的示例将显示如何使用上述tbl2asn命令创建Sequin(.sqn)文件,该文件使用最少需要的文件-模板文件(.sbt)、FASTA文件(.fsa)和功能表文件(.tbl)。以下说明适用于所有操作系统。

为了使用以下说明,您必须将tbl2asn.exe放在路径目录中(参见步骤E),并且必须将命令行解释器的默认目录更改为包含要在单个提交中使用的所有文件的目录(参见步骤F).

1

类型 tbl2asn(待定) 提示后(尚未点击“回车”)。
此命令告诉计算机运行tbl2asn.exe
例子:
提示>tbl2asn

2

在tbl2asn后键入空格,然后键入 –吨,另一个空格,以及模板文件的名称(尚未点击“回车”)。
这个-t吨命令后跟模板文件名,告诉计算机使用tbl2asn创建.sqn文件时要使用的模板文件名。
例子:
提示>tbl2asn-t模板.sbt

三。

在模板文件名后键入空格,然后键入 -第页,另一个空格,然后键入句点(点)(尚未点击“回车”)。
-第页单独告诉计算机在哪里查找表和序列文件。-第页后面是一个空格,然后是一个点,告诉计算机在当前目录中查找表和序列文件。
例子:
提示>tbl2asn-t template.sbt-p。

4

在点后键入空格,然后键入 –j个,然后键入另一个空格,然后提供 源修饰符 引号和括号内的信息例如:
“[有机体=酿酒酵母][菌株=S288C]”(尚未点击“回车”)
-j告诉计算机在每次提交后添加源信息。如果有注释并且遗传代码不是标准代码,则包括正确的代码在中fsa定义线,或在命令行中使用-j,以避免错误。

例子:
提示>tbl2asn-t template.sbt-p-j“[生物体=酵母菌
酿酒酵母][菌株=S288C]“



注意:如果您有目录中所有文件通用的源信息,那么步骤4中所述的方法很好。如果您有特定于特定提交的其他源信息,请省略-j命令,并且:

5

在源信息后的引号和括号中键入空格,然后键入 –V型,另一个空格,然后vb格式(尚未点击“回车”)。

-V(V)与一起使用时是验证命令v(v)(强烈建议),这将告诉计算机运行验证步骤,以确保您的提交中没有错误。

此验证步骤将为每个.fsa文件生成一个报告(后缀为.val),并将其放置在包含提交中使用的数据文件和表的同一目录中。

如果您添加b条命令(可选)v(v)命令,计算机将生成您提交的GenBank平面文件(.gbf),并将其存放在包含提交中使用的数据文件和表的同一目录中。请注意,.gbf文件不适合提交。他们只能查看GenBank平面文件格式的文件。

例子:
提示>tbl2asn-t template.sbt-p-j“[生物体=酵母菌
酿酒酵母][菌株=S288C]“-V vb

6

可选步骤
如果您的提交包含多条记录
,将它们放在单个.fsa文件中,并将以下内容添加到命令行:

在最后一个命令后键入空格,然后键入 –a 然后键入另一个空格,然后键入
例子:
提示>tbl2asn-t template.sbt-p-j“[生物体=酵母菌
酿酒酵母][菌株=S288C]“-V vb-a s



与s命令一起使用的–a命令指示tbl2asn将一个文件中的多个FASTA组件作为一组不相关的序列读取。这将创建包含多个提交的单个文件。

记得:每个.tbl和.qvl文件都需要在相应的.fsa文件中包含序列信息。

注:您必须尝试在提交的文件数量和每个提交文件的记录数量之间取得平衡。一般来说,如果没有注释,则将每个文件的记录(序列)数量限制为几千条,如果有注释,则限制为几百条。

7

按键盘上的“Enter”键.
响应如下:

[tbl2asn(待定)和当前tbl2asn版本号]扁平锉后跟用于此特定提交的表和文件的前缀。

紧随其后

[tbl2asn(待定)和当前tbl2asn版本号]正在验证后跟用于此特定提交的表和文件的前缀。]

紧随其后

命令行界面提示。
例子:
[tbl2asn 15.2]扁平锉chr01
[tbl2asn 15.2]验证chr01
提示>

8

找到tbl2asn程序为每个.fsa文件生成的Sequin文件(.sqn)、验证文件(.val)和GenBank Flatfile(.gbf):

一旦tbl2asn生成.sqn、.val和.gbf文件,它会自动将它们放在包含提交中使用的数据文件和表的同一目录中。

一、。

使用文本编辑器打开.val文件以查看错误。在Sequin中打开.sqn文件以更正提到的任何错误。或者,您可以对.tbl文件进行适当的更改,然后重新生成.sgn文件。

  • 可以忽略有关缺失谱系的分类学相关错误
  • 如果有注释并且遗传代码不是标准代码,则包括正确的代码中的。fsa定义线,或在命令行中使用-j,以避免错误
J。

可选:使用文本编辑器打开Genbank Flatfile(如果您选择在命令中包含生成Genbank Flatfile)并查看。.gbf文件仅用于显示,不用于提交。不要对这些文件进行任何更改;更改需要在.sqn文件中。

英国。

检查完文件并更正验证步骤发现的任何错误后,将文件发送到Genbank通过电子邮件发送至vog.hin.mln.ibcn@bus-bg,或使用Sequin宏发送定期提交,以及基因组宏发送提交基因组(完整或不完整的全基因组鸟枪)。

使用tbl2asn提交给GenBank时,我是否必须始终提供项目ID?

这个问题的答案取决于你提交的内容.

只有在提交以下内容时,才需要项目ID:

  • 细菌或真核生物(非细胞器)基因组
  • 基因组研究包括:
    • 靶向基因座研究
    • 元基因组研究
    • 多隔离研究

有关如何向BioProject注册项目并获取项目ID的信息,请参阅“提交给BioProject“第节BioProject帮助手册.

意见

此收藏中的其他标题

最近的活动

您的浏览活动为空。

活动录制已关闭。

重新打开录制

查看更多。。。