GenBank提交门户向导

GenBank提交门户目前仅支持以下提交类型：

原核16S核糖体RNA、23S核糖体RNA和16S-23S核糖体RNA基因间间隔区
真核核rRNA-ITS区域、大小亚单位核糖体RNA和内部转录间隔区1和2
真核细胞器（线粒体或叶绿体）大小亚单位核糖体RNA
后生动物（多细胞动物）线粒体COX1（细胞色素氧化酶亚基1）
真核mRNA
流感A、B或C序列
诺如病毒序列
登革热病毒序列
严重急性呼吸综合征冠状病毒2（SARS-CoV-2）序列

序列准备：

准备一份质量检查序列的FASTA文件。删除矢量，低质量序列和你的序列中可疑的数据之前提交。

的源信息严重急性呼吸综合征冠状病毒2型（SARS-CoV-2）序列
（提供的信息将用于构建格式正确的ICTV隔离指定）：

独特隔离任命；样本ID在你的实验室里使用。
完成收款_日期，包括月份和日期（如果知道）；这是病毒样本在现场采集的日期；必须采用ISO格式：“YYYY-MM-DD”。例如：2020-03-25。
国家病毒收集地点；请参见INSDC国家列表获取允许的名称和格式。冒号后面的信息格式中应按从大到小的顺序显示，即国家：州、市。例如：美国：马里兰州。在处理过程中，冒号前指定的国家将自动转换为三个字母的国家ISO代码用于建造ICTV格式的隔离物。
主机生物；通用或学名病毒所在的宿主动物。该信息将用于ICTV隔离。
隔离源; 物理环境病毒收集地。例如：鼻咽拭子。
可选：生物项目、生物样本和SRA可以提供登录号来链接组装序列到以前提交的读取数据。此可选信息可以通过“添加字段”、“添加列”添加或包含在源修饰符上的tab分隔表。这些附加必须由与提交组并在提交GenBank之前获得。建议使用“SARS-CoV-2：临床或宿主相关”生物样本包。

序列准备：

准备一份质量检查序列的FASTA文件。移除矢量，嵌合体，低质量序列和你的序列中可疑的数据之前提交。

的源信息原核rRNA序列：

序列来自纯培养菌株（无菌的每种培养物仅含有一种微生物）：
- 生物体（例如：芽孢杆菌属）
- 唯一的菌株ID/字母数字代码（例如：k12，不要使用物种名称或顶级匹配）
序列来自未培养样本（即。直接从环境样品或宿主中扩增的PCR；样品未在培养基中培养）：
- 有机体（例如：未培养的细菌）
- 独特克隆或隔离ID/字母数字示例代码（例如：abc-1、def2），以及
- 隔离源或主机（例如：海水，智人）

序列准备：

准备一份质量检查序列的FASTA文件。删除载体、嵌合体、低质量序列和你的序列中可疑的数据之前提交。

的源信息真核生物rRNA和rRNA-ITS序列：

有机体（例如：鹅膏菌属）
独特的隔离，拉紧，克隆，品种，繁殖，文化收集，或 凭单样本(源修饰符定义)

序列准备：

准备一份质量检查序列的FASTA文件。删除矢量，低质量序列和你的序列中可疑的数据之前提交。

的源信息后生动物（多细胞动物）线粒体COX1序列：

有机体（例如：Bos taurus）。如果该生物体不是后生动物（多细胞动物），请使用BankIt银行提交。
独特的隔离或 样品-凭单.
如果生物体名称不在NCBI分类数据库中，系统将提示您提供线粒体遗传密码在您提交的文件中单独填写。

序列准备：

准备一份质量检查序列的FASTA文件。删除矢量，低质量序列和你的序列中可疑的数据之前提交。

的源信息真核mRNA序列：

有机体（例如：Equus quagga）。如果生物体不是真核生物，那么使用BankIt银行提交。
每个序列应具有克隆、隔离、样本-凭证、菌株、品种、，培养收集或繁殖

真核细胞核mRNA序列的特征注释：

强烈建议使用特征注释，因为它可以增强序列的信息性数据库用户，并帮助识别潜在的序列问题。如果您无法提供注释详细信息，尤其是编码区域（CDS），您仍然可以提交序列并接收登录号，但这些序列将是处理为未验证。未经验证的序列在GenBank记录中明确标记，并有注释指示数据未经验证，并且不包括在BLAST数据库中(更多).

有两种方法可用于注释要素：

为提交的每个序列注释编码区域（CDS）功能的网站。您需要提供每个CDS的蛋白质名称和核苷酸跨度。你也可以注释基因，5'非翻译区（5'UTR），和/或3'未翻译区域（3'UTR）特征。
新款：您可以选择上传序列的蛋白质翻译，允许我们的软件自动预测和注释CDS功能。当用不同的CDS注释注释大量序列时，此选项特别有用，例如不同的蛋白质名称或核苷酸跨度。请注意，您上传的蛋白质翻译仅用于预测CDS特征，翻译将从基础核苷酸序列中重新生成。要使用这种方法，核苷酸序列必须至少18 bp长，蛋白质翻译必须为6个氨基酸或更长。

序列准备：

准备一份质量检查序列的FASTA文件。删除矢量，低质量序列和你的序列中可疑的数据之前提交。

的源信息流感序列
（提供的信息将用于构建格式正确的流感菌株名称）：

隔离名称
完成收款_日期，包括月份和日期（如果知道）；这是病毒样本在现场采集的日期；必须采用以下格式：“DD-Mmm-YYYY”、“Mmm-YYYY”和“YYYY-”。示例：2015年1月12日、2014年12月或2014年。
国家病毒收集地点；请参见INSDC国家列表允许的名称和格式。中冒号后面的信息格式应按大小顺序呈现，即国家：州、市。最后一个逗号后面的单位将用于生成流感菌株名称。例如，“美国：马里兰州，贝塞斯达”将导致“贝塞斯塔”被列为应变；“美国：马里兰州”将导致“马里兰州”被列为菌株的位置；“USA”将导致“USA”被列为菌株的位置。
主机; 出现在分号之前的任何术语都将用于应变。科学名称可以包含在分号。例如，“猪；24日龄幼仔；雌性”或“猪；Sus scrofa”都会导致应变。一个例外是在宿主中使用“智人”因为来自人类宿主的流感毒株没有列出宿主。
血清型仅适用于甲型流感；必须采用HxNx、Hx、，Nx或混合；其中x是数字
隔离源; 病毒所在的物理环境已收集。例如：粪便、鸟笼、鼻拭子、肝脏、，等。如果未收集此信息，请输入术语“缺失”。
可选：文章细节可以包含在源注释中。

序列准备：

准备一份质量检查序列的FASTA文件。删除矢量，低质量序列和你的序列中可疑的数据之前提交。

的源信息诺沃克病毒序列：

独特隔离名称。
完成集合日期，包括月份和日期（如果知道）；这是病毒样本在现场采集的日期；必须采用以下格式：“DD-Mmm-YYYY”、“Mmm-YYYY”和“YYYY-”。示例：2015年1月12日，2016年12月。
国家病毒收集地点；请参见INSDC国家列表获取允许的名称和格式。中冒号后面的信息格式应按大小顺序呈现，即国家：州、市。例如，“美国：马里兰州，贝塞斯达”。
主机生物；如果病毒没有从宿主中分离出来有机体，进入“环境”。
隔离源; 病毒所在的物理环境收集。例如：粪便、鼻拭子、肝脏等信息未收集，请输入缺少的术语。
基因型; 必须以“克<罗马数字>",与提交类型页面上选择的基因组相匹配。基因型可以与基因组相同或更具特异性。
可选：文章细节可以包含在源注释中。

序列准备：

准备一份质量检查序列的FASTA文件。删除矢量，低质量序列和你的序列中可疑的数据之前提交。

的源信息登革热病毒序列：

独特隔离名称。
完成收款_日期，包括月份和日期（如果知道）；这是病毒样本在现场采集的日期；必须采用以下格式：“DD-Mmm-YYYY”、“Mmm-YYYY”和“YYYY-”。示例：2015年1月12日，2016年12月。
国家在哪里收集病毒；请参见INSDC国家列表获取允许的名称和格式。中冒号后面的信息格式应按大小顺序呈现，即国家：州、市。例如，“美国：马里兰州，贝塞斯达”。
主机生物；如果病毒没有从宿主中分离出来有机体，进入“环境”。
隔离源; 病毒所在的物理环境收集。例如：粪便、鼻拭子、肝脏等信息未收集，请输入缺少的术语。
基因型; 必须是1到4之间的阿拉伯数字。其他信息，如“Cosmopolitan”应作为血清型输入。
可选：文章细节可以包含在源注释中。

序列处理

FASTA文件中的序列将在提交门户向导中自动处理，以解决常见的序列问题，包括：

修剪终端NNN和模糊序列结束
去除含>50%模糊核苷酸的低质量序列
检查病媒和外来污染，以及：
- 修剪终端向量（强匹配和中等匹配）
- 去除带内向量的序列
- 去除完全是矢量的序列
去除低于GenBank可接受的最小序列长度的序列(政策).
去除序列长度超过给定提交类型的预期长度
嵌合序列已确定并且可能是远离的.
识别出有问题的rRNA-ITS序列。组装错误、嵌合或其他问题rRNA-ITS序列可能是远离的.

如果在您的上传的序列。详细的报告总结了在您的提交文件将在提交文件的最后一页提供给您。完成提交后将对序列进行质量保证检查。如果检测到错误，我们将为您提供错误报告及更多详细信息。在解决所有错误并处理您的数据后，您将接收包含您的加入和最终处理记录的电子邮件。您的最终处理记录也将发布在GenBank提交门户中。

FASTA文件帮助

如何组织提交：

按类型或轨迹组织序列文件，并提交一份每种类型。例如，所有原核16S rRNA序列将是一次提交，所有原核23S rRNA序列将是一个第二次提交。您可以在一个FASTA文件中提交一种类型的多个序列。

程序和文件保存：

接受纯文本（.txt）核苷酸FASTA文件。
使用文本编辑器（例如：记事本或写字板）准备文件包含FASTA格式的核苷酸序列集并保存文件作为纯文本或文本。
如果您不确定程序中的“保存”选项是否会保存作为纯文本，使用“另存为…”并在“另存类型：”下拉菜单中选择
- “文本文档”（写字板）
- “纯文本”（Word）
做不将文件另存为.doc或.rtf（富文本格式）

文件格式：

集合中的每个序列都包含一个FASTA定义行，后跟原始序列数据。
每个序列的定义行以“>”开头，后跟序列标识符（sequence_ID）。Sequence_ID标识所有提交的步骤。
Sequence_ID在集合中必须唯一，并且不能包含空格.
Sequence_ID只能包含以下字符-字母、数字、，连字符（-）、下划线（_）、句点（.）、冒号（：）、星号（*）、数字符号（#），和正斜杠（/）。
Sequence_ID应该相对较短（最好少于25个字符）。
sequence_ID之后的信息可能不包含在最终处理的记录中。
通过硬返回将定义行与序列分开（在Sequence_ID之后按键盘上的enter键）。
您可以使用菌株、隔离物、样本凭证或克隆ID作为FASTA文件中的sequence_ID。如果这样做，请不要在sequence_ID中包含额外信息，例如生物体名称等。
可选：您可以在FASTA定义行中使用源修饰符来提供源信息。如果您这样做，必须遵循严格的格式规则。后面包含的任何文本未正确格式化的sequence_ID将被覆盖，并且可能不会包含在最终版本中已处理提交。有关如何在FASTA定义行中格式化源修饰符的更多信息，请看美国金融服务贸易协会在这里帮忙.

图1。FASTA文件示例

>序列ID1¶CCTTTATCTATCTTTGGAGCATAGCTGGCATAGTGGACCCCTCTCCCTCATCCGTGCAGAACTTGGACAAC公司TGCAGAACTTTGGACAACCTTTATCTAATCTTTGGAGCATGAGCTGCATAGTTGGAACCCCCTCATCCGTTGGAGCGAGCTGGCATAGTGGAACCCCCCCTCTCATCCGTGCAGAACTTGCAACCTTTAATCTATAGTGGAACCGCCCCCCTCCCTCATCCGTGCAGAACCTTTATCAATCTTTGGAGAGCTGGC

>序列ID2¶硬回报
CCTTTATCTATCTTTGGAGCATAGCTGGCATAGTGGACCCCTCTCCCTCATCCGTGCAGAACTTGGACAAC公司TGCAGAACTTTGGACAACCTTTATCTAATCTTTGGAGCATGAGCTGCATAGTTGGAACCCCCTCATCCGTTGGAGCGAGCTGGCATAGTGGAACCCCCCCTCTCATCCGTGCAGAACTTGCAACCTTTAATCTATAGTGGAACCGCCCCCCTCCCTCATCCGTGCAGAACCTTTATCAATCTTTGGAGAGCTGGC

如何设置FASTA定义行的格式，如上例所示：

键入“>”符号。
键入Sequence_ID。
按键盘上的“回车”键插入硬回车。
在下一行，按顺序粘贴。

源信息帮助

GenBank需要您的每个序列的唯一源信息提交。对于某些提交类型，您可以选择字段（源修饰符），您将在其中提供唯一信息。您在上进行的选择这个源信息页面用于设置表格和模板，以便提供有关源寄存器修改符第页。

如果您要提交多个序列，则未使用FASTA修饰符，以及您的sequence_ID似乎是菌株、隔离物、克隆或样本凭证ID，系统将提示您一个问题，询问sequence_ID是否代表一个“源信息”页面上列出的字段。选择适当的选项，如果sequence_ID表示页面上列出的字段之一。选择NONE（无）如果sequence_ID很长或包含的信息比任何一个字段的范围(源修饰符字段的描述).

源修改器帮助

什么是源修改器？

源修饰符是一组定义的描述性字段，用于收集有关序列源的信息。每次提交类型具有一组不同的必需修饰符。值的示例对于给定的修饰符，将在您的提交文件和清单带有定义和示例的源修饰符可用。

可以通过多种方式提供源修饰符信息：

单序列提交默认为您键入的窗体直接在页面上显示源信息。选项卡分隔的表上传选项也可以在表单上单击“How do you want to apply source modifiers”并选择“Upload a tab-delimited table”单选按钮。
多序列提交有多个选项提供源修饰符：

可编辑表：如果提交中的序列少于1000个，则选项将源修饰符直接键入到源上的可编辑表中提供了修饰符页。
对所有序列应用相同的值：如果sequence_ID表示源修改器的值，例如克隆、菌株或隔离ID和FASTA未使用修饰符，则为应用相同源修饰符值的选项所有序列都可用。
制表符分隔表：使用提供的模板文件。具体说明在下面的部分中提供。

FASTA源修改器可用于FASTA定义行中的单个和提交次数最多。信息将被解析并显示在源上修改器页面（如果是）格式正确.
关于大规模TLS研究的注释：源修改器选项以上所列不适用于TLS研究。这个TLS提交指南提供信息关于来源。

如何编辑源修饰符选项卡分隔的模板表：

您可以使用电子表格程序（例如：Excel）或文本编辑器（例如：记事本或写字板）来准备源修改器文件。
文件必须另存为纯文本（.txt）或文本（制表符分隔）.

在“源修改器”页面上，单击“下载源修改器模板”。
如果文件没有自动打开，请将其打开。
此文件包含所需的标头，并使用Sequence_ID填充在FASTA文件中使用。不要编辑标题或Sequence_ID。
通过以下两种方式之一添加源信息：

文本编辑器：直接在下载的表中添加所需信息。每个字段必须用1个制表符隔开。将文件另存为文本或制表符分隔的文本。
电子表格程序：在电子表格中打开模板或选择所有下载文件中的文本，并将其复制到电子表格程序（如Excel）中编辑。这样做将有助于维护表的选项卡结构。在你完成之后将源信息添加到电子表格中的每一行，另存为“Text（tab-delimited）”类型。

使用浏览按钮在“源代码修改器”页面上上载以tab分隔的文本文件。

请参见图2对于标题行和图3源修饰符表的示例用于未培养样本的序列。

图2。源表标题行示例。此源表示例标题行包含未培养样本所需的所有源修饰符。单个选项卡分隔每个列标签。

序列_ID⇥选项卡
克隆⇥选项卡
隔离源⇥选项卡
有机体¶硬返回

图3。示例源表。一个标签将每个标签分开列和每一行以硬返回结束。第一行是标题行。数据从第二行开始。

序列_ID⇥选项卡
克隆⇥选项卡
隔离源⇥选项卡
有机体¶硬回报
作业控制-1⇥作业控制-1⇥农田径流⇥不可培养细菌¶定义-1⇥定义-1⇥湖水⇥不可培养细菌¶

图4。源表格式不正确的示例。
有时，在文本编辑器程序中，在以制表符分隔的表的显示中，列不会在视觉上对齐。不要试图通过添加额外的制表符或空格来对齐列。如果将表格复制到电子表格程序中，可以检查列对齐方式以确保其正确。

序列_ID⇥选项卡
克隆⇥选项卡
隔离源⇥选项卡
有机体¶硬回报
作业控制-1⇥abc-1型⇥农田径流⇥不可培养细菌¶定义-1⇥定义-1⇥湖水⇥	⇥不必要的额外标签将导致处理错误！
不可培养细菌¶

请查看我们在下面提供的常见问题解答。有关更多问题，请写信至：gb-admin@ncbi.nlm.nih.gov.在您的信息中包含您的SUB#，并指出您正在使用GenBank提交门户。

确保FASTA文件中的每个序列都有一个定义行，并且有效的Sequence_ID。请参阅下的“文件格式”FASTA文件帮助以获取更多指导。遵循“如何格式化FASTA”定义行的说明。
检查文件中是否有任何特殊字符并将其删除。不要使用带有符号或变音符号的文本，如变音符号、重音符号或波浪线。请使用标准英文字母。阿尔索请参阅下的“程序和文件保存”FASTA文件帮助和源修改器帮助关于如何另存为纯文本文件。
删除序列ID中的所有空格或制表符，确保序列ID少于25个字符，并且每个序列ID在FASTA文件中都是唯一的。序列ID不能包含空白。确保您已遵循FASTA文件帮助说明。

例如，以下FASTA将生成重复的序列ID错误，因为两个序列都被解释为具有序列ID“序列”。注意“序列”后面的空格。

FASTA不正确
```
>顺序1AAAATTTTTGAAAAAGGGG公司>序列2AAAATTTTTGAAAAAGGGG公司
```
为了纠正这个问题，单词“Sequence”后面的空格是远离的。现在，序列ID被解释为Sequence1和序列2和是唯一的。

修正后的FASTA
```
>序列1AAAATTTTTGAAAAAGGGG公司>序列2AAAATTTTTGAAAAAGGGG公司
```
您无需格式化或添加提交的最终定义行。定义行由我们的软件自动覆盖和处理在记录处理期间。您在其中包含的任何信息可能不包括在内在最终处理的记录中。
源修饰符是一组定义的描述性字段，用于收集有关序列源的信息。每次提交类型具有一组不同的必需修饰符。值的示例对于给定的修饰符，将在“源修饰符”页面上提供给您，并且可用修饰符列表及其定义和一些示例如下提供于这帮助文档。您不能包含未在定义页面。源修饰符值可以通过tab分隔的源表，通过“源修改器”页面上的表单，或通过FASTA定义行。有关更多信息，请参阅源修改器帮助.
对于未培养样本，使用通用引物，生物体名称的格式应为：

没有文化的属服务提供商。未培养的家庭（或更高级别）细菌没有文化的家庭（或更高级别）古埃及没有文化的领域

例如：

未培养大肠杆菌。未培养肠杆菌科细菌未培养脱附杆菌不可培养细菌未培养古菌

对于未培养样本，使用种特异性引物，有机体名称应为完全二项式。例如：大肠杆菌

对于来自内共生体或植原体，生物体名称的格式应为：

属内共生体主办 '主持人学名'疾病类型植原体

例如：

嗜胚赤眼蜂Wolbachia内共生体卢氏Sialis lutaria内共生立克次体紫锥菊“巫婆”-金雀花植原体 ‘Crotalaria juncea’灰黄植原体

如果您对生物体名称还有疑问，请写信给：gb-admin@ncbi.nlm.nih.gov.在消息中包含SUB#，并指出您正在使用GenBank提交门户网站。
如果您提交的是真核生物序列，则需要提供其中一个生物的名称和唯一ID每个序列所需的源修饰符。对于唯一ID，请为选择最合适的源修饰符并为每个序列提供唯一值。分离物、菌株、克隆物、栽培品种，可以接受品种、文化采集或样品凭证。不要将所有这些都用于一次提交。选择最适合您提交的内容。例如，如果您从提交序列有样本凭证的蘑菇，请使用样本凭证来源修饰符。如果您提交不同鸡品种的序列，使用品种。
使用拉紧只有从无菌培养物（纯培养物）中测序。

对于未培养样本，使用隔离如果你从DGGE、TGGE样本中测序，或使用种特异性引物。使用克隆对于别的。
这些是唯一的（不同的）字母数字代码，用于跟踪您的实验室。提交原核生物序列时必须提供独特的菌株、克隆或隔离代码。

做不使用顶级BLAST匹配的应变、隔离或克隆值。

做不对菌株、分离或克隆使用物种名称或有机体名称。
此常见问题解答适用于原核的仅序列。对于未培养样本，您必须提供隔离源或主机。如果您提供了主机，则不需要隔离源。您可以同时提供。这个隔离源用于描述您获得样品（例如：餐厅食物垃圾）。使用主办如果你的样品是从另一生物体内或在另一生物体上获得。你可以使用科学名称或寄主生物体的通用名称。请勿将人名或实验室名称用于宿主。
使用“下载源代码”下载包含源代码信息的表源修改器页面上的“修改器模板”链接。提供所需的所有内容您下载的文件中的“源修改器”页面上列出的信息。保存修改后的表并使用“源修改器”页面。单击“继续”验证信息。
如果需要编辑具有[多个值]或在Source Modifiers页面上的[Copied from Seq ID]，选择单选按钮下的“每个序列的不同值（通过表文件上传）”问题“您想如何应用源修饰符？”，然后单击“下载源代码修改器模板”以获取我们目前为您提交的源信息。使更正此表，将文件保存为以tab分隔的文本，然后上载使用browse按钮修改了表，并单击continue验证信息。
靶向基因座研究（TLS）是一项大规模的靶向测序未培养16S核糖体RNA项目（>2500序列）源于环境的有机体。包括所有序列在单个TLS提交中链接到单个BioProject中并包括每个隔离源的生物样本提交。TLS研究的所有要素都被归类在一起列在序列集浏览器中。更多信息和TLS提交要求列在TLS提交指南.
如果获得了目标基因座研究提交文件中的序列从多个BioSamples中，需要一个以tab分隔的映射文件列出了中每个序列应包含的生物样本你的意见。该映射文件应包括BioSample如果样本是在序列提交。如果在16S中创建生物样本核糖体RNA提交向导，应使用样本名称。目前，每个序列只能包含一个生物样本ID。
您不需要在提交工具中为rRNA-ITS序列提供注释。包含部分或全部rRNA-ITS操纵子的序列会被自动注释使用来自ITSx工具(Bengtsson-Palme等人，2013年).如果没有问题，最终处理的记录将具有这些注释在序列中检测到。请确保在提交类型页面，以便正确注释序列。将与您联系如果有问题我们需要你回答。

为了确保应变的格式正确，应根据您在主机、国家/地区、隔离区和collection-date字段。

例如，此表：

序列_ID	国家	收款日期	主办	隔离源	血清型	隔离	笔记
序号1	美国：爱荷华州	2017年2月17日	猪	粪便	H1N2型	8481	通道详细信息：MDCK
序号2	美国	2016年12月	猪	鼻拭子	H1N2型	A016型	上半年
序号3	美国：马里兰州，贝塞斯达	2017年2月21日	智人；性别F	鼻拭子	混合的	美国广播公司678

将导致以下菌株：

序号1	A/猪/爱荷华州/8481/2017
序号2	A/猪/美国/A016/2016
序号3	A/Bethesda/abc678/2017

如果您在中包含了额外信息，尤其是正斜杠（/）隔离指定，您将看到此错误。不包括格式化隔离物中的应变信息。隔离应仅包含隔离名称。此信息将用于正确构建格式化菌株名称以及宿主、国家和您提供的收集日期信息。
隔离源是病毒所在的物理环境收集。这是流行病学研究的重要信息。它可以是宿主动物的器官（肺），有关采集的信息来自宿主（鼻拭子）或环境的物理位置隔离（鸟笼、污水）。如果病毒传播时未收集此信息已收集，请使用隔离源中缺少的术语。
在主机中使用术语“环境”，并提供适当的详细信息关于隔离源中的物理环境。
您无需为病毒式提交提供注释。它将使用IVR注释工具或者VADR公司.我们强烈要求建议您在提交之前使用这些工具检查序列。如果这些工具会指示序列中的错误，请在提交之前更正它们。错误代码如下所述桌子.
提交类型页面上选择的基因组是更广泛的类型将用于您最终记录中的生物体名称的信息。例如，如果选择GII，则/有机体=“诺如病毒GII”将使用。然而，更详细的基因型信息通常是已知的。该信息应填写为基因型；例如GII公司。第16页_ GII.4.用于基因型的名称必须从提交类型页面上选择的基因组开始。如果病毒未在基因组水平以下分型，则输入基因组单独作为基因型。
登革热病毒提交的基因型必须是来自1到4。应添加其他信息，如“Cosmopolitan”或“VII”作为血清型。

确保隔离物位于图像电视指定的格式，它将根据您的在东道国、国家、，隔离和收集日期字段：

SARS-CoV-2/主机/地点/样本ID/日期

请提供隔离中的sample_ID。

例如，此表：

序列_ID	国家	收款日期	主办	隔离	隔离源	笔记
序号1	美国：华盛顿，金郡	2020-03-24	智人；女性的	WA-ID-2345	鼻拭子	通道详细信息：Vero1
序号2	中国：武汉	2019-12-26	人类	W12ab型	鼻咽拭子
序号3	荷兰	2020-04-02	水貂	NB43-1343型	喉咙

将导致以下隔离：

序号1	SARS-CoV-2/人类/美国/WA-ID-2345/2020
序号2	SARS-CoV-2/人/CHN/W12ab/2019
序号3	SARS-CoV-2/mink/NED/NB43-1343/2020

查看报告的注释错误，因为它们通常表示序列错误组装或不正确的序列调用。如果您有证据表明中断是正确的，并且是自然发生的，请将证据的简要描述和您的SUB编号发送至：gb-admin@ncbi.nlm.nih.gov.
写信给：gb-admin@ncbi.nlm.nih.gov，在您的消息中包含您的SUB#，并指出您正在使用GenBank提交门户。

GenBank提交门户向导

要求：

序列准备：

的源信息严重急性呼吸综合征冠状病毒2型（SARS-CoV-2）序列（提供的信息将用于构建格式正确的ICTV隔离指定）：

序列准备：

的源信息原核rRNA序列：

序列准备：

的源信息真核生物rRNA和rRNA-ITS序列：

序列准备：

的源信息后生动物（多细胞动物）线粒体COX1序列：

序列准备：

的源信息真核mRNA序列：

真核细胞核mRNA序列的特征注释：

序列准备：

的源信息流感序列（提供的信息将用于构建格式正确的流感菌株名称）：

序列准备：

的源信息诺沃克病毒序列：

序列准备：

的源信息登革热病毒序列：

序列处理

FASTA文件帮助

如何组织提交：

程序和文件保存：

文件格式：

源信息帮助

源修改器帮助

什么是源修改器？

可以通过多种方式提供源修饰符信息：

如何编辑源修饰符选项卡分隔的模板表：

常见问题

出现一个错误，指示我的FASTA文件不是以定义行开头的，或者包含无效字符，我该如何解决这个问题？

该错误表明我的文件是二进制的，但是我上传的是纯文本文件，我该如何更正？

出现错误，指示FASTA文件中存在重复的序列ID。如何更正此错误？

如何格式化GenBank记录中的DEFINITION行？

什么是源修改器？

如何格式化未培养样本序列的生物体名称？

我正在提交真核生物序列，我应该提供哪些所需的源代码修改器？

我什么时候提供菌株、克隆或分离原核序列？

什么是独特菌株、独特克隆或独特分离物？

何时使用隔离源？我什么时候使用主机？是否需要此信息？

如果我在核苷酸FASTA文件中提供了源代码修改器，但源代码信息没有在源代码修改程序页面上验证，该怎么办？

我无法对所有序列使用相同的值（通过填写表单）编辑“源修改器”页面上的值。我想编辑的字段表示[Multiple values]或[Copied from Seq ID]。如何编辑此字段？

什么是靶向基因座研究（TLS）？

什么是BioSample映射文件？

如何将注释添加到rRNA-ITS提交中？

我上传了一个带有菌株列的流感序列源文件。为什么我会出错？

为什么我在提交的流感病毒隔离物的格式中出现错误？

什么是隔离源，为什么病毒提交需要隔离源？

如果我的病毒序列不是从宿主动物那里收集的呢？

如何为我的病毒提交添加注释？

当我已经指定了基因组时，为什么你要求诺沃克病毒基因型？

为什么我在提交的登革热病毒报告中收到关于基因型格式的错误？

为什么我的SARS-CoV-2隔离物的格式出现错误？

如果我提交的SARS-CoV-2有自然发生的突变，我该怎么办？

还有问题吗？

的源信息严重急性呼吸综合征冠状病毒2型（SARS-CoV-2）序列
（提供的信息将用于构建格式正确的ICTV隔离指定）：

的源信息流感序列
（提供的信息将用于构建格式正确的流感菌株名称）：