美国国旗

美国政府的官方网站

验证和差异报告错误解释

下面列出了处理过程中发现的个别错误的解释。其中包括修复错误的建议,以修复最常见的问题。有关基因组的问题,请写信给:genomes@ncbi.nlm.nih.gov有关GenBank的问题,请写信给:gb-admin@ncbi.nlm.nih.gov

错误列表

SEQ_FEAT_BadCharIn作者姓氏

解释:作者名称包含非法字符。

建议:检查序列和出版物引用中的姓氏(姓氏)。名称只能使用纯ASCII文本。姓氏不应包含符号、数字、重音符号、变音符号、带变音符号的字符,也不应以标点符号结尾。请注意,带有内部标点符号的名称,如“St.John”或“D'Abaco”将生效。

示例:

错误:亨利·琼斯。,Carlos Méndez,Xu 1翁

更正:亨利·琼斯、卡洛斯·门德斯、徐翁

在这些姓氏中使用终结点、重音和数字会导致错误。可以通过删除符号、带变音符的字符、数字或标点符号来更正错误。

SEQ_FEAT_BadCharIn作者姓名

解释:作者名称包含非法字符。

建议:检查序列和出版物引用中的名字(给定名称)。名称只能使用纯ASCII文本。名称不应包含符号、数字、重音符号、变音符号、带变音符号的字符,也不应以标点符号结尾。请注意,带有内部标点符号的名称,例如“St.John”或“D'Abaco”或“Mei-Lai”都可以。

示例:

错误:J#ane Doe,JoséPerez,1Xu Weng

更正:Jane Doe、Jose Perez、Xu Wang

使用符号和数字会导致错误。可以通过删除符号、带变音符的字符、数字或标点符号来更正错误。

SEQ_FEAT_内部停止

解释:预测的编码区域包含一个内部终止密码子。这通常表明核苷酸序列错误或低质量序列末端修剪不足。

建议:检查序列数据。从序列中删除低质量或有问题的数据。

GENERIC_作者列表HasEtAl

解释:作者列表包含et al。

建议:检查序列和出版物参考中的名称(姓氏)。使用作者的完整姓名列表。不要用“et al.”来表示作者列表。

SEQ_DESCR_Bad海拔高度

解释:高度是无效的高度值。海拔高度应以米为单位

建议:更正或删除高度源修正值。提供高于或低于标称海平面的高度(以米为单位)。海拔代表采集序列样本的位置的地理海拔。

示例:

1235米

-20米

SEQ_DESCR_Bad收集日期

解释:收款日期的格式不符合要求。

建议:更正collection-date源修饰符,使日期的格式正确。例如,collection-date的格式应该如下:DD-MMM-YYYY,其中月份是英语中的三个字母代码。对于基因组和生物样本提交,可以使用ISO 8601标准,参见说明和示例在这里.

正确格式的收藏日期示例:

1999年7月1日

2010年11月

2008

SEQ_DESCR_Bad国家代码

解释:国家代码(直到第一个冒号)不在批准的国家列表中。

建议:更正批准的国家名单并验证国家/地区值的格式是否正确。如果要包含更具体的位置信息,必须首先放置批准的国家/地区名称,然后是冒号,最后是其他信息。国家/地区有特定的格式,必须按以下格式设置:

<批准的国家名称>:<地区或特定区域>

示例:

冰岛

加拿大:温哥华

大西洋:查理·吉布斯断裂带

SEQ_DESCR_BadPCR引物名称

解释:PCR引物名称似乎是序列而不是识别标签。

建议:fwd-primer-name和rev-primer-nname值不应为引物序列。在源修改器中更正此信息。如果您打算提供引物序列,请使用fwd-primer-sequence和rev-primer-ssequence源修饰符。

SEQ_DESCR_BadPCR主序列

解释:PCR引物序列具有非法字符或非IUPAC核苷酸。

建议:PCR引物序列必须仅包含核苷酸序列。不要包含任何额外信息,例如引物名称、5'-或3'。删除多余的信息,使fwd-二聚体序列和rev-二聚物序列修饰语包含IUPAC简并碱基字母表中给出的核苷酸。如果引物序列中有肌苷(i),则在字母i两侧使用大于和小于符号格式化,如“atggggaccc”。

例如:

不正确:5'-atggggaccc-3',5'-ttkktcaiccgc-3'

更正:atggggaccc,ttkktca毛细管气相色谱法

序列_DESCR_BadVoucherID

解释:以下源修饰符之一缺少特定标识符:culture-collection、specimen-voucher或bio-material。

建议:更正文化收集、样本凭证或生物材料源修饰符的格式。文化收集、样本凭证或生物材料缺少标识符。培养收集应用于微生物序列,而样品-凭证应仅用于植物和动物。不要使用specimen-voucher来描述微生物序列提交的宿主信息。

culture-collection的格式必须如下:“<institution-code>:[<collection-code>:]<culture-id>”。机构代码和文化ID是必需的,集合代码是可选的。机构代码必须有效。请参阅描述正确的格式和列表允许的机构。

文化收集的一个例子是:CBS:1234

在本例中,CBS是机构代码,1234是文化ID。机构代码和文化ID之间必须有冒号。

样本凭证不需要按照上述格式进行构造。您可以删除冒号以取消构造样本-凭证。

SEQ_DESCR_生物源缺失

解释:未正确描述该序列的生物来源。提交的文档必须包含涵盖整个分子的源描述符。请添加源信息。

建议:为提交的每个序列提供一个生物体名称。

SEQ_DESCR_DuplicatePCR Primer序列

解释:PCR引物序列有重复的子序列。

建议:源修饰语中有多个相同的引物序列。删除重复的序列,这样就只有唯一的引物序列。

SEQ_DESCR_格式不正确的凭证ID

解释:以下源修饰符之一缺少特定标识符:culture-collection、specimen-voucher或bio-material。

建议:更正文化收集、样本凭证或生物材料源修饰符的格式。文化收集、样本凭证或生物材料缺少标识符。培养收集应用于微生物序列,而样品-凭证应仅用于植物和动物。不要使用specimen-voucher来描述微生物序列提交的宿主信息。

区域性集合的格式必须如下:“<机构代码>:〔<集合代码>:〕<区域性id>”。机构代码和文化ID是必需的,集合代码是可选的。机构代码必须有效。请参阅描述正确的格式和列表允许的机构。

一个示例文化集合是:CBS:1234

在本例中,CBS是机构代码,1234是文化ID。机构代码和文化ID之间必须有冒号。

样本凭证不需要按照上述格式进行构造。您可以删除冒号以取消构造样本-凭证。

SEQ_DESCR_LatLon国家

解释:lat_lon和country不一致

建议:提供的经纬度(lat-lon)值未映射到提供的源国家/地区,因此请更正或删除lat-lon值和/或国家/地区源修饰符。以十进制度数提供罗盘方向的纬度(例如:39.7 N 42.1 W),并检查纬度坐标是否映射到您提供的国家。

SEQ_DESCR_LatLon格式

解释:lat-lon的格式应为dd.dd N|S ddd.dd E|W。

建议:使用十进制度数格式的纬度-经度(lat-lon)坐标和指南针方向更正纬度-经纬度(lat-lon)源修饰符。例如:39.7 N 42.1 W

序列_DESCR_LatLonRange

解释:纬度或经度超出范围。

建议:更正或删除源修饰符中的经纬度(lat-lon)值。提供以十进制度数表示的纬度,并包括罗盘方向(例如,39.7 N 42.1 W)。经度值的范围为0到180E或0到180W。纬度值的范围为0到90 N或0到90 S。超出这些范围的数字将导致错误。

序列_DESCR_LatLonValue

解释:纬度或经度值似乎位于错误的半球或交换。

建议:更正或删除源修饰符中的纬度-经度(lat-lon)值。记录的锁定值与提供的来源国不一致。根据来源国,纬度值似乎具有错误的半球或被交换。检查坐标和罗盘方向,并提供正确的值。

通用_缺少发布要求

解释:出版物缺少重要信息,如标题或作者。

建议:检查参考资料。提供作者姓名、标题,并选择出版状态(未出版、正在出版或已出版)。如果标题已出版或正在出版,请提供其他信息,包括出版年份、期刊、卷和页数(如适用)。

通用_丢失信息

解释:缺少一个发布要求。

建议:如果出版物是印刷或出版的,请检查是否添加了年份、作者、标题和期刊名称。对于提交人参考,检查机构和国家是否存在。

SEQ_DESCR_结构化凭证

解释:文化集合需要结构为“<机构代码>:[<集合代码>:]<文化id>”。

建议:更正culture-collection源修饰符的格式。机构代码和文化ID是必需的,集合代码是可选的。按照说明中的格式说明进行操作。区域性集合必须有一个有效的机构代码,后跟冒号和区域性ID。请参阅列表允许的机构。

例如CBS:1234

在本例中,CBS是机构代码,1234是文化ID。机构代码和文化ID之间必须有冒号。

如果集合不在允许的机构列表中,请发送电子邮件至gb-admin@ncbi.nlm.nih.gov附上以下信息:您的GenBank SUB#,确认该收藏是一个精选标本集,收藏主页,以及馆长的姓名、电话和电子邮件。

16SrRNA的SEQ_DESCR_Wrong生物体

说明:真核核糖体中不存在16S核糖体RNA。

建议:检查你提交的序列的生物体名称。如果您提交的是原核生物16S核糖体RNA,则生物体名称应具有原核生物名称。请勿将宿主用作生物体名称。例如,如果细菌16S rRNA是从人类样本中测序的,请使用未培养的细菌作为生物体名称,不要使用智人作为生物体名称。

检查您用于提交的工具。如果您正在使用原核生物16S rRNA序列提交向导来提交非原核生物16 S rRNA的序列,您应该使用不同的提交工具提交序列。

SEQ_DESCR_Wrong凭证类型

解释:机构(或机构:托收)代码通常使用不同的生物材料/文化托收/样本凭证类型。

建议:在源修饰符中,使用源修饰词“culture-collection”而不是“specimen-voucher”,反之亦然。例如,如果在以tab分隔的表中提供了源修饰符,请编辑该表,以便使用列标题“culture-collection”代替“specimen-voucher”,并上载修改后的表。

请注意,培养收集应用于微生物序列,而样品凭证应仅用于植物和动物。不要使用specimen-voucher来描述微生物序列提交的宿主信息。

SEQ_DESCR_无效SexQualifier

解释:提供的信息不在此限定符的批准值列表中。

建议:使用下列术语之一。如果您的术语没有列出,您可能使用了错误的限定符。请参见描述以及示例。

性别值:雌性、雄性、雌雄同体、单性、双性、无性、雌雄异体[或金钱]、雌雄异株[或死亡]

DISC_DUP_DEFLINE光盘

解释:定义行应唯一

建议:您的一些记录没有唯一信息。提供唯一源信息的组合。例如,提供唯一的克隆名称。例如,两个唯一的克隆名称是xyz1-123和xyz2-567。

DISC_FEATURE_MOLTYPE_不匹配

解释:具有rRNA或misc_RNA特征的序列应为基因组DNA

建议:分子类型应表示实际测序的分子类型。一般来说,对rRNA基因或rRNA/ITS区域进行测序的提交实际上是对基因组DNA进行测序。在您指出已测序的分子类型的地方更正此信息。例如,如果您在FASTA定义行中指出rRNA,请删除此信息或将其更改为基因组DNA。如果你真的测序了RNA,请写信给gb-admin@ncbi.nlm.nih.gov带有您的提交编号。

DISC_INFLUENZA_DATE_MISMATCH公司

解释:应变和collection_date中给出的年份存在差异

建议:请验证现场收集病毒的正确日期,并更新毒株或collection_date。

DISC_INFLUENZA_质量

解释:提交流感序列需要以下源信息:菌株、国家、采集日期、宿主

建议:查看上载的源表并添加缺少的信息。

DISC_INFLUENZA_服务类型

解释:提交甲型流感序列需要血清型

建议:查看上传的源表并添加流感a提交的血清型。

DISC_INFLUNEZA_服务类型_格式

解释:流感A血清型的格式必须为HxNx、Hx、Nx或混合,其中x代表数字

建议:检查提供的血清型信息并调整到正确的格式。

光盘_发布_附件

解释:缺少从属关系

建议:您提交的资料中缺少进行测序/分析工作的机构名称。在您提供联系信息的地方提供此信息。

DISC_NO_注释

解释:无法将批注添加到此序列。

建议:验证您是否为序列选择了正确的提交类型。其他错误可能会与此错误一起出现,以澄清问题。

DISC_REQUIRED_CLONE光盘

解释:未培养或环境来源应具有克隆

建议:为序列提供唯一(不相同)的克隆名称。克隆名称通常是一个字母数字标识符,用于跟踪实验室中的样本。克隆名称不是生物体名称,也不是您正在研究的基因的名称。两个唯一的克隆名称的示例是xyz1-123和xyz2-567。

DISC_REQUIRED_STRAIN光盘

解释:培养的原核来源应具有菌株

建议:为序列提供唯一(非相同)菌株名称。菌株名称是一种字母数字标识符,可以以任何方式指定,例如,它可以基于个人或地区的名称。例如,对于大肠杆菌K12,“K12”是菌株名称或标识符。

上次更新时间:2021-10-15T15:02:52Z