杂志的下一篇文章
缺氮胁迫下玉米叶片的光谱库
期刊上的上一篇文章
二苯甲酮和铜-2-羟基苯酮配合物的循环伏安还原数据
 
 
订购文章重印
字体类型:
宋体 佐治亚州 宋体,Verdana
字体大小:
澳大利亚 澳大利亚 澳大利亚
行距:
列宽:
背景:
数据描述符

两个版本的基因表达数据集甜根子草AP85-441基因组

通过
尼科拉斯·洛佩斯·罗佐
1,2,†,
毛里西奥·拉米雷斯-卡斯特里隆
2,†,
米盖尔·罗梅罗
1,2,
豪尔赫·芬克
1,2
卡米洛·罗查
1,2,*
1
哥伦比亚卡利760031 Javeriana大学电子与计算机科学系
2
哥伦比亚卡利760031 Javeriana教皇大学OMICAS项目
*
信件应寄给的作者。
这些作者为这项工作做出了同等贡献。
收到日期:2022年9月5日/修订日期:2022年11月17日/接受日期:2022年11月30日/发布日期:2022年12月20日

摘要

:
甘蔗是一种生物量和蔗糖产量都很高的高草种,是世界上产量最大的作物。其进化环境适应和人类繁殖反应导致了复杂的同源多倍体基因组。文献中鲜有报道记录这种生物体的基因共表达和注释,并且在可用的情况下,使用不同的基因标识符,这在研究中不容易关联。本数据描述符文件提供了一个数据集,该数据集合并了两个表达式矩阵甜根子草AP85-441基因组版本和用Python实现的算法,以机械方式获取该数据集。数据处理来自两个来源的等位基因级信息,双向使用BLASTn建议两组等位基因之间的可行映射,并使用图形匹配优化算法最大化基因的全局一致性和唯一性。关联表用于合并等位基因到基因的表达值。贡献的表达矩阵包括96个实验以及来自两个基因组版本的109050和35516。它们可以显著降低甘蔗共表达网络生成、功能注释预测和胁迫特异性基因鉴定等进一步研究的计算成本。
数据集许可证:CC-BY-NC。

1.总结

现代甘蔗是世界上产量最大的作物。它是一种高生物量生产杂交种,具有经验证的光合效率[1],主要来自甜根子草烟叶糖 [2]. 尽管如此,文献中很少有文献报道对该生物体的基因序列、表达和注释进行记录,因此公共基因组数据的可用性很低。
张等人的工作[]是最近为数不多的弥补甘蔗基因组信息缺失造成的差距所做的努力之一。他们报告了自发性链球菌品种AP85-441,此处识别为v2018[4]和2019年版[5]. 每次测序工作都使用不同的等位基因集,并获得不同的总等位基因数。v2018转录组数据被进一步用于表征等位基因表达优势[]、与非生物胁迫和激素反应相关的特定基因[6],淀粉的合成[7],以及与生长发育有关的植物特异性转录因子[8,9,10,11,12].
由于v2018和v2019之间的标识不匹配,因此无法在完整数据集的上下文中直接解释此类实验。例如,了解现代杂交作物(通常培养用于生产糖和乙醇)的杂种优势机制将是有益的,例如哥伦比亚的品种CC-01-1940[13]或SP80-3280(巴西)[14]在这些数据集的帮助下,考虑到大多数基因的表达与基因组中等位基因的频率有直接关系[15]. 方便的是,如果要使用有关该物种单倍体/二倍体品种多倍体化和染色体减少事件的信息,则需要一次性支付整合这两个数据集进行此类探索所需的计算成本和时间,并在随后的实验中摊销。
本文提出了一个数据集和一个算法,用于根据v2018和v2019中的基因组序列构建数据集。提供的数据集包括多个等位基因和品种APS85-441基因表达的综合矩阵。贡献的算法是用Python 3编程语言实现的;它用独特的命名法规范了基因和等位基因标识符,并将等位基因的表达值整合到基因水平。
整个过程包括与BLASTn的全球协调[16],双向应用以在v2018和v2019的等位基因之间找到合适的匹配。映射信息被输入到一个图形匹配优化算法中,该算法旨在最大化v2018中分配给v2019中等位基因的等位基因数量。优化目标是最大化两个基因组版本上选定的等位基因对之间的全局一致性。该算法确保v2018中的一个等位基因最多分配给v2019中的一种等位基因,从而避免了最终数据集中表达式值的重复。
使用原始来源提供的对应表将每个基因组版本的等位基因表达值分别合并到基因水平[4,5]. 得到的表达矩阵包括96个实验,以及分别用于v2018和v2019基因组的109050和35516个基因。本文提出的数据集和实现可以被视为一项新的努力,以弥合甘蔗基因组信息缺失的差距,从而为进一步对该生物体进行基因组实验和探索增加了新的潜力。

2.数据说明

图1介绍了在组合数据集v2018过程中采用的工作流、输入文件、处理步骤和输出(即数据库、中间文件和矩阵)[4]和v2019[5]到单个整合数据集中。每个步骤和文件的详细说明见第3节。输入和输出文件以及代码可从以下位置的存储库中获得:https://github.com/mauriciogeteg/sugarcane-gene-expression网站(2022年12月3日访问)。
每个数据集v2018和v2019都包含编码DNA序列(CDS)和蛋白质的FASTA序列,以及一个包含等位基因关联信息的表格。数据集v2018还包括几个表达式矩阵。然而,该品种的当前参考基因组是v2019。将表达矩阵连接起来,并对等位基因和基因进行调整,如表1.
总的来说,所有矩阵包含96个实验(列),其中包含从原始文件中获得的表达式数据。在v2018的等位基因表达矩阵中,报告了112788个转录物(行),对应于每个基因四个等位基因的所有表达谱。v2019的等位基因表达矩阵由83821个转录物组成。特别地,28967个等位基因的表达值通过该算法合并。关于基因水平的表达矩阵,数据集v2019合并为35516个基因,与之前报告的数据相比,只有6个基因存在差异[]. 总的来说,v2018由109050个基因组成,表明少数等位基因是合并的。
图2显示了等位基因(左)和基因表达(右)的绝对值直方图(FPKM数据)。请注意,这两个数据集中的直方图形状相似,表明最终合并矩阵中没有添加任何显著变化。v2019基因组中从等位基因表达到基因表达的整合大大降低了基因的频率(从83821到35516),垂直缩小了直方图,但水平扩展了直方表,因为一些表达值增加了。
表2显示了表达式矩阵的详细信息。v2018数据集中的最大表达式值保持不变。相反,合并v2019数据集的表达式数据会增加其最大表达式值。一般来说,由于其注释系统,v2019基因组中的数据聚合更高[]. v2019等位基因表达矩阵的零点数约为45%。相比之下,其他矩阵的零点较少(约为33%)。
图3显示了等位基因和基因的表达值分布。请注意,v2019的等位基因信息由于大量的零而高度偏向于较小的值,中位数为0.13。然而,如果去除小于或等于0.001的值,则等位基因表达值的中位数2.12接近基因信息的中位数3.96。
文献中报道了检测同源基因的工具。Zhu等人[17]例如,使用了与本文所述方法类似的方法来检测小麦中的等位基因(小麦)来自两个不同的基因组版本,包括双向使用BLASTp。相反,在所提出的方法中,BLASTn是从预测的CDS中使用的。然而,用于本文提供的数据集的BLASTn参数比上述小麦研究更严格。他们还使用了MCScanX软件包[18]识别亚基因组间的共有区,动态规划和评分模式,以找到相似基因对之间的最核心路径。相反,本文提出的方法依赖于图论,并使用最小成本最大流算法来选择可能的最大连接数。
卡尔利斯托[19]是另一个用于量化属于同一基因的RNA-seq读取的软件包。从这个意义上讲,与参考基因组的比对并不是严格特定的(即,它是一种伪比对),避免了同一基因(等位基因)变体的形成。然而,在Kallisto中,属于可能的“核心”转录本的读取伪比对的生成需要原始的FastQC数据和指数(根据参考基因组估算)。在这里介绍的方法中,每个基因组版本使用来自CDS的两个FASTA文件。从这个意义上说,贡献的Python代码的目标与之前发布的其他工具不同。此外,本文提出的方法整合了多个注释基因组中的基因,无需与参考基因组进行比对即可组合表达数据。

3.方法

3.1. 数据源

回想一下,这些数据集对应于自发性链球菌品种AP85-441,此处识别为v2018[4]和v2019[5].
网站[4]包含三个基因组:AP85-441(v2018)、Np-X和L-紫色。v2018中的FASTA文件包含CDS和三个带有基因表达水平数据的文件。每个基因的等位基因信息直接从该数据源中检索。生成的文件可以在补充材料中找到,如下所示spon18_allele_info.csv.
网站位于[5]包含AP85-441基因组的第二个版本(v2019)。找不到此数据集的有关表达式的可用数据。使用FASTA文件,包括CDS和CSV文件,记录代表基因及其等位基因之间的关系(糖_蓬特_列尔表-2019年1月csv).

3.2. 预处理

v2018中表达式数据的预处理有一个单一文件作为目标:它合并表达式实验的叶部分(sspon.leafsection.zip文件),昼夜节律(白天_晚上.zip)以及增长和发展(增长周期.zip). 得到的文件,赞助商18_ allele_exp.csv,是补充材料的一部分。
对v2019中基因组的等位基因信息进行组织和过滤,以仅存储相关数据,即代表性基因模型标识符、高粱同系物标识符(如果可用)和四列包含等位基因的信息。每个等位基因在基因组中可以包含多个拷贝。这些重复的等位基因在同一列中用竖线(“|”)隔开。生成的文件可以在补充材料中找到,如下所示Sspon19_所有信息.csv.

3.3. 基因表达整合

3.3.1. 爆炸

从FASTA文件创建了两个数据库,其中包含每个基因组版本的CDS(文件CDS18.fa型CDS19.fa型). 然后,使用每个数据集对另一个数据集执行两次BLAST核苷酸比对(也称为BLASTn)。生成的文件可以在文件夹中找到爆炸_结果。以下参数用于命令行程序:e-value最多为0.000001,最小百分比标识为90,最小百分比覆盖为90,并且只允许通过查询进行最佳的10次对齐(使用每次对齐中的最佳匹配)。

3.3.2. 优化匹配

根据BLAST的输出,发现v2018和v2019中的等位基因之间存在重复关联。对于v2018到v2019之间的映射,源中的CDS可能与目标中的几个CDS关联。为了生成合理的覆盖范围,通过将问题建模为图流优化问题,将这两个映射组合在一起[20]具有多个来源(v2018等位基因)和多个靶点(v2019等位基因)。
最小成本-最大流量问题需要计算具有最大基数(即最大连接数)的图匹配(即匹配节点/顶点的级别),从而确保源-目标关联的最大覆盖。如果可能有多个最大匹配,则生成该最大流的成本将最小化。在这种情况下,可以考虑身份分数来确定与最大身份分数总和的匹配,同时仍然确保v2018等位基因表达最多使用一次。由于在networkx中实现的算法使成本最小化,因此输入到最小成本最大流算法的人工成本在两个版本的等位基因之间的每个可能关联上都很小(即百分比一致性)。
接下来将对该算法进行概述:
  • v2018中的每个CDS都表示为一个节点u个在组中S公司来源的。
  • v2019中的每个CDS都表示为一个节点v(v)在组中T型共个目标。
  • If节点 u个 S公司 和节点 v(v) T型 在任一映射中显示为匹配,然后它们通过边连接 ( u个 , v(v) ) 容量1和成本 稀薄的 对应于它们之间的最高BLAST标识值。
  • 一个额外的源节点 u个 S公司 添加了边 ( u个 S公司 , ) ,每个 S公司 ,容量为1,成本为0,确保v2018中的每个CDS最多只能使用一次。
  • 另一个目标节点 v(v) T型 添加了边 ( t吨 , v(v) T型 ) ,每个 t吨 T型 以无限容量创建,成本为0,确保v2019中的每个CDS可以多次使用。
  • 最后,执行min-cost-max-flow算法 u个 S公司 作为源节点和 v(v) T型 作为汇聚节点。这将对中的大多数节点产生影响S公司使用中的每个节点T型至少有一个可能的传入连接。
v2018和v2019中CDS对的最终匹配用于将表达水平从v2018基因组转移到v2019基因组。v2019中每个CDS的表达式值合并是通过实验性加法进行的。生成的文件可以在补充材料中找到,如下所示赞助商19_ allele_exp.csv; 它由83821行和96个实验表达值组成。

3.3.3. 基因表达整合

v2018中基因组的等位基因信息没有代表性的基因标识符。在这种情况下,选择词典编纂顺序中的第一个基因作为代表。通过添加每个实验的表达值,代表基因列表用于等位基因到基因的表达整合。生成的文件可以在补充材料中找到,如下所示赞助商18_通用_出口.csv生成这个文件的Python代码是冷凝器_无列_18.py.
v2019中的表达信息是使用每个基因的前缀进行处理的。文件中解释了前缀结构自述-SonAnnotation.pdf来自[5]. 如果CDS具有表格序号01G000001-1A,则其代表基因为第01G00000010号文件同一基因不同等位基因的表达值通过每个实验中的表达值相加来合并。共鉴定出35516个基因。结果文件为赞助商19_通用_出口.csv生成此文件的代码位于浓缩物_19.py.

3.4. 元数据

表3在提交下显示与存储库中发布的数据集相关联的元数据60页9344页共报告了16个文件:七个输入文件,其中四个是与BLAST结果和预处理步骤相关的中间文件,其余文件是最终表达式矩阵。

作者贡献

概念化、N.L.-R和M.R.-C。;方法论,N.L.-R.、M.R.和M.R.-C。;软件,N.L.-R和M.R。;调查,N.L.-R.、M.R.和M.R.-C。;数据管理,N.L.-R和M.R。;书面原稿编制,N.L.-R和M.R.-C。;写作审查和编辑,C.R.和J.F。;项目管理、C.R.和J.F。;资金收购、C.R.和J.F.所有作者均已阅读并同意手稿的出版版本。

基金

这项工作的部分资金来源于“OMICAS项目:Optimizacion on Multiescala In-silico de Cultivos Agrícolas Sostenibles(Infraestructura y validación en Arroz y Caña de Az ucar)”科学生态系统,该项目属于哥伦比亚Cientifica项目,由世界银行、科学部赞助,技术与创新(MINCIENCIAS),ICETEX,哥伦比亚教育部和哥伦比亚商业、工业和旅游部,授予编号:FP44842-217-2018,OMICAS奖编号:792-61187。

机构审查委员会声明

不适用。

知情同意书

不适用。

数据可用性声明

用于此数据描述符的数据集、中间文件和代码可在https://github.com/mauriciogeteg/sugarcane-gene-expression网站(2022年12月3日访问),提交“3fbcf98”。原始文件是从以下网站下载的:http://sugarcane.zhangjisenlab.cn/sgd/html/download.html(2022年11月16日访问)和https://www.life.illinois.edu/ming/downloads/Spontaneum_genome(网址:https://www.life.illinois.edu/ming/downloads/Spontaneum_genome)/(2022年11月16日访问)。

致谢

作者感谢卡米拉·里奇奥(Camila Riccio)和克里斯蒂安·索萨(Chrystian Sosa)在执行统计验证(数据未显示)方面提供的帮助,并在阅读手稿后提出宝贵的建设性建议。

利益冲突

作者声明没有利益冲突。

缩写

本手稿中使用了以下缩写:
客户尽职调查编码序列
ASE公司等位基因特异表达
CSV公司逗点分隔值
FPKM公司每百万外显子每千碱基的片段映射
OMICAS公司Optimización Multiescala In-silico de Cultivos Agrícolas Sostenibles公司

工具书类

  1. R.J.亨利。;Kole,C.甘蔗厂基本信息。甘蔗遗传学、基因组学与育种第1版。;CRC出版社:美国佛罗里达州博卡拉顿,2010年;第9卷,第1-8页。[谷歌学者] [交叉参考]
  2. Kim,C。;王,X。;Lee,T.H。;雅各布,K。;Lee,G.J。;Paterson,A.H.对芒果和甘蔗的比较分析揭示了一种共享的全基因组复制,但进化命运不同。植物细胞 2014,26, 2420–2429. [谷歌学者] [交叉参考] [公共医学] [绿色版本]
  3. 张杰。;张,X。;Tang,H。;张,Q。;华,X。;马,X。;朱,F。;琼斯,T。;朱,X。;鲍尔斯,J。;等。同源多倍体甘蔗Saccharum spontaneum L.的等位基因定义基因组。自然遗传学。 2018,50, 1565–1573. [谷歌学者] [交叉参考] [公共医学] [绿色版本]
  4. 甘蔗基因组数据库。2018.在线提供:http://sugarcane.zhangjisenlab.cn/sgd/html/download.html(2022年8月7日访问)。
  5. 明实验室,自发糖AP85-441基因组。2019.在线提供:https://www.life.illinois.edu/ming/downloads/Spontaneum_genome网站/(2022年8月7日访问)。
  6. 蔡,M。;林,J。;李,Z。;Lin,Z。;马云(Ma,Y.)。;Wang,Y。;Ming,R.甘蔗Dof基因对激素和非生物胁迫的特异性表达。公共科学图书馆 2020,15, 1–24. [谷歌学者] [交叉参考] [公共医学] [绿色版本]
  7. 马,P。;袁,Y。;沈(音)。;姜强。;华,X。;张,Q。;张,M。;R·明。;Zhang,J.自发性糖中淀粉合成酶基因家族的进化和表达分析。特罗普。植物生物学。 2019,12, 158–173. [谷歌学者] [交叉参考]
  8. 林,J。;朱,M。;蔡,M。;张伟。;法蒂玛,M。;贾,H。;李,F。;Ming,R.甘蔗TCP基因的鉴定与表达分析。特罗普。植物生物学。 2019,12, 206–218. [谷歌学者] [交叉参考]
  9. 李,Z。;华,X。;钟伟。;袁,Y。;Wang,Y。;王,Z。;R·明。;Zhang,J.同源多倍体自发性糖WRKY家族基因的全基因组鉴定和表达谱分析。植物细胞生理学。 2019,61, 616–630. [谷歌学者] [交叉参考] [公共医学]
  10. 李,P。;柴,Z。;林,P。;黄,C。;Huang,G.等人。;徐,L。;邓,Z。;张,M。;Zhang,Y。;Zhao,X.甘蔗AP2/ERF转录因子的全基因组鉴定与表达分析(甜根子草L.)。BMC基因组。 2020,21, 685. [谷歌学者] [交叉参考] [公共医学]
  11. X·冯。;Wang,Y。;张,N。;张,X。;吴杰。;黄,Y。;阮,M。;张杰。;齐,Y.甘蔗SPL基因家族的系统鉴定、进化和表达分析(甜根子草).特罗普。植物生物学。 2021,14, 313–328. [谷歌学者] [交叉参考]
  12. 阿里,A。;Javed,T。;Zaheer,美国。;周J.R。;黄,M.T。;Fu,H.Y。;Gao,S.J.细菌病原菌刺激下自发性糖中bHLH转录因子基因家族的全基因组鉴定和表达谱分析。特罗普。植物生物学。 2021,14, 283–294. [谷歌学者] [交叉参考]
  13. Trujillo-Montenegro,J.H。;库比略,M.J.R。;Loaiza,C.D。;昆特罗,M。;Espitia-Navarro,H.F。;F.A.S.维拉雷尔。;C.A.V.瓦伦斯。;巴里奥斯,A.F.G。;Vega,J.D。;杜伊塔马,J。;等。解开哥伦比亚高产甘蔗杂交种的基因组。前面。植物科学。 2021,12, 694859. [谷歌学者] [交叉参考] [公共医学]
  14. Souza,G.M。;斯洛伊斯,M.A.V。;伦布克,C.G。;Lee,H。;马加里多,G.R.A。;霍塔,C.T。;Gaiarsa,J.W。;丁尼兹,A.L。;医学博士Oliveira。;费雷拉,S.D.S。;等。多倍体甘蔗基因组373k基因空间的组装揭示了世界领先生物量作物的功能多样性库。Giga科学 2019,8,小控件129。[谷歌学者] [交叉参考] [公共医学]
  15. 马加里多,G.R.A。;Correr,F.H。;Furtado,A。;博塔,F.C。;Henry,R.J.在高度多倍体甘蔗中有限的等位基因特异性基因表达。基因组研究。 2022,32, 297–308. [谷歌学者] [交叉参考] [公共医学]
  16. Altschul,S.F.公司。;Gish,W。;Miller,W。;迈尔斯,E.W。;Lipman,D.J.基本局部对齐搜索工具。分子生物学杂志。 1990,215, 403–410. [谷歌学者] [交叉参考] [公共医学]
  17. Zhu,T。;Wang,L。;里姆伯特,H。;罗德里格斯,J.C。;交易,K.R。;奥利维拉,R.D。;Choulet,F。;Keeble-Gagnère,G。;Tibbits,J。;罗杰斯,J。;等。光学图谱优化了中国春小麦基因组组装。工厂J。 2021,107, 303–314. [谷歌学者] [交叉参考] [公共医学]
  18. Wang,Y。;Tang,H。;Debarry,J.D。;Tan,X。;李,J。;王,X。;Lee,T.H。;Jin,H。;马勒,B。;郭,H。;MCScanX等人:一个用于检测和进化分析基因共线性和共线性的工具包。核酸研究。 2012,40,e49。[谷歌学者] [交叉参考] [公共医学] [绿色版本]
  19. 布雷,N.L。;Pimentel,H。;梅尔斯特德,P。;Pachter,L.近最优概率RNA-seq量化。自然生物技术。 2016,34, 525–527. [谷歌学者] [交叉参考] [公共医学]
  20. 科尔曼,T.H。;Leiserson,C.E。;Rivest,R.L.公司。;C.斯坦因。算法简介; 麻省理工学院出版社:美国马萨诸塞州剑桥,2022年。[谷歌学者]
图1。工作流程、输入文件、处理步骤和输出(即数据库、中间文件和矩阵)的表示,用于将数据集v2018和v2019合并为单个合并数据集。
图1。表示将数据集v2018和v2019合并为单个合并数据集所采用的工作流、输入文件、处理步骤和输出(即数据库、中间文件和矩阵)。
数据08 00001 g001
图2。v2018和v2019的表达数据(FPKM)的直方图轮廓:(左边)等位基因表达和(正确的)基因表达。
图2。v2018和v2019的表达数据(FPKM)的直方图轮廓:(左边)等位基因表达和(正确的)基因表达。
数据08 00001 g002
图3。等位基因(v2018a,v2019a)和基因(v2018,v2019)数据的表达值分布箱线图。垂直幅度以对数轴显示:(顶部)包括所有表达式值和(底部)仅包括大于0.001的表达式值。
图3。等位基因(v2018a,v2019a)和基因(v2018,v2019)数据的表达值分布箱线图。垂直震级以对数轴显示:(顶部)包括所有表达式值和(底部)仅包括大于0.001的表达式值。
数据08 00001 g003
表1。两个表达式矩阵的组成甜根子草v2018和v2019中的AP85-441基因组。矩阵由96列实验数据组成。
表1。两个表达式矩阵的组成甜根子草v2018和v2019中的AP85-441基因组。矩阵由96列实验数据组成。
矩阵名称等位基因/基因数量参考
Alleles v2018版112,788[]
基因v2018109, 050此数据描述符
Alleles v2019版83,821此数据描述符
基因v201935,516此数据描述符
表2。两个表达式值的描述甜根子草AP85-441基因组。
表2。两个表达式值的描述甜根子草AP85-441基因组。
  所有值值>0.001
矩阵
姓名
最大值计数中值的计数中值的
Alleles版本201828,57910,827,6500.3006,809,2831.720
基因v201828,57910,468,8000.3206,621,5871.761
Alleles v2019版20,1358,046,8160.1274,460,7472.117
基因v201932,2823,409,5360.7442,277,2663.963
表3。与存储库关联的元数据。
表3。与存储库关联的元数据。
规格描述
主题领域生物科学、计算机科学
更具体的主题领域生物信息学、基因组学、甘蔗、表达分析
数据类型数据电子表格、纯文本、Python代码
如何获取数据从开放存取数据库和网站编译
数据源位置全球的
数据可访问性本文中提供的数据可免费公开用于任何学术、教育和研究目的。公共存储库位于https://github.com/mauricogeteg/sugarcane-gene-expression(2022年12月3日访问)
数据集中包含的文件夹4 (爆炸_结果;代码;数字;输入)
作为输入包含的文件7 (通道_信息_2018.csv;通道_信息_2019.csv;昼夜节律.7z;增长.xlsx;叶_截面.7z;Sspon.v20180123.cds.fasta.7z公司;Sspon.v20190103.cds.fasta.7z公司)
包含为blast_results的文件2 (爆炸_2018_2019.txt;blastn_2019_2018.txt文件)
作为图形包含的文件3 (图1.pdf;图2.pdf;图3.pdf)
数据集中包含的代码3 (等位基因转换.py;冷凝器_无列_18.py;浓缩物_19.py)
表达式矩阵4 (Sspon18_列尔_.7z;Sspon18_基因_.7z; 2个压缩矩阵:序号19_.7z)
免责声明/出版商注释:所有出版物中包含的声明、意见和数据仅为个人作者和贡献者的声明、观点和数据,而非MDPI和/或编辑的声明、看法和数据。MDPI和/或编辑对内容中提及的任何想法、方法、说明或产品造成的任何人员或财产伤害不承担任何责任。

分享和引用

MDPI和ACS样式

López-Rozo,N。;拉米雷斯-卡斯特里隆,M。;罗梅罗,M。;Finke,J。;罗查,C。两个版本的基因表达数据集甜根子草AP85-441基因组。数据 2023,8, 1.https://doi.org/10.3390/data8010001

AMA风格

López-Rozo N、Ramirez-Castrillon M、Romero M、Finke J、Rocha C。两个版本的基因表达数据集甜根子草AP85-441基因组。数据. 2023; 8(1):1.https://doi.org/10.3390/data8010001

芝加哥/图拉宾风格

洛佩斯·罗佐、尼科拉斯、毛里西奥·拉米雷斯-卡斯特里隆、米盖尔·罗梅罗、豪尔赫·芬克和卡米洛·罗查。2023.“两种版本的基因表达数据集甜根子草AP85-441基因组“数据8,编号1:1。https://doi.org/10.3390/data8010001

文章指标

返回页首顶部