install.软件包('MACER') 库(devtools)
install.packages(“devtools”) 库(devtools) devtools::install_github(“rgyoung6/MACER”)
库(“MACER”,lib.loc=“HERE”)
>auto_seq_download() 选择要下载的具有感兴趣的类别的文件。 按回车键继续。。。 “C:\\A_MACER\\Chipmunk.dat” “开始时间-2021-06-16 14:51:20-尤塔米亚斯” “尝试BOLD下载-2021-06-16 14:51:20-Eutamias” “BOLD下载错误:无法填充数据表或没有数据” “尝试NCBI下载-Eutamias” “这是搜索字符串的值……(Eutamias[ORGN]OR Eutamias[ALL])NOT(鸟枪[ALL]OR基因组[ALL〕OR组装的[ALLneneneea OR微卫星[ALL')” “下载1000条Eutamias NCBI记录,从…第1条开始,共3248条-2021-06-16 14:51:22” “下载1000条Eutamias NCBI记录,从第1001条开始,共3248条-2021-06-16 14:52:05” “下载1000条Eutamias NCBI记录,从……2001开始,共3248-2021-06-16 14:53:19” “下载1000条Eutamias NCBI记录,从…3001开始,共3248条-2021-06-16 14:54:28” “下载完成:清理NCBI数据表-Eutamias” “开始时间-2021-06-16 14:54:39-塔米亚斯” “尝试BOLD下载-2021-06-16 14:54:39-Tamias” “下载完成:清理BOLD数据表-Tamias” “正在尝试NCBI下载-Tamias” “这是搜索字符串的值……(Tamias[ORGN]OR Tamias[ALL])NOT(鸟枪[ALL]OR基因组[ALL]OR组装的[ALL]OR微卫星[ALL')” “下载1000条Tamias NCBI记录,从第1条开始,共3459条-2021-06-16 14:54:46” “下载1000条Tamias NCBI记录,从第1001条开始,共3459条-2021-06-16 14:55:20” “下载1000条Tamias NCBI记录,从……2001开始,共3459-2021-06-16 14:56:31” “下载1000条Tamias NCBI记录,从…3001开始,共3459条-2021-06-16 14:57:58” “下载完成:清理NCBI数据表-Tamias” “开始时间-2021-06-16 14:58:21-Neotamias” “尝试BOLD下载-2021-06-16 14:58:21-Neotamias” “BOLD下载错误:无法填充数据表或没有数据” “尝试NCBI下载-Neotamias” “这是搜索字符串的值…(Neotamias[ORGN]或Neotamias[ALL])NOT(霰弹枪[ALL]或基因组[ALL]或组装[ALL]或微卫星[ALL])” “下载1000条Neotamias NCBI记录,从第1条开始,共3245条-2021-06-16 14:58:23” “下载1000条Neotamias NCBI记录,从第1001条开始,共3245条-2021-06-16 14:59:01” “下载1000条Neotamias NCBI记录,从……2001开始,共3245条-2021-06-16 15:00:09” “下载1000条Neotamias NCBI记录,从…3001/3245开始-2021-06-16 15:01:31” “下载完成:清理NCBI数据表-Neotamias”
开始时间-2021-06-07 06:30:34-尤塔米亚斯 尝试BOLD下载-2021-06-07 06:30:34-Eutamias 尝试下载NCBI-2021-06-07 06:30:35-尤塔米亚斯 尝试下载NCBI-2021-06-07 06:30:35-尤塔米亚斯 记录数量-3355 物种-阿莫努斯、微小目、西伯利亚目、纹状体、帕尔默里目、莫纳塞西斯、卢西塔尼亚目、塞内克斯目、海参目、阿尔卑斯山、鲁菲卡杜斯、汤森迪目、伞形目、索诺玛目、西斯基尤目、鲁弗斯、四眼目、四斑目、巴拿马目、赭罗根目、蒙昧目、梅里亚米目、杜兰加目、多尔塞利斯目、金丝兰科利目、犬科动物、斗牛目、鼠目、- 分子标记物-细胞色素B、细胞色素-B、细胞色素COX酶亚单位II、16SRIBOSOMALRNA、SIRTUIN6、细胞色素氧化酶亚单位I、VONWILLEBRANDFACTOR、重组激活蛋白1、生长激素受体、搪瓷素、载脂蛋白NB、α2B肾上腺素能受体、光受体间视黄醇结合蛋白、EDG1、12S核糖核酸酶、酪氨酸酶, 重组激活蛋白2、前前列腺素、磷脂酶β4、CAMPRESSIVE元件调节剂、Cannabinoid受体1、BMI1、脑源性嗜酸细胞因子、ATP7A、淀粉样β前体蛋白、腺苷3受体、β2A肾上腺素能受体、柠檬酸合成酶、细胞色素氧化酶亚单位1、核受体亚家族BMEMBER2、锌蛋白ZFX、C-MYC、, C-肌钙蛋白、肌动蛋白、酸性磷酸酶5、TRNA-PHE、过氧化物酶体活化受体γ、RAG1蛋白、甲状腺球蛋白、β-葡萄糖蛋白、PRKC1、促甲状腺素β亚单位、促甲氧基化上乳糜肌球蛋白重链、促甲酰化上乳汁肌球蛋白轻链2、胚胎肌球蛋白链1、光受体间结合蛋白、包膜蛋白结合蛋白-MAR1、细胞色素氧化酶DASE、, 细胞色素氧化酶亚群2、乳酸脱氢酶亚群、血红蛋白、血红蛋白α、SMCYPROTEIN、乳腺癌敏感性1、乳腺癌易感性1、牙本质蛋白1、细胞色素氧化酶亚群1、带胞杆菌糖蛋白2、带粘连蛋白、TTN、GPROTEINBETA亚群5短变异体、伴发性磷酸二酯酶β亚群、ORFII、, 蛋白原激活调节器RGS9-1、冬眠特异性蛋白27、FBN1、BCHE、HP-55、α1-抗胰蛋白酶样蛋白、光敏受体结合蛋白、RAG1、冬虫夏草特异性蛋白-25、MGF、小亚单位核糖核酸酶NA、HP-20、HP-25、肝细胞趋化因子4、NADHEHYDROGENASESUBUNIT1、HP-27、转录因子SP1、甘油脱氢酶-3-磷酸脱氢酶、, 热休克因子1、热休克70K载脂蛋白1A、血清白蛋白前蛋白、血清白蛋白预蛋白 结束时间-2021-06-07 06:35:17-尤塔米亚斯 开始时间-2021-06-07 06:35:17-塔米亚斯 尝试BOLD下载-2021-06-07 06:35:17-Tamias 下载完成:清洁BOLD数据表-2021-06-07 06:35:30-Tamias 尝试NCBI下载-2021-06-07 06:35:30-Tamias 尝试NCBI下载-2021-06-07 06:35:30-Tamias 记录数-3741 物种-西伯利亚、纹状体、阿蒙努斯、微小体、伞形体、四眼体、背足类、鲁弗斯、金丝雀、犬科、鲁菲卡杜斯、吞噬细胞、福克斯、伯格多费里、兰内、比塞提亚、尼罗提斯、萨皮恩、阿卡西亚斯、莫纳克斯、帕尔梅里、塞内克斯、speciosus、阿尔皮努斯、汤森迪、索诺玛、西斯基尤、四斑鱼、巴拿马鱼、赭虫、蒙氏、梅里亚米、杜兰加、斗牛、怪诞、, 帕尔武姆、哈德逊犬、microti、tamias、ezoensis、hermsii、sciuricola、washoeensis、bovis、身份不明- 分子标记-COI-5P、ND3、ND4L、ND6、COII、ND2、ND5-0、COXIII、CYTB、ND1、ND4、细胞色素B、细胞色素-B、细胞色素COXIDAESUBUNITII、热休克蛋白、16SRIBOSOMALRNA、FLAGELLIN、SIRTUIN6、细胞色素氧化酶UBUNITI、VONWILLEBRANDFACTOR、重组激活蛋白1、生长激素受体、ENAMELIN、APOLIPROTEINB、α2BA接收器, 光受体间视黄醇结合蛋白、EDG1、12核糖肉瘤蛋白、酪氨酸酶、重组激活蛋白2、前列腺素、磷酸酯酶β4、CAMPRESPONSIVEEM调节剂、类胡萝卜素受体1、BMI1、脑源性嗜酸细胞因子、ATP7A、淀粉样β前体蛋白、腺苷A3受体、β-2A能受体、细胞色素氧化酶亚单位1、, 核受体亚家族组BMEMBER2、锌蛋白ZFX、C-MYC、C-肌动蛋白、肌动蛋白ACROSIN、酸性磷酸酶E5、TRNA-PHE、NADHDYDROGENASESUBUNIT1、过氧化物酶体活化受体γ、α1-抗胰蛋白酶-LIKEPROTEIN、RAG1蛋白、甲状腺球蛋白、β-葡萄糖蛋白、PRKC1、促甲状腺激素β-亚单位、促性腺激素因子1-α、细胞色素氧化酶UBUNITI公司, 乳糜蛋白酶结合肌球蛋白重链、乳糜酶结合肌球蚴轻链2、胚胎肌球蛋白轻链1、光感受器结合蛋白、柠檬酸合成酶、富含多凝血酶原的lycoprotein、二氢叶酸还原酶、18SRIBOSOMALRNA、HISTONE3、细胞色素氧化酶亚单位1,28SRIBOSMALRNA、因子结合蛋白、可变TICPROTEIN、, 糖类磷酸二酯酶、脱氧核糖核酸酶亚单位B、16S-23核糖核糖体LRNA基因间隔子、包膜蛋白结合蛋白-MAR1、细胞色素氧化酶、细胞色素结合酶亚单位2、乳酸脱氢酶EC、血红蛋白、血红蛋白α、热休克蛋白结合物5、信号识别颗粒蛋白54K、SMCYPROTEIN、乳腺癌敏感性1、, 乳腺癌肌肉敏感性1、牙本质基质蛋白1、透明带糖蛋白2、带粘连蛋白、TTN、外表面蛋白、核糖核酸聚合酶β亚基、核黄素合酶、60kdaheatshock蛋白、细胞分裂蛋白、18ssmallsubnitribosomallrna、gproteinβ亚基5短变体、磷酸二酯酶β亚基或fii、调节蛋白信号传导9-1, 冬眠特异性蛋白27、FBN1、BCHE、HP-55、光受体间质结合蛋白、RAG1、冬眠特异蛋白-25、MGF、HP-20、小亚单位瘤细胞抗原、HP-25、肝细胞核因子4、HP-27、聚合酶、转录因子SP1、甘油醛-3-磷酸脱氢酶、热休克因子1、热休克70KDAPROTEIN1A、血清白蛋白前蛋白、, 血清白蛋白前蛋白、RPOB、外胚层蛋白、17-KDAGENUSSPECIFICATIGEN、肌动蛋白、包膜蛋白、FT'55MS蛋白酶抑制剂'FT、FT'HP-55蛋白酶抑制剂'FT、FT'55蛋白酶抑制剂'FT'、FT'55RS蛋白酶抑制剂' 结束时间-2021-06-07 06:40:01-塔米亚斯 开始时间-2021-06-07 06:40:01-Neotamias 尝试BOLD下载-2021-06-07 06:40:01-Neotamias 尝试下载NCBI-2021-06-07 06:40:01-Neotamias 尝试下载NCBI-2021-06-07 06:40:01-Neotamias 记录数-3352 物种-阿莫努斯、微小目、西伯利亚目、纹状体、巴马利亚目、塞内克斯、镜象亚目、阿尔卑斯山、鲁菲卡杜斯、汤森黛亚目、伞形目、索诺玛目、西斯基尤、鲁弗斯、四维他目、四斑目、巴拿马亚目、赭龙亚目、蒙氏目、梅里亚目、杜兰加目、多尔萨利亚目,金枪鱼科利亚目、犬科、大疱亚目和侧翼亚目- 分子标记物-细胞色素B、细胞色素-B、细胞色素COX酶亚单位II、16SRIBOSOMALRNA、SIRTUIN6、细胞色素氧化酶亚单位I、VONWILLEBRANDFACTOR、重组激活蛋白1、生长激素受体、搪瓷素、载脂蛋白NB、α2B肾上腺素能受体、光受体间视黄醇结合蛋白、EDG1、12S核糖核酸酶、酪氨酸酶, 重组激活蛋白2、前致癌肽、磷脂酶cbeta4、Campresponsiveelement慢化剂、大麻素受体1、BMI1、脑驱动的神经营养因子、ATP7A、淀粉样β前体蛋白、腺苷3受体、β2肾上腺素受体、细胞色素氧化酶亚基1、核受体亚家族0组bmember2、锌蛋白fx、C-MYC、C-MYC蛋白、顶体蛋白, 酸性磷酸酶E5、TRNA-PHE、过氧化物酶体活化受体γ、RAG1蛋白、甲状腺球蛋白、β-葡萄糖蛋白、PRKC1、促甲状腺激素β亚单位、促乳糖分解酶、促乳糖酶肌球蛋白轻链2、胚胎炎肌球蛋白轻链1、光受体结合蛋白、包膜蛋白结合蛋白-MAR1、细胞色素氧化酶、, 细胞色素氧化酶亚群2、乳酸脱氢酶亚群、血红蛋白、血红蛋白α、SMCYPROTEIN、乳腺癌敏感性1、乳腺癌易感性1、牙本质蛋白1、细胞色素氧化酶亚群1、带胞杆菌糖蛋白2、带粘连蛋白、TTN、GPROTEINBETA亚群5短变异体、伴发性磷酸二酯酶β亚群、ORFII、, 蛋白原激活RGS9-1、冬眠特异性蛋白27、FBN1、BCHE、HP-55、α1-抗胰蛋白酶样蛋白、光感受器内酯结合蛋白、RAG1、冬虫夏草特异性蛋白-25、MGF、HP-20、HP-25、肝细胞生成因子4、NADHEHDROGENASSUBUNIT1、HP-27、转录因子SP1、甘油醛-3-磷酸脱氢酶、热休克因子1、, 热休克70K载脂蛋白1A、血清白蛋白前蛋白、血清白蛋白预蛋白 结束时间-2021-06-07 06:44:23-Neotamias
尤塔米亚斯 细胞色素B细胞色素COXIDASESUBUNITI细胞色素COI-5P细胞色素B 细胞色素-B细胞色素氧化酶亚单位1 细胞色素氧化酶细胞色素氧化酶亚群 细胞色素氧化酶细胞色素氧化酶亚单位1 细胞色素氧化酶亚单位
>创建_快速() 请选择总表文件。 按回车键继续。。。 请选择带属的文件和感兴趣的分子标记列表。 按回车键继续。。。 “Eutamias-无法创建fasta文件,没有该属和分子标记的记录” “Eutamias-无法创建fasta文件,没有该属和分子标记的记录” “完成,请查看输入表中的文件位置以获取结果。” “完成,请查看输入表中的文件位置以获取结果。” Neotamias-无法创建fasta文件,没有该属的记录和分子标记 “Neotamias-无法创建fasta文件,没有该属的记录和分子标记”
>ABMC288-05 | | Sciurus | carolinensis | JF457099 | COI-5P
>对齐_引用() 选择要对齐的fasta文件所在的文件夹位置。 按回车键继续。。。 选择您的fasta参考文件(注意,这必须是一个修剪文件,所有序列的长度都相同,并且没有前导或尾随空格字符)。 按回车键继续。。。 选择MAFFT(.bat文件)所在的文件夹位置。 按回车键继续。。。 “C:\\A_MACER\\Seq_auto_dl_063034_Jun_07\\Total_Tables\\COI/Tamias_COI-5P.fas,2021-06-17 05:47:14” “核苷酸1539中报告的fasta文件长度和记录数217” “核苷酸600中对齐和修剪的多序列比对(MSA)的长度和记录数189” “输出位于子文件夹MAFFT和MAFFT_trimmed中的目标目录中”
对于每个输入目标fasta文件,具有与MSA fasta文件中的参考序列的所有MAFFT对准的文件文件夹。 一个文件夹,其中包含第一个文件夹中的对齐文件,但被修剪为引用序列长度,不包括引用序列。 包含MAFFT对齐日志的文件
>条形码清理(AA_code=2) 选择输入文件所在的文件夹位置。 按回车键继续。。。 “开始时间…2021-06-17 06:24:49” 物种初始去重复AGCT AA属_外部物种_外部种内种间条形码_间隙 1阿莫努斯21 12 12 12 12 10 0.06666666666 666667 0.0016666666667否 2只狗6 6 6 6 6.6 6 0.00833333333333 0.025是 3 cinereicolis 10 10 10 10 0 10 10 0.011666666666666 0否 4背12 12 12 12 1 12 12 12 0.02166666666667 0否 5最小值2 2 2 2 0.14 0.001666666666667 NO 6四肢瘫痪12 12 12 12 12 12 0.0233333333333333 0否 7 ruficaudus 2 2 2 2 0 0 3333333333 33 0.001666666666667编号 8 rufus 6 6 6 6 0 0.011666666666666是 9西伯利亚71 51 51 51 51 49 0.021666666666666 67 0.115是 10纹状体36 19 19 19 19 19.19 0.02166666666667 0.00166666666 6667 NO 11 umbrinus 11 11 11 11 11-11 11 0.021666666666666 0编号 “开始时间…2021-06-17 06:24:49和结束时间…2021-17-06:24:50”
在输入文件名的末尾附加“_data_table.dat”以进行指定的数据表文件 带有函数中使用的矩阵的距离矩阵文件,在输入文件名末尾附加“distmatrix.dat”以指示 一个删除了所有离群值的fasta文件,该文件使用输入文件名加上“no_outliers.fas”命名 使用此函数生成的fasta文件将删除所有标识为非唯一或可能不准确的记录。 首先取消复制文件,删除具有相同GenBank登录名的重复记录。 然后,与auto_seq_download()函数一样,barcode_clean()函数标记剩余的记录。 “Flags”列包含几个不同的潜在变量,包括non_AGCT、Stop_Codon、Genus_Outlier、Species_Outlier和“-”。 “-”结果表明该记录适合包含在没有潜在标志的数据集中。 生成的fasta文件将删除所有带有非“-”标志的记录。 如果输出的fasta文件在删除记录方面过于严格,出于某些研究目的,可以在数据表文件中查看函数的结果以及与每个记录关联的标志。 最后,还包括用于计算函数异常值的距离矩阵,因为此文件可能要用于MACER范围之外的其他分析。