果壳中
1.关于本工程
建筑
1.web服务器的体系结构
2.工具包的体系结构
-
命令行界面 :提供此模块是为了提供一个通用且用户友好的命令行界面,用户可以通过该界面与工具箱进行有效交互。 该模块允许用户指定和应用不同的参数,并调用描述符生成过程。 -
基于PSSM轮廓的特征描述符生成模块 :此模块可用于根据用户特定的参数,基于原始描述符向量(由矩阵转换模块生成)包装和输出描述符文件。 -
矩阵变换模块 :此模块可用于转换PSSM矩阵(从原始PSSM配置文件中提取),以生成用户特定的原始描述符向量。 此模块中提供了行转换、列转换以及行和列转换混合组中的各种适用矩阵转换函数。 -
PSSM配置文件格式模块 :此模块可用于从PSSM配置文件中提取PSSM矩阵。 -
PSSM配置文件索引构建模块 :此模块是程序的基本部分,它扫描FASTA序列和PSSM配置文件文件夹,为每个查询序列及其相应的PSSM配置创建哈希图。 -
PSSM配置文件加载模块 :此模块查找哈希表(由PSSM配置文件索引构建模块构建),以检查序列的PSSM配置的可用性,并将相应的PSSM概要文件加载到内存中。
在线WEB服务器
1.文本区输入
1.1输入格式
1.2输入限制
每个提交序列的长度应在50到5000个字符之间。 由于基于PSSM的特征计算是一项耗时的工作,特别是生成PSSM的过程,因此每次提交的最大序列数不应超过500个。 提交的序列不应包含非法字符,如“B”、“J”、“O”、“U”、“X”和“Z”。
2上传fasta格式的文件
3选择生成描述符的算法
对于平滑PSSM,smoothing_window表示平滑窗口的大小,应该是奇数; slidingwindow表示滑动窗口的大小。 对于k-separated-bigrams-PSSM,k表示氨基酸位置之间的距离,默认值为1。 对于Pse-PSSM,ξ表示蛋白链上ξ最相邻的PSSM得分,默认值为1。 对于DP-PSSM,α表示随后的第α-个氨基酸,默认值为5。 对于PSSM-AC和PSSM-CC,LG表示序列中两个残基的最大距离,默认值为10。
4为BLAST选择数据库
5输出
5.1结果页
5.2警告页面
5.3错误页面
STANDALONE软件
1.概述
2.使用POSSUM
2.1系统要求
-
操作系统: 窗户 , Unix/Linux系统 , Mac操作系统 -
依赖项:
2.2下载目录中的文件描述
-
输入 :输入文件文件夹(用户可以使用“-i”指定自己的输入文件文件夹)。 pssm_文件 :PSSM文件夹(用户可以使用`-p`指定自己的PSSM文件文件夹),其中包含示例PSSM文件。 示例1.pssm,示例2.pssm :PSSM文件示例。 例如.fasta :用于生成描述符的示例fasta文件。
-
输出 :用于存储POSSUM计算结果的文件夹(用户可以使用“-o”指定自己的输出文件夹)。 *.csv文件 文件(例如 示例_aac_pssm.csv , 示例平滑pssm.csv , 示例k分开的bigrams_pssm.csv , 示例_pse_pssm.csv , 示例_dp_pssm.csv , 示例pssmac.csv , 示例pssm_cc.csv ):示例fasta文件的计算结果文件 例如.fasta .
-
型钢混凝土 :源代码文件夹。 possum.py、possum_ft.py、featureGenerator.py、matrixTransformer.py :用于生成原始描述符的Python脚本。 headerHandler.py头 :用于为原始描述符添加标头的Python脚本。
-
实用程序 :用于存储一系列实用程序脚本的文件夹,这些脚本帮助用户将fasta序列形式化。 删除非法序列.pl :一个Perl 5脚本,用于删除包含非法字符的fasta序列,例如“B”、“J”、“O”、“U”、“X”和“Z”。
#用法示例: perl removeIllegalSequences.pl-i example.fasta-o example _corrected.fasta 删除短序列.pl :用于删除短于给定阈值的fasta序列的Perl 5脚本。
#用法示例: perl removeShortSequences.pl-i示例.fasta-o示例_corrected.fasta-n 50 perl removeShortSequences.pl-i示例.fasta-o示例_corrected.fasta-n 100
临时
文档
用户指南.pdf :POSSUM独立工具包的详细描述文件。
possum_standalone.pl系列
2.3使用
-
fasta文件 :fasta文件应包含fasta格式的一个/多个蛋白质序列。 用户可以使用-i参数指定fasta文件作为输入。 -
pssm_文件 :应在特定文件夹中提供fasta文件的PSSM文件(对uniref 50/90/100数据库使用BLAST),该文件夹将由用户使用-p参数指定。
perl possum_standalone.pl-i输入/example.fasta-o输出/exampe_aac_pssm.csv-t aac_pssm-p输入/pssm_files-h t perl possum_standalone.pl-i输入/example.fasta-o输出/examplesmoothed_pssm.csv-t平滑_pssm-p输入/pssm_files-h t-a 7-b 50 perl possum_standalone.pl-i输入/example.fasta-o输出/examplet_k_separated_bigrams_pssm.csv-t k_separted_bigrams_pssm-p输入/pssm_files-h t-a 1 perl possum_standalone.pl-i输入/example.fasta-o输出/example_pse_pssm.csv-t pse_pssm-p输入/pssm_files-h t-a 1 perl possum_standalone.pl-i输入/example.fasta-o输出/examplet_dp_pssm.csv-t dp_pssm-p输入/pssm_files-h t-a 5 perl possum_standalone.pl-i输入/example.fasta-o输出/examplet_pssm_ac.csv-t pssm_ac-p输入/pssm_files-h t-a 10 perl possum_standalone.pl-i输入/example.fasta-o输出/example_pssm_cc.csv-t pssm_cc-p输入/pssm_files-h t-a 10
perl possum_standalone.pl-i输入/example.fasta-o输出/exampe_aac_pssm.csv-t aac_pssm-p输入/pssm_files-h t perl possum_standalone.pl-i输入/example.fasta-o输出/example_smoothed_psm.csv-t smoothd_pssm-p输入/pssm_files-h t-a 7-b 50 perl possum_standalone.pl-i输入/example.fasta-o输出/examplet_k_separated_bigrams_pssm.csv-t k_separted_bigrams_pssm-p输入/pssm_files-h t-a 1 perl possum_standalone.pl-i输入/example.fasta-o输出/examplet_pse_pssm.csv-t pse_pssm-p输入/pssm_files-h t-a 1 perl possum_standalone.pl-i输入/example.fasta-o输出/examplet_dp_pssm.csv-t dp_pssm-p输入/pssm_files-h t-a 5 perl possum_standalone.pl-i输入/example.fasta-o输出/examplet_pssm_ac.csv-t pssm_ac-p输入/pssm_files-h t-a 10 perl possum_standalone.pl-i输入/example.fasta-o输出/examplet_pssm_cc.csv-t pssm_cc-p输入/pssm_files-h t-a 10
perl possum_standalone.pl-i输入\示例.fasta-o输出\示例_aac_pssm.csv-t aac_pssm-p输入\ pssm_files-h t perl possum_standalone.pl-i输入\example.fasta-o输出\example平滑_pssm.csv-t平滑_pssm-p输入\pssm_files-h t-a 7-b 50 perl possum_standalone.pl-i输入\example.fasta-o输出\example _k_separated_bigrams_pssm.csv-t k_separted_bigrams_pssm-p输入\pssm_files-h t-a 1 perl possum_standalone.pl-i输入\示例.fasta-o输出\示例_pse_pssm.csv-t pse_pssm-p输入\ pssm_files-h t-a 1 perl possum_standalone.pl-i输入\示例.fasta-o输出\示例_dp_pssm.csv-t dp_pssm-p输入\ pssm_files-h t-a 5 perl possum_standalone.pl-i输入\示例.fasta-o输出\示例_pssm_ac.csv-t pssm_ac-p输入\ pssm_files-h t-a 10 perl possum_standalone.pl-i输入\示例.fasta-o输出\示例_pssm_cc.csv-t pssm_cc-p输入\ pssm_files-h t-a 10
perl possum_standalone.pl-i输入\\example.fasta-o输出\\exampel_aac_pssm.csv-t aac_pssm-p输入\\pssm_files-h t perl possum_standalone.pl-i输入\\example.fasta-o输出\\examplesmoothed_pssm.csv-t平滑_pssm-p输入\\pssm_files-h t-a 7-b 50 perl possum_standalone.pl-i输入\\example.fasta-o输出\\example _k_separated_bigrams_pssm.csv-t k_seprated_bigrams_pssm-p输入\\pssm_files-h t-a 1 perl possum_standalone.pl-i输入\\example.fasta-o输出\\examples_pse_pssm.csv-t pse_pssm-p输入\\pssm_files-h t-a 1 perl possum_standalone.pl-i输入\\example.fasta-o输出\\example _dp_pssm.csv-t dp_pssm-p输入\\pssm_files-h t-a 5 perl possum_standalone.pl-i输入\\example.fasta-o输出\\examples_pssm_ac.csv-t pssm_ac-p输入\\pssm_files-h t-a 10 perl possum_standalone.pl-i输入\\example.fasta-o输出\\examples_pssm_cc.csv-t pssm_cc-p输入\\pssm_files-h t-a 10
-
-我 :以fasta格式指定文件的输入文件路径。 -
-o个 :指定计算结果的输出文件路径。 -
-吨 :指定21个算法中的一个来生成描述符,包括aac_pssm、d_fpssm、smooshed_pssm、ab_pssm,pssm_composition、rpm_pssm、s_Fpsm、dpc_pssm、k_separated_bigrams_pssm和tri_gram_pssm。 -
-第页 :指定PSSM文件文件夹路径。 -
-小时<T/F> :是否添加页眉。 默认值=T。
-
-一个 :指定smooting_window。 smoothing_window表示平滑窗口的大小,应该是奇数。 默认值为7。 -
-b条 :指定滑动窗口。 sliding_window表示滑动窗口的大小。 默认值为50。
-
-一个 :指定k。k表示氨基酸位置之间的距离。 默认值为1。
-
-一个 :指定ξ。 ξ表示沿着蛋白质链的ξ最接近的PSSM得分。 默认值为1。
-
-一个 :指定α。 α表示随后的第α-个氨基酸。 默认值为5。
-
-一个 :指定LG。 LG表示序列上两个残基的最大距离。 默认值为10。
-
-一个 :指定LG。 LG表示序列上两个残基的最大距离。 默认值为10。
2.4输入文件检查
2.5计算结果注释:
计算结果表示为 脑脊液病毒 格式。