KnotInFrame-补充数据

本页包含PRFdb分析的其他详细信息如本文所述。

使用KnotInFrame进行顶部预测:

KnotInFrame对完整酵母的100个最佳预测基因组:结果


与PRFDB的比较

这个PRF数据库包含计算机生成的移码候选,其中1679个在Jacobs等人NAR(2006)中被列为强有力的候选人
我们发现他们和我们的方法有一个惊人的小正预测移码信号中的重叠。
第一眼PRFdb中的结构揭示了许多结构,事实上大多数情况下,根本不包含假结,因此不包含类似于广泛接受的移码假结共识。
为了创建PRFdb的子集,其中的结构与假结共识非常相似,我们过滤了数据库中的伪打结结构,结果如下在163个结构中。这个列表仍然包含许多结构这违反了一致的移码信号。这里,我们列出几个违反共识的例子。这些结构是筛选出来供我们进一步分析。最终只有74结构这在原则上可以通过以下两种方法之一进行预测方法。

  1. 间隔区过长(应小于12个核苷酸;此处为28核子)
    >SGDID:S0006076 |位置:282-11-----1122222-------22222-3333333-----44444-3-333333-----44444---ACATATACTGGGTCAATCACTGTGACCATCCGCGCCGAAACCACGTGGAACTTCCGTGACC.((.....))(((((.......))))).(((((((.....[[[[[.).)))))).....]]]]]...
  2. 环1>10个核苷酸,茎2<4个核苷酸
    >SGDID:S0004513 |位置:972-----111111--11111222222222-----222222222--33--11111111111---444----44433-----------TGTCATAGGCTTCGAAAATCATTTCTGGTAAGGATATCGAACGGATTTCAGCCTGGAAAAAACCAAAGATCTAT.....((((((..((((((((((((((.....)))))))))..[[..)))))))))))...(((....)))]]...........
  3. 例如,环路1太长,并且包含一个附加结构:
    >SGDID:S0002824 |位置:810---1112222222-----2222222--3333-44--------44555555-------555555111---3333666-----666--TTGGCAGCCTAGAAAAACTAGGTTAGATAATCAATATGAGTTCATGAGGCAATGCATATCCGACAAAATGGCT...[[[(((((((.....)))))))..((((.((........))((((((.......))))))]]]...))))(((.....)))..>SGDID:S0002814 |位置:1080--1111--2222222--222----2222-----2222-222-222222233--444441111---44444---33-加拿大海关总署..[[[[..(((((((..(((....((((.....)))).))).)))))))((..(((((]]]]...)))))...)).
  4. 复杂假结(请看2d图)
    >SGDID:S0000212 |位置:228111111111---222222-3333---444111111111---444---555333366---666-----666--66-555-222222--TTTCAGGGTGGATGGAACGGCCCAGTGGATCCCTGAGAACCAAAACTGGCCCTACTGAAAAAAATCATTGGAGACCAAT[[[[[[[[[...((((((.((((...(((]]]]]]]]]...)))...[[[))))((...(((.....)))..)).]]].))))))..
请注意,在我们的分析中就框架移位发表声明由假结引起的。如果我们在我们的分析,那么只是假设它不是假结这导致了帧移位。比方说,一根发夹可能造成的移码这个结构仍然没有引起注意。 <