|
|
|
|
|
|
|
颜色 Asp (D), Glu (E) 酸性 红色 His (H), Arg (R), Lys (K) 碱性 兰色 Ser (S), Thr (T), Asn (N), Gln (Q) 极性 绿色 Ala (A), Val (V), Leu (L), Ile (I), Met (M) 疏水性,带支链 白色 Phe (F), Tyr (Y), Trp (W) 疏水性,带苯环 紫色 Pro (P), Gly (G) 侧链结构特殊 棕色 Cys (C) 能形成二硫键 - * 表中采用的分组方法和用来区分不同组别的颜色与模型构件和三维图形软件中所用方法一致。多序列比对程序的另一个重要用途是定量估计序列间的关系,并由此推断它们在进化中的亲缘关系。可以通过计算完全匹配的残基数目或计算完全匹配残基和相似残基的数目得到这种定量关系。这一方法除了可以大略了解序列间的亲缘关系外,也可用来评估比对质量。如果序列的相似性值低于预料值,那么有可能是序列间亲缘关系较远,也可能是比对中有错误之处。现有的软件包用的基本上是可用鼠标点击的窗口界面,其中序列编辑器位于窗口中央。这样的软件包将在以后章节中详细介绍。使用这些软件我们将会看到,那些长度相仿且相似性程度较高的序列,采用自动比对方法将会得到相当满意的结果;而当序列长度相差较大而相似性程度较低时,采用自动方法得出的结果则不很理想。此时,手工序列编辑器就接显得十分有用。通过手工调整,可使结果变得接近实际。此外,采用多种不同的方法进行分析,再将结果综合,是一种行之有效的方法。为更好地理解多序列比对的原理和规则,应该尽可能学会手工比对的方法,并把比对结果与计算机自动比对得到的结果加以比较。同步法同步法实质是把给定的所有序列同时进行比对,而不是两两比对或分组进行比对。其基本思想是将一个二维的动态规划矩阵扩展到三维或多维。矩阵的维数反映了参与比对的序列数。这类方法对于计算机的系统资源要求较高,通常是进行少量的较短的序列的比对。步进法这类方法中最常用的就是Clustal,它是由Feng和Doolittle于1987年提出的(Feng和Doolittle,1987)。由于对于实际的数据利用多维的动态规划矩阵来进行序列的比对不太现实,因此大多数实用的多序列比对程序采用启发式算法,以降低运算复杂度。Clustal的基本思想是基于相似序列通常具有进化相关性这一假设。比对过程中,先对所有的序列进行两两比对并计算它们的相似性分数值,然后根据相似性分数值将它们分成若干组,并在每组之间进行比对,计算相似性分数值。根据相似性分数值继续分组比对,直到得到最终比对结果。比对过程中,相似性程度较高的序列先进行比对,而距离较远的序列添加在后面。作为程序的一部分,Clusal可以输出用于构建进化树的数据。Clustal程序有许多版本,ClustalW(Thompson等,1994),根据对亲缘关系较近的序列间空位情况,确定如何在亲缘关系较远的序列之间插入空位。同样,相似性较高的序列比对结果中的残基突变信息,可用于改变某个特殊位置空位罚分值的大小,推测该位点的序列变异性。Clustal是免费软件,很容易从互联网上下载,和其它软件一起,广泛用于序列分析。Clustal所支持的数据格式包括EMBL/SWISSPROT、NBRF/PIR、Pearson/FastA、GCG/MSF,以及Clustal本身定义的格式。它的输出格式可以是Clustal格式,也可以是可用于GDE、 Phylip、GCG等软件的格式。 < 1 > < 2 >
|
|
|
|
设为首页 | 加入收藏 | 广告服务 | 友情链接 | 版权申明
Copyriht 2007 - 2008 © 科普之友 All right reserved |