|
|
|
|
|
|
|
序列谱上面介绍的方法均基于模式识别,而序列谱(Profiles)方法则是利用多序列比对结果的全部信息构造每一个位点的残基替代、插入、删除分数表。从序列谱可以看出,哪些残基可以出现在某个特定位点,哪些位点是高度保守的,哪些是位点突变可能性较大,哪些位点或区域可以插入空位,等等。显然,序列谱分数表相当复杂,它不仅包含了序列比对的信息,还用到了进化和结构方面的研究结果。例如,对发生在二级结构内部的插入或删除,序列谱方法给予额外的罚分处理。序列谱内在的复杂性使其拥有非常强大的识别能力,对于PROSITE数据库中识别能力较低的正则表达式,是一个很好的补充。在序列间进化距离很远时,模式识别方法变得无能为力,而序列谱则是值得一试的方法。隐马尔可夫模型另一种利用全局信息的方法是用隐马尔可夫模型((Hidden Markov Models,简称HMM)从序列比对中提取信息。HMM是描述大量相互联系状态之间发生转换概率的模型,本质上是一条表示匹配、缺失或插入状态的链,用来检测序列比对结果中的保守区。序列比对结果中的每一个保守残基可以用一个匹配状态来描述。同样,空位的插入可用插入状态描述,残基缺失状态则表示允许在本该匹配的位置发生缺失。因此,为一个多序列比对的结果构造隐马尔可夫链需要把所有的位置都用匹配、插入或者缺失这三种状态中的一种表示隐马尔可夫模型是Pfam数据库的基础。除了隐马尔可夫模型外 < 1 > < 2 >
|
|
|
|
设为首页 | 加入收藏 | 广告服务 | 友情链接 | 版权申明
Copyriht 2007 - 2008 © 科普之友 All right reserved |