|
|
|
|
|
|
|
从80年代后期,生物序列的计算分析--蛋白质、DNA和RNA分子的线型描述,已完全发生了改变。产生这种变化的主要原因是由于以DNA排序为主的新型、有效的实验技术的发展产生了呈几何级数增长的数据(使实验数据呈几何极数增长)。随着人类基因组和其它序列项目的持续发展,研究重点逐渐由数据的积累转向数据的处理。 在研究进程中,用于序列分类、同类性检测,DNA序列中蛋白质中蛋白质编码区和非编码区的分离,分子结构和功能的预测,以及进化史重建的计算工具就成了必不可少的原素。它不仅是我们了解生命和进化所必需的,同时也是发现新药和诊断方法所必不可少的。生物信息学正在作为生物和计算机科学的前沿战略性学科而崛起,涉及到医学,生物技术和社会学的许多方面。 生物信息的巨大数据库既是对数据处理的挑战,也是一种机遇,都要求新的理念的出现。基于此,传统的计算机科学规则系统虽然可用,但已越来越不能解决许多非常有意义的序列分析问题。这主要归因于生物系统本身固有的复杂性。因为生命物质在进化中总是被不断修改,而我们在分子水平上对于生命组织还缺乏一个综合的理论。另一方面,人工智能法(比如,神经网络,隐藏的马尔可夫模式(hidden Markov models),信仰网络(belief networks))对于那些呈现大量数据,"噪音"模式,以及缺乏综合理论的领域是理想的选择。这些方法的基础理念就是通过推断,模型设计或者分析样品的过程"从数据中自动得出理论"。 人工智能法主要得利于计算机技术的高速发展,值得注意的是,从80年代后期开始,计算机发展速度和生物序列量几乎以同样的比例进行增长,并且这种状况一直持续下来,到目前几乎每到隔18个月翻一倍。对于一个初学者来说,人工智能法可能看起来是一种毫不相关的技术。理论上讲,年有人工智能法的整体框架,在我们看来,事实上,人工智能和贝叶斯模型化及推理几乎没有什么不同,只是前者更注重计算机和数字。这是由于三个因素共同作用的原因---数据,计算机,和理论框架,这三个因素推动着人工智能在生物信息及其它领域的推广应用。 人工智能技术经常被指责为是"黑盒子"方法:人们总不能准确地查明一个复杂的神经网络,或者一个隐性马尔可夫模型是怎样得到一个特定的结果的。我们曾经试图从一般的概率框架和实用的立场来处理这个传统的问题。然而必须认识到,有大量的现代分子生物学技术的运用是纯粹基于经验主义的。比如说,聚合酶连锁反应,由于它的有效性和灵活性,从某种程度上说仍然是一个黑盒子技术。它的许多可变参数得选择是基于一个尝试和误差的基础。序列通过凝胶中基质进行的运转和灵活性属于另一个领域,其中,实际的成功和有效性更为重要,而不是对潜在的物理现象的详细了解。同样,许多药物的药理学效果的分子基础仍然是未知的。实践出真知,我们可以证明人工智能法确实是一种很好的方法。 |
|
|
|
设为首页 | 加入收藏 | 广告服务 | 友情链接 | 版权申明
Copyriht 2007 - 2008 © 科普之友 All right reserved |