|
|
|
|
|
|
|
法最早应用于健康学的研究方面 (Zhang & Singer, 1999),是以分类树为基础,预测类别。聚类树则是通过递归区分法过程建立的,也就是依据某选定的预测者是否高于某选定的临界值,将研究对象逐次细分完成分类。选择正确的预测者及与其相应的临界值,即可将癌组织样品与正常组织样品准确区分开来。 与目前常规使用的DNA微列数据的分析方法——聚类法相比较,递归区分法法具有“学习能力”。所谓的“学习能力”,就是当你将已经确知的基因表达与正常或癌组织关系的信息,作为“练习曲 (Training data)”交给这种数学分析法时,该法可还照着这个练习曲演练,并引伸出一个新的数学模式来, 更好应用于该类癌组织的分类鉴别中。因为具有了这种学习能力,递归区分法法可济取以往的研究成果,在前人的基础上进行工作,从而优于常规的聚类法。 类似的具有这种“学习能力”的DNA微列数据的分析方法 还包括Golub等(1999) 提出的改进区分判别法(Derived discriminant decision rule),Brow 等(2000) 提出的支持向量器(Support vector machine)方法,Xiong 等 (2000 ) 运用的Fisher线性判别式等。和以上这些方法比较,递归区分法更有利于处理大规模的数据,同时进行两种以上的组织分类,其精确度也更高 (Zhang 等, 2001)。临床实践要求DNA微列技术及数据的分析处理能够程式化并低成本。常规DNA微列实验中,成千上万的基因被分析,被研究,但如果能从中找到少数几种“全能”的基因,并通过这几种基因就可准确有效地分类鉴别癌组织,则最为理想。这一方面,递归区分法也有所作为。通过其“学习能力”,递归区分法可从众基因中,确定出需要多少,需要那些全能基因来鉴别某癌组织样品。例如,在分析来自22个正常组织及40个直肠癌组织样品的2000个基因中,该法鉴定出三个基因。只用这三个基因,就可将所有癌组织样品从正常组织样品中区分开来,准确率达98%。被鉴定的这三个基因其实都与癌症有关。因此在研究大量基因的表达中,可利用递归区分法(Recursive partitioning〕或类似方法,将研究范围集中到几个“全能”基因上, 再进行更深层次的研究,这样更有效,经济,快速,成为这类研究上的一条捷径。 DNA 微列或芯片数据的生物信息学研究日新月异,新方法,新理论不断涌现,本文最后将网站http://linkage.rockefeller.edu/wli/microarray/推荐给读者,以便从中查阅更多文献,掌握研究动态。 < 1 > < 2 >
|
|
|
|
设为首页 | 加入收藏 | 广告服务 | 友情链接 | 版权申明
Copyriht 2007 - 2008 © 科普之友 All right reserved |