,直到上世纪90年代才开始从事生物信息学的研究。”坐在他身边的李飞却说:“李老师的生物学知识,比我们这些本科学生物的还要全面和深入,他是用系统论的方法学习,比生物学惯用的还原论可有大优势了。”
什么是“垃圾DNA”
“垃圾DNA”很早就已经被科学家们发现了,当时它为什么会被称为“垃圾”呢?
李院士沉思了片刻说:“很久以来,人们一直认为在人类基因组的众多基因中,只有能编码蛋白质或者酶的基因才能表现出功能。换句话说,只有这样的基因才是传达人类遗传信息、生物特性的有用基因。但随着人类基因组计划的完成,DNA图谱的排列成型,人们发现只有不到10%的DNA序列参与了编码蛋白质或者酶,而剩下90%没有显示出那些功能,于是就有人认为它们是没有用的垃圾,‘垃圾DNA’这种通俗地称法就叫出来了。”
垃圾DNA真的是垃圾吗?
李院士认为,SRG1基因研究的重要意义在于发现了一种新的关于DNA转录调控的机制,而这种转录调控正是由以往所认为的“垃圾DNA”参与的。SRG1基因不编码任何蛋白质,目前研究看来,这个基因启动转录的唯一功能就是关闭它下游附近的基因。因此,SRG1基因可以被理解为一个基因调控网络中的一个开关,它是转录水平上的一个开关,可以调控一个基因是否转录。
“总体而言,人们早期对‘非编码DNA’序列的功能和重要作用认识不足,不知道其为什么存在,存在的意义是什么?因而认为是垃圾序列。随着人类基因组测序完成,人们开始对这些‘非编码DNA’序列开展系统的研究。”李院士说:“现在人们才开始发现,这些‘垃圾’中藏着宝呢!”
李飞对SRG1的调控作用做了一个形象的比喻。他说:弯曲的,黏着的DNA序列仿佛一个纪律严明的部队。指挥官下达命令,士兵执行任务。任务就是编码蛋白质或者酶,体现基因功能,表达出遗传信息。这就足以说明原来被认作垃圾的DNA不是垃圾,而是发出指令的幕后指挥者。这种调控功能可能对基因组的进化起非常重要的作用。
在“垃圾”中艰难寻宝
随着人类基因图谱的绘制成功,人们对单个基因的认识已经发展到了极致,现在分子生物学的核心课题是基因之间如何相互作用。
李衍达院士告诉记者:如今大多数科学家都认为不编码蛋白质的基因不是垃圾。这部分基因中包含非常重要的调控元件,掌握他们之间的关系,可以从根本上提高对生命规律的基本认识。因为DNA序列本身处在不断的演化过程中,本身的自我复制,插入生成新的基因还有受环境的影响发生基因突变。所以,这是一个复杂系统的演化过程。需要用系统的眼光看问题,把单个基因还原到基础,再综合起来。
“垃圾DNA”调控癌症、糖尿病等重大疾病
人类的许多疾病都与基因的调控有关。利用基因调控是否能-现阶段的重大疾病是人们非常关注的问题。李院士说:患者之所以表现出癌症的症状,是因为人体内的癌基因和抑癌基因失衡导致的。如果这时候起调控作用的“垃圾DNA”们发出指令,进行调控,就有可能进行治疗。同样,糖尿病和帕金森症都是因为相应基因的调控失常所导致的。因此,对于“垃圾DNA”的深入研究,可以为进一步了解这些重大疾病的发生原因以及解决方法带来新的认识。目前,许多有关的研究工作已经开展。
我国的相关研究处在突破的前沿
李衍达院士认为,关于“垃圾DNA”的研究,我国虽然起步较晚,与世界其他国家研究水平有些差距,但相差不大。“因为这方面的研究本身就是个新领域,大家都差不多。”
李院士告诉记者,在这个领域,研究数据是公开共享的,要想出成绩,就需要在实验方法和手段上有新突破。如何找到一种新的实验方法,能够观测到“垃圾DNA”的调控过程是非常关键的,此次哈佛医学院的这个研究小组的成功正是在实验方法上有突破。“这个领域是前沿中的前沿,我国要想在基础科学上有重大建树,就应该在这方面投入更大,要下大力气攻关才行。”
由“垃圾DNA”研究引发的思考
此次“垃圾DNA”的研究入选2004年十大科学进展,对我们有什么启示?
李衍达院士用严谨的思考,给了我们一个非常学术化的总结:
1.在前沿科学开展研究工作要有机遇、有需求、有条件。我们过去的研究有很强的跟随性,这样不利于研发工作有新的突破。
2.从观念上要有所突破。要有敏锐的眼光发现问题,用发展的眼光看待事物,不仅要看到单个基因,还要寻找他们之间的联系。
3.推进学科交叉,多领域合作。随着人们对生命体系的认识不断深入,生命科学领域的知识变得非常丰富,在数据库中能够检索到的文献暴增。这些都是不同领域,不同背景的研究人员共同的劳动结晶。
4.实验方法和手段的改变。鼓励信息学科、计算机学科和数理统计的研究工作者对基因组中非编码区的分析和信息挖掘。由于对这一方面的研究属前瞻性研究领域,可供借鉴的成功经验不多,因此应该允许尝试,允许探索。对基因组中非编码区信息挖掘工作的突破将对整个生命科学带来革命性的影响,同时也可大大地促进我国生物信息学研究。
■新闻链接
DNA(脱氧核糖核酸)是核酸的一类,因分子中含有脱氧核糖而得名。DNA分子极为庞大(分子量一般至少在百万以上),主要组成成分是腺嘌呤脱氧核苷酸、鸟嘌呤脱氧核苷酸、胞嘧啶脱氧核苷酸和胸腺嘧啶脱氧核苷酸。DNA存在于细胞核、线粒体、叶绿体中,也可以以游离状态存在于某些细胞的细胞质中。大多数已知噬菌体、部分动物病毒和少数植物病毒中也含有DNA。
< 1 > < 2 >
|