line数据库(隶属于美国国家医学图书馆,全世界最著名的医学文献数据库)中的近1000万条文献摘要,确定了22008个人类基因片段,结果发现10352个基因片段有不止一个名字。一个名为“SELL”的基因片段竟然有15个别名。此外,有4275个字母缩写“一词多义”,被用来指代多个基因片段。例如,多义频率最高的字母缩写“MT1”至少有11中含义,对应11个不同的基因片段。
霍维格等分析的还仅仅是目前科学家们已经发现的人类的基因片段。在跨种属的生物之间,基因片段命名的混乱就更让人晕头转向了。例如,在酵母菌体内与人类的基因片段“PMS1”功能相对应的基因片段被命名为“PMS2”,而真正与“PMS2”功能相对应的基因片段却被命名为“PMS1”。
基因片段命名的混乱无疑给科学家的研究工作带来了不良影响。美国科学家,鼠基因组数据库(MGD)的负责人朱迪丝·布雷克就指出,在遗传学研究中,科学家们经常发现在不同种属的生物之间存在非常相似的基因片段,这对探索生命起源和物种进化常常是不可多得的发现。但基因片段命名的混乱使不同研究领域的科学家很难共享研究成果或者是进行联合性的研究工作。
很多科学家都想将基因片段的命名标准化,为此,相关领域的科学家曾经在1997年和1999年举行了两次有关基因片段命名的研讨会,但科学家们研究领域的不同以及命名习惯的巨大差异使得要制定一个“放之四海而皆准”的命名标准实在不容易。欧洲生物信息研究院院长、英国科学家迈克尔·爱什博纳甚至开玩笑说,科学家们可以共用一把牙刷,但要让他们共用一个基因名称,简直比登天还难。为此,爱什博纳和其他一些知名的生物学家共同创立了一个名为“基因命名协会”的团体。爱什博纳介绍说,基因命名协会的工作目标就是希望未来能够利用计算机将基因组数据库中功能相近而名称不同的基因片段链接起来,以使查阅数据库的科学家能尽量准确全面地获取所需要的数据。
< 1 > < 2 >
|