当前位置: 首页 > 医学版 > 期刊论文 > 其它各类 > 各类论文5
编号:10502296
发展基因组学和生物信息学刻不容缓
http://www.100md.com 中国医科学院学报 2000年第22卷第1期
     吴旻

     关键词:基因组学 生物信息学 自丹麦学者约翰逊用基因(gene)来表述孟德尔在豌豆杂交实验中发现的“性状单位”或“单位因子”以来,基因这个词已被普遍接受并沿用了90年,其含义亦随着对遗传物质认识的深化而逐渐具体化。基因的现代定义可表述为:遗传信息的结构与功能单位,指一段DNA 分子,也可以是一段RNA分子(如RNA病毒)。一个物种的全部遗传信息的总和则称为基因组(g enome),既可以指一套染色体(单倍体),也可以指其中的全部核酸。如人类基因组即指人的23条染色体(22条常染色体和1条性染色体)或23条染色体内的全部DNA,由23条极长的DNA分子、总共约3×109个核苷酸组成。

    自70年代起Sanger等已开始进行病毒的全基因组测序,到1984年已经先后完成了噬菌体φX174(5386 bp)、人线粒体基因组(16 kb)和Epstein-Barr病毒(172 kb)的全测序。虽然它们的基因组只有几千个到十几万个核苷酸,不及人基因组的万分之一,却已经激起科学家们破译人基因组全序列的雄心壮志。1984~1985年在美国能源部的支持下召开了3次小型会议,议论、建议和提出进行人基因组全测序的草案(能源部计划)。
, http://www.100md.com
    1986年3月诺贝尔奖获得者R.Dulbecco在Science上发表了一篇题为“癌症研究的转折点:测序人类基因组”的短文,认为要弄清癌症的发生、演进、侵袭和转移的机制,必须对人体细胞的基因组进行全测序,再也不能满足于零敲碎打地从人基因组中分离和研究几个癌基因了。认为这项工作对于认识人的生理、病理、发育、神经系统组成、其它重大疾病和疾病易感性等均有重大意义。并指出这样大的项目必须通过国际大协作来完成。

    建议提出后在科学界引发了一场讨论。许多科学家认为这是一个大胆的、富有想象力的建议,完成这一计划就像基督教徒找到了圣杯(Holy Grail,意指梦寐以求的东西或目标);反对者则认为实行这个计划按当时的技术水平估计(主要指测序能力),生物学界的大量人力和基金将被这个计划吸去而影响整个生命科学的研究水平;还有一种意见认为30亿个碱基序列即使全部弄清楚了,记载于电话薄那样的书本,也会堆满一间屋子,打开一看,乃是密密麻麻只有四个字母的天书,何况其中只有大约百分之几是编码蛋白质或RNA的序列,百分之九十几可能是“垃圾”,因而主张把大约5~10万个基因的编码序列(即cDNA序列)弄清楚就行了,不必去测全序列。经过大约3年的讨论后,美国政府决定于1990年10月正式启动这项将耗资30亿美元的15年计划,预期到2005年弄清人基因组大约30亿个碱基的全序列。最初(1990)计划的目标是:描绘全部人类遗传物质(即基因组,genome)的特征,即改进现有的遗传图和构建所有染色体的物理图,并最终确定全部碱基序列--发现总数超过50 000的人类基因,使之适用于深入的生物学研究。这个计划还包括对一系列模式生物体基因组的全测序,最初提出的有大肠杆菌、酵母、拟南芥、线虫、果蝇和小鼠。对这些处于生物演化不同阶段生物体的研究是认识人基因组结构和功能绝对不可缺少的。1993年对原先的计划进行了修订,提出了1993~1998年五年计划各项指标。随着人基因组计划(HGP)的实施,又有科学家提出一些其它的模式生物体,如河豚鱼、斑马鱼等。此外,一些具有重要生产价值的农作物,如水稻等的研究也被提上议事日程。1998年10月又提出了1998~2003年的五年计划。美国政府资助的HGP由美国国家卫生研究院(NIH)和能源部承担。NIH为此专门成立了一个新的机构,现称人基因组研究所(NHGRI)。美国关于HGP的辩论和启动引起了全世界科学家的兴趣,并带动了意大利、英国、法国、德国、日本、加拿大、苏联、巴西、印度等国提出各自的计划。通过科学家和政府的共同努力,HGP成为国际合作的大项目。
, http://www.100md.com
    基因组学的出现和进展

    1986年美国Johns Hopkins大学著名人类遗传学家和内科教授McKusick创造了基因组学(Geno mics)这个名词,意指从基因组水平研究遗传的学科。这个词一经提出立刻被广泛接受,出现于科学著作乃至大众传媒。这方面的专业刊物也陆续出现,如Genomics,Genome, Geno me Research等。但大量关于基因组研究的论文仍发表于各传统的遗传学刊物和最有影响的学术刊物,如Science, Nature, Nature Genetics等。基因组学无疑已成为当前和今后相当长的时期内最活跃和影响最大的学科之一。

    HGP的实施和发展 美国HGP自1990年10月正式启动以来,已经发展成一个国际大协作项目。其规模和意义已大大超过了历史上的大科学项目,如曼哈顿原子弹计划和阿波罗登月计划。不但集中了许多国家政府的投入,而且吸引了全世界不同学科的精英,包括数学、物理、化学、计算机、材料等,促进了“生物信息学”的诞生和发展,推动了生物芯片技术的研究和开发……基因组学成为一门高度综合和跨学科的科学,它面对的是宇宙间最复杂的系统,是当前科学发展冲破还原论的束缚走向整合(综合)大趋势的典型事件。
, http://www.100md.com
    HGP计划本身的进展,由于上述种种有利因素以及来自企业的强大竞争压力而一再修订计划指标并在实施中不断提前超额完成。原订2005年完成全测序工作,可望提前2~3年完成。原计划中未列入的人基因组多样性计划、功能基因组学、比较基因组学、环境基因组学和药物基因组学等纷纷出台。使人逐步认清:现阶段HGP的完成仅为今后全面认识人基因组的功能提供了一个结构基础,好比一出历史长剧的一个序幕,好戏连台,还在后面,必然要延续到21世纪。

    HGP实施以来的将近9年中,由于投入的不断增加和研究队伍的扩大,进展是十分惊人的。测序速度由于采用了大规模自动化手段,一个测序中心可以安装数十台至上百台自动测序仪,结合机器人操作,电脑储存和分析,日夜不停地进行。过去一位博士生花数年功夫才能完成的数十万碱基大小的序列,现在在一个测序中心已成为小菜一碟。许多涉及重要疾病的基因,如肥胖基因、支气管哮喘基因等常常成为传媒大肆炒作的新闻,或以数千万美元的高价转让给公司,或在新闻发布会上宣称已经克隆到某某基因而使公司的股票升值。
, http://www.100md.com
    在模式生物体和病原微生物基因组的测序取得了重要的进展 1996年完成了酿酒酵母12068000个碱基的全序列,从中大致确定了5885个编码蛋白质的基因、140个rRNA基因、40个snRNA和275个tRNA基因。从而第一次知晓一种最简单的真核生物所需的全部基因的数目和大体上的功能分类。1997年完成了大肠杆菌标准株(K12)的全测序,从中识别出4000多个基因;1998年底线虫测序协作组经过多年的精诚合作终于实质上完成了第一个多细胞生物的全基因组测序。基因组总长约97Mb,发现了19000个以上的基因,40%以上预测的蛋白质产物可在其它生物体中找到相匹配的蛋白,存在多种重复序列和大量高度保守的基因,再加上线虫的体积小(线虫约1mm长),易繁殖,发育时间短(3天),通体透明,便于观察,成虫由959个细胞组成(302个神经细胞,213个表皮细胞,111个肌细胞和34个肠细胞),于是线虫便为生物学研究提供了一个十分理想的平台,也是功能基因组学和比较基因组学中的重要成员。今后,随着拟南芥、果蝇等模式生物全基因组的完成,研究的水平和速度将进一步提升。
, 百拇医药
    在此前后,病原微生物基因组方面也取得了重要的进展:如流感嗜血杆菌、生殖器支原体、幽门螺杆菌、包柔螺旋体、结核杆菌和梅毒螺旋体等影响千百万人健康和生命的病原体的全基因组序列均在最近几年内完成,为认识这些病原体的致病分子机制,设计诊断、预防和治疗新方法、新途径开辟了无限的可能性,也将为拥有专利的药厂、公司提供滚滚财源。

    如幽门螺杆菌可能同胃、十二指肠溃疡,甚至同胃癌的发生有密切关系。结核病长期以来是人类健康的大敌,近年来又趋猖獗,不但危害发展中国家的人民,在发达国家也卷土重来,每年造成300万人死亡,结核杆菌全基因组序列为药厂设计准确和快速的诊断方法及有效的治疗药物提供了新途径,1998年10月法国科学家已经找到结核杆菌的致病基因erp。梅毒这种可怕的性传播疾病自16世纪危害人类以来,始终未能在体外培养繁殖其病原体,因此至今无法制备疫苗。TIGR和德克萨斯的一组科学家经过长期的努力,终于完成梅毒螺旋体全基因组的测序;而且从全序列的分析中初步了解到这种病原体诱发可怕临床症状的秘密以及为什么不能在体外培养繁殖的原因。在弄清基因组的全序列后,科学家们十分乐观地预言,配制出一种培养基来繁殖这种螺旋体,深入遗传学研究和制备疫苗的前景已经在望。
, 百拇医药
    全基因组测序举例:

    1.酿酒酵母

    Saccharomyces cerevisiae

    12 068 000 bp

    5885+140+40+ 275

    Science, 1996,274:546

    2.大肠杆菌

    4 653 831 bp 4283个结构基因

    Science, 1997,277:1453

    3.线虫

, 百拇医药     97 Mb, 19 000基因

    Science, 1998,282:2012

    4.人

    完成约6%(1998)

    5.流感嗜血杆菌

    ~1 830 240 bp

    Science, 1995, 269:496

    6.生殖器支原体

    ~600 000 bp

    Science, 1995, 270:397

    7.幽门螺杆菌
, 百拇医药
    1 667 867 bp

    Nature, 1997, 388:539

    8.包柔螺旋体(Lyme病)

    901 725 bp (染色体)

    533 000(质粒)

    Nature, 1997, 390:580

    9.结核杆菌

    4 410 000 bp 富含GC

    Welcome Trust资助英、法科学家于Sanger中心完成,1997年12月宣布

    10.梅毒螺旋体
, 百拇医药
    1 138 000 bp

    Science, 1998, 281,375

    对人类生活产生更深刻和广泛影响的是对重要农作物基因组的研究 从80年 代开始的对植物遗传物质的修饰已经和正在对人类社会产生愈益巨大的影响。全世界绝大部分的食物、燃料、纤维、化学原料和部分药物将来都可能取自遗传修饰的植物。如通过遗传修饰使之对某种除莠剂,如Roundup产生抗性的大豆、棉花、油菜、土豆、玉米等的种子已经育成,而且通过了美国FDA严格的审查,开始在大田播种。孟山都公司的抗Roundup大豆在1996年种植了100万公顷,1997年上升到900万公顷,1998年达到2000万公顷。该公司育成的抗棉铃虫棉花种籽已经在我国北方大面积长期推广。1998年全世界种植的基因组修饰的各种作物大约会超过2500万公顷。

    预防重于治疗的思想逐渐深入人心,人们还要求保护和提高健康水平,延长寿命。随着对人基因组的深入了解和检测方法的简化,医生将逐步根据对象的基因型开出个体化的处方,处方的内容将不限于治病的药物。营养品、保健品的市场将不断扩大,采用基因工程手段改善食用油成份、蛋白质和碳水化合物含量和氨基酸组成,使之成为更有益于人体健康,能预防动脉硬化或骨质疏松症等常见病的农作物;把某些病原体的抗原基因或毒素基因转入普通的食物或水果,如土豆、香蕉等中,以服食这种食品取得用疫苗达到预防疾病的实验已初露端倪;利用细胞衰老的分子机制研究成果生产保持皮肤光泽,有弹性的新一代化妆品也将进入市场。这些遗传修饰的食品、化妆品等都可能成为医生处方的内容。我国传统医学中“天人合一”、“上医治未病”的思想和食疗等具体治法将在基因组学的水平上融入现代医学。基因组学革命
, 百拇医药
    廉价能源的逐渐耗竭和生态环境的不断恶化威胁到人类的生存和发展。这两个难题的解决也离不开能源公司正在寻找其它形式能够再生的能源产品。利用古细菌(Archaea)在无氧条件下产生甲烷的甲基辅酶M还原酶的利用有可能使今后的能源主要来自植物而不再依赖煤、石油和天然气等矿产品。有的公司已经在其附属工厂生产乙醇以代替石油,利用基因组学的成果则可使生产成本大大降低。美国能源部正在研究如何利用一种细菌(Deinococcus radiodu rans)去清除重金属和放射性废弃物对环境的污染。改造拟南芥的基因组,使之能生产可生物降解的塑料的工作已取得成就。上述的例子仅仅代表一种大趋势的开端。今后10年随着基因组的进展,人们对各种动植物基因组的测序和改造能力将更加强大,各种各样具有新的遗传特性的植物和动物将为我们提高食物的产量和质量,提供有特殊性能的纤维和其它化工原料,廉价的可再生的能源,易于自然降解避免污染环境的塑料……。1998年3月有人提出,现在已出现继工业革命、电脑引发的信息革命(computer-based revolution)后的第三次技术革命,即基因组学革命(genomics revolution)。不管这个观点是否会被普遍接受,基因组学的发展对人类社会方方面面(保健、食物、能源、环境乃至观念和行为)产生的巨大影响是无法否定的。
, http://www.100md.com
    对社会经济的影响

    由于基因组学的发展,设计和创造了许多重要的生物分子,这些分子可以应用到制药、农业、食品、化工、化妆品、环境、能源各个领域,产生惊人的经济效益,自然而然地形成一个以基因组学为基础的生命科学工业。这个工业将成为世界经济中发展最快的部门。美国专利和商标局(PTO)在1991年收到核苷酸序列的专利申请有4000件,1996年上升到50万件。面对这种态势世界上最大的制药、化工和农业公司和企业正在进行改组、合并和结成新的联盟,以加强自身的竞争实力。如老牌的汽巴药厂(Ciba-Geigy)和Sandoz组成了Novartis这个世界上最大的联合体,以其雄厚的资本和R&D不仅参加到保健业,而且也进入营养和农业的竞争;他们的资产超过1000亿美元。不久前宣称,将任命伯克莱加州大学的化学家P.Schultz 为其新建的Novartis功能基因组学研究所所长,该所将招聘100位科研人员,10年中给予2.5亿美元的资助,以新发现基因的功能为基础,开发新药。葛兰素(Glaxo)和史克的近似联盟成为世界第三大公司,占领了全球超过7.5%的医药市场,新公司一年的研究经费即超过人基因组测序的全部估计费用,它的市场资本总量超过世界上143个国家的年总产值之和。孟山都(Monsanto)这个传统的化学公司自1985年至今舍弃了许多原有的主要企业,1997年以来,向生物工程和基因组学投资66亿美元,现已彻底改造成生命科学公司。孟山都的股票从1995年到1998年中上涨了5倍,还要把美国的大制药厂--American Home制药公司合并进去。著名的杜邦公司起初想在保留传统的化学和能源企业的同时扩展到生命科学,但未能成功。1998年4月杜邦公司宣布改组成由生命科学领衔的三个企业单位。一周之内它的股票就上涨了12%。这还不算,到了5月份,又宣布(尽管在先前曾一再否认),将把能源公司Conoco卖掉,把收入用于将杜邦公司改建成一个生命科学公司。它还用26亿美元购进了一项联合制药风险投资的Merck公司的股份,用于研究基因组、生物学、化学和生物工程。Dow Chemical公司用9亿美元购进一项旨在修饰谷物和食品的联合风险投资的Eli Lilly厂的40%股份。今年夏天起Dow化学公司宣布它将成为一家生命科学公司。Hoechst公司卖掉了它的基础化学部门,并通过与另一家公司合作将资本投入到制药业和农业。
, 百拇医药
    由于保健策略的重点从治病为主转向个体化的预防,农业、食品和营养业也同生物工程和制药业融合。Genzyme Transgenics公司正在培育用遗传工程改造的山羊。有一群羊已可生产足够的抗凝血酶Ⅲ(antithrombin Ⅲ),可取代价值1.15亿美元的工厂。用转基因动物生产药物的成本只及用细胞培养的十分之一。Novartis正在修饰玉米,使之能预防骨质疏松症。1998年5月孟山都用42亿美元购进了两家公司,同世界上最大的私人公司之一(Cargill)联合投资生产和组装遗传修饰的食品。其它大的食品生产商也在投资和销售遗传修饰的谷物。他们正在创造一个新的工业部门,叫做农作物制造业(agriceuticals)。

    来自企业的挑战

    尽管在人类疾病基因、微生物、植物基因组测序和功能研究方面取得了重大进展,人基因组全测序这个基本任务却是块硬骨头,人基因组内大量存在的重复序列给拼接工作带来极大困难,至今才完成了6%(大约180Mb个碱基)。在今后的7年中是否能完成剩下的94%是个无法回避的问题。1998年NHGRI给6个著名的测序中心加强了资助(共6000多万美元),要求在未来的一年中完成1亿1千7百万个碱基。各中心都正在为能否完成这个指标而绞尽脑汁。
, http://www.100md.com
    1998年5月9日,J.Craig Venter和Perkin-Elmer公司(世界上最大的DNA自动测序仪厂家)突然宣布,他们要组建一家以盈利为目的的私家公司,投资3亿美元在3年内大体上完成人基因组的全测序。从1999年4月开始,装备230台新式测序仪(ABI PRISM 3700型),每天可测1亿个碱基,第一年即可完成30亿碱基的99%,第2、3年进行拼接和填补重要的空隙,将采用强大的计算机。在5月11日的一次新闻发布会上,Venter甚至建议政府资助的HGP从事模式生物,如小鼠基因组的测序,把人基因组的测序工作让给他来做(这个公司现已命名为Celera公司,已经装备了300台ABI PRISM 3700型自动测序仪)。6月5日的Science上发表了Venter等关于人基因组测序新策略的文章。8月中,又有一家在美国加州的遗传数据公司(Incyte药物公司)宣布,他们计划在今后两年内投资2亿美元把人类基因组中编码蛋白质的序列全部测出,还要找出SNPs,把它们全部定位于一张电脑图上,这些数据只对愿向Incyte付高额费用的人开放。面对如此强大的挑战,HGP界的头头们已从最初的震惊中冷静下来,研究对策。从1998年10月公布的美国HGP 1998~2003五年计划指标中可以看出政府资助的科学家们正在全力以赴,迎接挑战。不管结局如何,政府和私人企业之间在人才、知识产权、专利等方面的竞争将更趋剧烈。人基因组计划在进展速度技术路线乃至组织形式上,正在经历一场变革。
, http://www.100md.com
    伦理、法律和社会问题

    遗传学的进展在西方世界一直引起宗教界的不安,认为遗传学家要扮演上帝的角色。70年代重组体DNA技术(即遗传工程)出现后担心其对环境、社会和个人产生不利影响的人已不限于宗教界。美国的HGP一开始就充分注意到这种态势,每年都拨出一定的款项资助伦理、法律和社会问题的研究(ethical, legal, and social implications, 简称ELSI),1998年的拨款为690万美元。照西方的观点,一个人的基因组应属于个人隐私,其中含有什么致病基因或对某种疾病的易感基因,用现代方法很容易查出,查出结果泄漏出去,被检对象就可能在就业、婚姻、保险等方面受到歧视。如果没有相应的法律加以保护,DNA测试就会受到拒绝。至于试管婴儿、人工受精乃至克隆人等引发的伦理、法律和社会问题则更是公众十分关注的问题。如果处理不好,不仅会影响遗传学、基因组学的进展,还会引发种种意想不到的社会问题。

    生物信息学的出现和发展
, 百拇医药
    什么是生物信息学 生物信息学(Bioinformatics)是80年代末随着人类基因组计划的启动而兴起的一门新的交叉学科,最初常被称为基因组信息学。美国每年都要拨出相当大的经费支持生物信息学的发展。日本的经济近年来虽然不甚景气,但发展科学技术的雄心却不见减弱,1998年用于发展基因组生物信息学技术的经费是1997年的533%。

    广义地说,生物信息学是用数理和信息科学的观点、理论和方法去研究生命现象、组织和分析呈现指数增长的生物学数据的一门学科。首先是研究遗传物质的载体DNA及其编码的大分子蛋白质,以计算机为其主要工具,发展各种软件,对逐日增长的浩如烟海的DNA和蛋白质的序列和结构进行收集、整理、储存、发布、提取、加工、分析和研究,目的在于通过这样的分析逐步认识生命的起源、进化、遗传和发育的本质,破译隐藏在DNA序列中的遗传语言,揭示人体生理和病理过程的分子基础,为人类疾病的预测、诊断、预防和治疗提供最合理和有效的方法或途径。生物信息学已经成为生动医学、农学、遗传学、细胞生物学等学科发展的强大推动力量,也是药物设计、环境监测的重要组成部分。
, 百拇医药
    生物信息学的成就和面临的挑战 在信息科学中,生物信息学还是一名幼童,既不成熟,也不完善,但成长迅速,充满活力,给科学家提供了无限机会,仅就爆炸性增长的DNA序列、蛋白质序列和结构的收集、整理、储存、提取、加工这些看似简单的工作,也面临数据增长过快,各种各样数据库的种类愈来愈多的困境,但这也提供了施展创造力的机会。坐在计算机面前敲动鼠标,就可以浏览和造访世界各地的数据库和站点,从英特网上卸下有用的工具,进行分析、对比,不用离开斗室就进入了一个无边无涯的大空间(虚拟实验室),把全世界的有关数据、图象、软件都调到你的计算机里,为你的研究工作提供了前几年连想都不敢想的可能性。然而,数据和站点每时、每日都在迅速增长。人们一天到晚、一年到头在计算机前,也未必能查遍所有的站点,搜集到全部有关的资料,因此即使是搜寻和采集信息这个看似十分简单的课题,也仍是一个紧迫的研究课题。我室的生物信息学家在1997年发展了一个生物信息搜索和导航系统,自1997年11月13日上网后,立即受到国内外有关科学工作者的欢迎,就是这个道理。

    重要的是要从大量不联贯的信息中发现其中隐藏着的重要信息。基因组信息学的首要任务之一就是发现新的基因和新的功能,如人基因组含有30亿对核苷酸,其中大约有10万个决定各种性状和功能的基因。这些基因的定位和分离是当前科学家、医生和企业家们最感兴趣的。连一个小耗子的肥胖基因都能卖上亿的美元。过去几十年中,科学家运用经典的遗传学分析方法,功能克隆、定位克隆等方法,总共定位了大约2000个基因。几年前,美、法、英、加、日等国的104位科学家,联合起来利用当时数据库中的45万个DNA小片段(称EST,表达序列标签)和其它有关信息,在很短时间内(1996)就把16354个人类基因进行了定位。如今库中的EST已超过150万个。人类10万个基因中的绝大多数大概都有其EST储存于库中,不用太多时间就都能得到定位和分离。
, http://www.100md.com
    英国、美国、法国、德国和日本的大约600名科学家在90年代初联合起来,短短几年内即完成了长达12068 000个碱基对的酿酒酵母的全基因组测序,并找出5885个编码蛋白质的基因,390个转录rRNA、snRNA和tRNA的基因,说明一个低等的真核生物有6000多个基因就能行使生命的一切主要功能了,而在这个计划开始前的数十年总共才有大约1000个基因通过遗传学分析被鉴定。如此迅速的进展除得益于洲际大协作外,更重要的是由于信息科学的发展和渗透,这种跨越大洋的成百上千人的大协作本身也只能在信息科学和计算机技术发展和普及的今天才有可能实现。

    分子生物学家一直习惯于分离和分析一个一个的基因,如p53基因在恶性肿瘤或DNA受到损伤时的改变和作用等。由于分子生物学技术的进步和数学家、信息科学家和计算机科学家的参与,研究细胞全基因组在生理和各种病理过程中表达的动态变化的可能性已经出现。1997年美国政府已拆巨资组织科学家们研究肺癌、乳腺癌、肠癌、卵巢癌和前列腺癌在癌变过程各阶段中细胞全基因组表达的变化。这标志着生物科学正迈向一个新的水平,对于人们认识和掌握生命的奥秘,用于提高健康水平,防治疾病和发展医药工业将产生不可估量的作用。
, 百拇医药
    由于数据库中储存的处于不同进化阶段物种的DNA序列和蛋白质信息与日俱增,继结构基因组学和功能基因组学之后又出现了进化基因组学。科学家们对处于不同进化阶段物种的基因组结构和功能进行比较分析,企图最终弄清人类10万个基因的起源和进化、结构和功能的演变,发现其间的亲缘关系,像元素周期表那样把基因和蛋白质分类、排序,得到生物学的周期表,根据基因在进化树上的位置,或一小段核苷酸序列,或蛋白质的基序、模块、折叠等,即可预测其来源、结构、功能等。这项浩大的工程显然需要大量生物信息学家长期不懈努力才能完成。

    建议 生物信息学的特点是投资少,见效快,效益大,适合于我国的现实条件。即从英特网上源源不断地采集数据,进行分析、归类与重组,发现新线索、新现象和新规律,用以指导实验工作的设计,这是一条既快又省的科研路线,可避免不必要的重复,少走弯路,提高我国生物科学的研究水平。关键在于有关学科之间的协作和加速培养一批在数学、物理、信息科学、计算机科学以及分子生物学方面均有造诣的跨学科青年人才。这样的人才在当前全世界都十分缺乏。我们如能充分发挥现有少数人才和单位的潜力,优势互补,协作起来,边做课题边培养研究生,进而在某些有条件的大学里设置生物信息学专业,就能迎接21世纪的挑战。

    作者简介:中国科学院院士

    作者单位:吴旻(中国医学科学院 中国协和医科大学肿瘤研究所细胞生物室,分子肿瘤学国家重点实验室,北京 100021), 百拇医药