07 人类基因组:生命的脚本
百度搜索 DNA:生命的秘密 天涯 或 DNA:生命的秘密 天涯在线书库 即可找到本书最新章节.
<div class="imgbox ter">//..plate.pic/plate_220467_1.jpg" />以染色体专用荧光着色剂上色的整套人类染色体。每个细胞里的染色体总数是46个——完整的两套,各从父方和母方得到一套。基因组是一套23个染色体,亦即23个很长的DNA分子。
人体复杂得令人迷惑。传统上,生物学都是专注于一小部分,试图详尽地了解它。在分子生物学来临后,这个基本做法仍然没有改变。科学家大多仍只擅长一个基因,或涉及某条生化路径的一群基因。但任何机器的零件都无法独自运作。如果我要研究轿车引擎的化油器,就算是把它研究彻底,我还是无法了解引擎的全部功能,更不用说整辆车要了解引擎的功能及运作原理,我必须研究整台引擎才行。我得把化油器放进引擎运作的整体架构内,当做一个发挥功用的零件,就跟许多其他的零件一样。基因的情况也一样。若要了解决定生命的遗传过程,我们不仅必须对个别的基因或路径有详细的知识,也需要把这些知识放进整个系统,也就是“基因组”的架构里去看。
基因组(genome)是存在于每个细胞核里的遗传指令。(事实上,每个细胞包含两个基因组,分別来自父方和母方:我们从父母继承到两个染色体复本,这让我们每个基因都有两份,因此有两个基因组。)基因组的大小视物种而不同。从人类单一细胞内DNA数量的测定值来看,我们可以估计人类基因组(单一细胞核内所含的一半DNA)大约包含31亿个碱基对,也就是3100000000个A,T,G或C。
基因攸关我们生命中每一个成功与不幸,甚至我们最终的命运。它们与所有的死亡原因多少都有些关系,只与意外事故无关。纤维囊泡症和泰赛二氏症(Tay-Sachs)等直接由基因突变引起的疾病,是最明显的例子之一。但是还有许多其他的基因,同样攸关生死,只不过运作方式比较迂回,它们会让我们容易罹患常见的杀手疾病,像是癌症和心脏病,这两种病可能会在家族里遗传。甚至我们对麻疹和普通感冒等传染性疾病的反应,也与基因有关,因为免疫系统是由我们的DNA所控制的。老化基本上也是一种基因现象:变老所呈现的一些表现,多少反映出我们的基因在一生中所累积的突变。因此,如果要彻底了解这些攸关生死的遗传因子,并最终能处理与它们有关的问题,就必须编出一份我们身体里所有遗传因子的清单。
最重要的是,人类基因组包含我们之所以为人的关键。人类和黑猩惺的受精卵在刚形成时,至少在表面看来是无法分辨的,但一个包含的是人类基因组,另一个是黑猩猩基因组。从这个受精卵开始,一个相当简单的细胞会变成极度复杂的成体,例如人就是由一百兆个细胞所构成的,这整个过程就是由DNA一手操控。但是只有黑猩猩基因组能制造出黑猩猩,也只有人类基因组能制造出人类。人类基因组包含大量的组合指令,控制每一个人的发育成长。人类的本性就是写在这本指令书里。
在了解其中的利害关系后,你可能会认为支持人类基因组DNA定序计划,就像要人支持妈妈和苹果派一样,不会有多少争议。有哪个脑筋清醒的人会反对?然而,在20世纪80年代中期,学者专家首度开始讨论基因组定序的可能性时,仍然有人认为这是不太可能实现的构想,有些人则认为这个构想的野心大得不像话,就像跟维多利亚女王时代的热气球驾驶人建议要送人上月球一样。
再也想不到的是,结果竟然是一个望远镜在偶然间促成了“人类基因组计划”(Human Genome Project, HGP)。在80年代初,加州大学的天文学家提议兴建世界最大、功能最强的望远镜,成本预计在7500万美元左右。当霍夫曼基金会(Max Hoffman Foundation)承诺赞助3600万美元时,加州大学感激地同意以这位慷慨赞助人之名来替这个计划命名。只可惜这种感谢方式反而让剩余经费的筹措事宜变得复杂起来。其他的募款对象不愿意提供经费,兴建一个已经以他人之名命名的望远镜,这个计划就此进退不得。最后,另一个更富有的慈善机构凯克基金会(W. M.Kedation)介入,表示愿意赞助这项计划的所有费用。加州大学很高兴地接受,无论有没有霍夫曼的支持都一样。(新的凯克望远镜建于夏威夷的冒纳凯阿山[Mauna Kea]山顶,于1993年5月全面启用。)霍夫曼基金会不愿屈居凯克基金会之下,于是撤回资金,这时加州大学的行政主管察觉到这是一个3600万美元的机会,特别是加州大学圣克鲁斯分校的校长辛谢默(Robert Sinsheimer),他知道霍夫曼基金会的钱足以支持一项重要的研究计划,而这将足以“让圣克鲁斯扬名于世”。
辛谢默是分子生物学家,非常渴望他的领域也能跻身经费庞大的科学“大联盟”。物理学家有昂贵的超级碰撞加速器,天文学家有7500万美元的望远镜和人造卫星,为什么生物学家不能有高档昂贵的计划?于是他建议圣克鲁斯大学成立一家研究所,专门为人类基因组定序;1985年5月,一项会议在圣克鲁斯召开,讨论辛谢默的构想。整体而言,与会者认为这个计划野心太大,但同意初期的研究重点应放在对医学具有重要意义的特定基因组领域。最后这场会议却毫无成果,因为霍夫曼的钱并未进入加州大学的财库。但是圣克鲁斯这场会议仍播下了种子。
让人类基因组计划迈出第二步的推手,也令人感到意外:美国能源部(DOE)。它的任务当然是以美国的能源需求为主,但是其中至少有一项任务与生物有关:评估核能对健康的危害。因此,能源部一直都有提拨经费,追踪长崎和广岛原子弹爆炸事件的幸存者及其后代,研究他们遗传基因受到的长期损害。还有什么比人类基因组的完整参考序列更适合用来确认辐射造成的突变?1985年秋天,能源部主管健康与环境研究的德利西(Charles DeLisi)召开了一个会议,讨论能源部的基因组计划。生物界人士充其量也是抱着怀疑态度,斯坦福遗传学家波兹坦(David Botstein)谴责这个计划是“能源部为失业的炸弹制造者所做的计划”,当时的国家卫生研究院院长温嘉丹(James Wyngaarden)则将这个构想比喻为“国家标准局提议建造B-2隐形轰炸机”(难怪国家卫生研究院后来会成为人类基因组计划最耀眼的一员)。然而,能源部在整个计划中仍扮演了重要角色,根据最后的统计,大约11%的定序工作是由它负责。
到了1986年,谈论基因组的声音愈来愈大。6月,我在冷泉港实验室一个重要的人类遗传学会议期间,安排了一场特别会议来讨论这个计划。前一年曾在加州参与辛谢默那场会议的吉尔伯特一鸣惊人,提出一个可怕的成本预估数字:30亿碱基对,30亿美元!这的确是一个要花大钱的科学计划。如果没有公共资助,这笔钱多得难以想像,会议中自然有人会担心,这个成败未卜的庞大计划会抢走其他一些重要研究的经费。他们担心人类基因组计划会成为科学研究最大的钱坑。就科学家个人对事业的企图心而言,做这个计划再怎么样也不划算。人类基因组计划在技术上当然有许多挑战,但它在智识层面并不能让人感到非常振奋或能带来多少名声。这整个工作实在非常庞大,即使是很重要的突破也会被淹没;再说,有谁愿意把自己的一生花在永无止尽、冗长无聊的定序工作上?波兹坦就提醒大家要非常谨慎:“这会改变科学的结构,使我们所有人,尤其是年轻人,都被这个庞大的工作绑住,就像航天飞机一样。”
尽管反应并不怎么热烈,但那次冷泉港的会议却让我坚信,为人类基因组定序势必很快会成为国际科学界的优先要务,而当这成真时,国家卫生研究院应该担任一个主要的角色。我说服了麦克道尔基金会James S. Mell Foundation),请他们赞助一项由国家科学院(NAS)所主持的对相关议题的深入研究。由于有加州大学旧金山分校的艾尔伯特(Bruce Alberts)担任委员会的主席,我确信所有的构想都会受到最严格的监督。前不久艾尔伯特才发表一篇文章,警告“大科学”的兴起,势将排挤世界各地的个别实验室在传统研究上的无数创新贡献。在不确定我们的小组会达成什么意见之前,我已经和吉尔伯特、布雷纳和波兹坦加入了15人的委员会;翌年(1987)我们便努力规划出未来的基因组计划细节。
<div class="imgbox ter">//..plate.pic/plate_220467_2.jpg" />
催生人类基因组计划:1986年,大力支持这项计划的哈佛大学教授吉尔伯特(左)和斯坦福大学的波兹坦在冷泉港实验室争论的情景。
在那段早期岁月,吉尔伯特是支持人类基因组计划最有力的人士。他贴切地指出,这“在调查人类功能的各个层面上,是一个无与伦比的工具”。在协助成立Biogen生技公erg)协助下,温特的梦想终于在1992年成真。斯坦伯格是丽奇(Reach)牙刷的发明人,他提供7000万美元成立了两家机构。一家是非营利事业,基因组研究所(The Institute fenome Research, TIGR,英文发音与tiger[老虎]相同),由温特主持另一家姐妹公司是人类基因组科学公司(Human Genome Sces, HGS),由商业倾向的分子生物学家黑索廷(William Haseltine)领导。它们的运作方式是:基因组研究所研究引擎,负责挖掘出A序列;人类基因组科学公司走商业路线,负责营销这些发现。在前者发表数据前,后者会有六个月时间评估这些数据,但在研究显示它们有发展新药的潜力时,评估时间则延长为一年。
温特从小在加州长大,最初宁可去冲浪,也不想继续求学。但是在越战时担任医护兵的一年间受到一些心理创伤后,似乎让他立定志向。回美国后,他在短时间内从加州大学圣地亚哥分校拿到生理学和药理学的学士与博士学位。他之所以会从学术界转往商业界发展,从他个人的财务看来也相当合理:
<small>根据他自己的解释,他在创建美国基因组研究所时,银行里只有2000美元存款。但他很快就扭转财运。1993年初,急于赶上基因组热潮的英国制药公司史克必成(Smithkline Beecham)支付给温特1.25亿美元,取得对他那张愈写愈长的新基因名单的独家商业使用权。一年后,《纽约时报》揭露,温特在人类基因组科学公司拥有10%的股份,价值1340万美元。他不愁没钱花了,重金砸下400万美元买了一条82英尺长的赛艇,还在大三角帆上印上他20英尺的巨幅画像。</small>
1995年,人类基因组科学公司对称为CCR5的基因申请专利。他们的初期序列分析显示,这个基因为免疫系统中一种细胞表面的蛋白质编码,因此值得“拥有”,因为这类蛋白质有可能成为免疫系统药物起作用的目标。黑索廷的公司为类似的基因提出140项专利申请,CCR5是其中之一。1996年,研究人员发现了CCR5在HIV病毒入侵免疫T细胞的途径中所扮演的角色。他们也发现CCR5的突变是使人对艾滋病产生抵抗力的原因:当时已经观察到,有些男同性恋重复接触HIV,却一直没有染病,最后发现这些人都拥有突变的CCR5基因。因此,无论是当时或现在,CCR5都注定要在我们对抗HIV的努力上扮演重要的角色。找出CCR5在艾滋病传染中扮演的重要角色,需要辛苦的研究和扎实的科学工作,但在这两方面都毫无贡献的人类基因组科学公司却有机会坐收庞大的利益,只因它最早宣称拥有那个基因;而且CCR5专利将迫使每次应用这个知识的人都得缴一笔费用,这等于对每一分钱都很重要的医学研究工作征重税。但黑索廷的反应一点也不惭愧:“如果在专利获得核准后,有人将这个基因用于药物开发……并且是基于商业用途,他们就是侵害了专利权。”他还相当愤慨:“我们不但有权要求损害赔偿,而且是两三倍的赔偿。”
<div class="imgbox ter">//..plate.pic/plate_220467_6.jpg" />
基因组计划朝商业发展:1995年5月美国《商业周刊》以黑索廷(左)及温特为封面人物,称他们为“基因之王”。
在20世纪70年代,黑索廷是哈佛的研究生,由我和吉尔伯特共同指导。后来他在医学院的达纳—法伯癌症研究中心(Dana Farber cer ter)管理一个创新的HIV研究中心。但一直到和身价不菲的社交界名媛海曼(Gale Hayman,80年代人人抢着拥有的香水品牌Giio Beverly Hills的创造者)结婚后,他才获得高知名度,所以他在成立人类基因组科学公司时,银行存款绝对不只2000美元。他在成为企业家之前,就曾因搭乘喷气式飞机四处旅行,引来哈佛医学院实验室同事的非议和讥讽。“黑索廷和上帝的差别在哪里?”答案:“上帝无所不在,黑索廷也无所不在,就只不在他应该在的波士顿。”
温特和黑索廷抢着替他们用A定序法找到的每一个人类基因申请专利,这当中极少牵涉到技术或创新发明。他们这两家生技公司,就像霸占游戏场里所有玩具,不让别人玩的孩子一样。
这类投机性的基因专利对医学的研发造成严重影响,长期而言,也会导致医疗选择变得更少和更差。事实上,这些投机者等于取得了对潜在药物目标亦即尚未问世的药物或疗法所针对的蛋白质的专利。对大多数的大制药厂来说,生技公司在对基因功能仅有微薄或根本没有生物信息的情况下,针对药物目标所提出的基因专利,已经成为毒药。这些基因的垄断者要求庞大的权利金,造成财务失衡,对药物的发展不利;其实在研发合格药物的过程中,克隆药物目标顶多占1%的工作而已。此外,如果一家公司制造出针对特定目标的药物,同时又拥有与该目标相关的基因专利,那么这家公司没有理由要立即针对这个目标发展更好的药物。原因就在于如果你拥有专利,而别家公司就算可以合法进行研发,也会因成本高得吓人而不愿参与竞争,那么你又何必投资于研发?
美国基因组研究所、人类基因组科学公司和史克必成制药公司三雄鼎立,在未来有可能垄断人类基因序列的商业运用,这情形让分子生物产学两界都产生警觉。1994年,史克必成在制药业中的老对头默克公司(Merck)了提供1000万美元让华盛顿大学的基因组中心定序人类A,并公开发表研究结果,给了人类基因组科学公司一巴掌。
大约在温特和黑索廷的公司开始把基因组商业化时,柯林斯(Francis Collins)继我之后出任国家卫生研究院的基因组研究中心主任。柯林斯是最佳人选,他是建立基因图谱的一把好手,在数个重大疾病的基因方面经验丰富,包括与纤维囊泡症、纤维神经瘤病(neurofibromatosis,即所谓的“象人”病)和亨廷顿氏症有关的基因。如果有人颁发人类基因组锦标赛初赛(以建立重要基因的图谱及找出其特征为目标)的奖项,柯林斯无疑会是大赢家。但是他自有记分方式:他最爱的交通工具是本田的夜鹰机车,每次他的实验室又建立一个新基因的图谱时,他的同事都会在他的安全帽上加一个印花图案。
柯林斯在弗吉尼亚州谢南多厄河谷(Shenandoah Valley)一个95英亩大、没有自来水的农场长大。起初他在家里自学,由分别是戏剧教授和剧作家的双亲教导,他7岁时就已写出 href='1649/im'>《绿野仙踪》(The Wizard of Oz)的舞台剧本并自任导演。但是科学的魔力把柯林斯拖离戏剧生涯;在耶鲁完成物理化学博士学位后,他进入医学院,从此开始医学遗传学领域的研究生涯。柯林斯属于科学界的罕见品种:他是一位对宗教非常虔诚的科学家。他曾回忆说,在大学时,“我是非常惹人厌的无神论者。”但这一切在医学院时改变,那时“我看到人们在病情严重时为生存而战,有许多人战败。我看到有些人依赖信仰,也看到信仰带给他们的力量。”柯林斯不仅为人类基因组计划带来卓越的科学见解,同时也注入他的前任所缺乏的一个精神层面。到了90年代中期,人类基因组图谱的初稿已经完成,而定序技术也快速发展后,该直捣核心去研究A,T,C和G了——定序时机终于来临。我们仍遵循早先由国家科学院委员会制定的方针,先从一连串的模型生物做起:先是细菌,然后是比较复杂(亦即基因组比较复杂)的生物。低等的线虫是第一个非细菌的大挑战,英国桑格中心的萨尔斯顿(John Sulston)和美国华盛顿大学的瓦特斯顿(Bob Waterston)联手研究线虫,成果斐然,为国际合作立下良好楷模。线虫的序列在1998年12月发表,一共有9700万个碱基对。线虫顶多只有书页上的逗号那么大,细胞数目是固定的959个,却拥有大约2万个基因。
<div class="imgbox ter">//..plate.pic/plate_220467_7.jpg" />
萨尔斯顿在美国的合作伙伴瓦特斯顿出身普林斯顿大学,主修工程学。他为自己管理的华盛顿大学大型定序中心引入了许多工程学智慧。瓦特斯顿具备从己知事物推测未知事物的能力,也就是可以从小事开始,完成大事。他在陪女儿慢跑时发现自己很喜欢跑步,现在他己是马拉松好手。他的定序小组在第一年时,只找出了线虫序列的4万个碱基对,但是在数年之内,他们的成果便巨量增加,瓦特斯顿也是最早呼吁全面展开人类基因组定序工作的人士之一。
<div class="imgbox ter">//..plate.pic/plate_220467_8.jpg" />
国际合作:英国和美国的科学家率先完成第一个复杂生物(线虫)的基因组定序工作;这个计划的主持人瓦特斯顿(图左)和萨尔斯顿仍会找时间轻松一下。
乍看之下,萨尔斯顿似乎不适合在“大科学”中担任领导人。他大半职业生涯都花在用显微镜来观察线虫上,以便能一个细胞一个细胞地精确描述线虫每一个发育过程。他是英国国教牧师之子,留了一脸胡子,像个老伯伯。他一生支持社会主义,笃信商业与人类基因组毫无关系。如同柯林斯,他也是机车迷,以前经常骑着他那辆的机车往返于他位于剑桥外的家和桑格中心之间,一直到他在车祸中受了重伤,而他的机车也变成他口中“比螺钉和螺帽多不了多少”的废铁后,他才停止这么做。当时正值人类基因组计划逐渐加快脚步之际,车祸发生后,赞助桑格中心的维康信托基金会才惊恐地得知,原来这个计划的科学领导人每次上班都在冒生命危险。基金会董事长奥吉维(Bridget Ogilvie)说:“亏我们在这家伙身上投资了这么多钱!”
然而,正当人类基因组计划的国际团队开始定序模型生物,准备全力朝最终目标前进时,分子生物界的一场大地震却撼动了整个计划。
温特和美国基因组研究所一直进行得很顺利。在运用A基因发现策略数年后,温特开始对整个基因组的定序产生兴趣。在这一点上,他仍很相信自己那套方法的优越性。人类基因组计划是先仔细地建立DNA不同片段的位置,然后才开始实际的定序工作。这样的话,我们事先已经知道A片段位于B片段旁,等到要把它们连成最后的序列时,便可以找出它们之间的重叠部分。但温特偏好“全基因组随机”(whole genome shotgun, WGS;亦称“全基因组散弹枪”)定序法,这种方法不做初期的图谱建立工作,而是直接把基因组随机分成一个个片段,找出它们的序列,然后把这些序列全部输入计算机,靠计算机按照重叠部分把它们排成正确的顺序,并不借助预先定好位的信息。温特和他的团队证明这种蛮干的做法实际可行,至少可用于破解简单..的基因组:1995年,他们发表了用这方法找出的流感嗜血杆菌(Haemophilus influenzae)基因组序列。
但是全基因组随机定序法是否适用于大型复杂的基因组,例如人类基因组,则尚未获得证实。问题在于重复,亦即相同序列的片段会在基因组的不同位置发生,基本上,这些重复有可能使全基因组随机定序法无法成功,也很有可能误导最精密的计算机演算。举例来说,如果有一个重复片段发生在A片段和P片段内,计算机有可能误把A排在Q旁,而不是它原本应在的位置,即B的旁边。人类基因组计划的研究小组在考虑采取全基因组随机定序法时,也讨论过这个可能性,而根据西雅图的葛林(Phil Green)的精密计算,这个小组的结论是:由于人类基因组有垃圾DNA这些大量冗长的重复序列,所以这个方法可能会造成混淆。
1998年1月,制造自动化定序仪的应用生物系统公司总裁杭卡皮勒邀请温特去参观他的最新机型PRISM3700。虽然温特对这台机器大为赞赏,但他对接下来的事毫无心理准备。杭卡皮勒建议温特成立一家新公司来进行人类基因组定序,由应用生物系统的母公司Perkin Elmer提供资金。温特毫不犹疑地舍弃了美国基因组研究所,反正他跟人类基因组科学公司的黑索廷关系也早已恶化。他立刻成立了新公司,也就是后来的赛雷拉基因公司,它的座右铭是:“速度最重要,发现不能等。”他们计划以全基因组随机定序法定序整个人类基因组,并且釆用三百台杭卡皮勒的机器加上许多计算机,其计算能力仅次于美国国防部。这个计划将费时两年,耗资在2亿美元到5亿美元之间。
这个消息传开时,刚好是后来所谓的“公共”人类基因组计划(有别于民间的“私人”计划)领导人即将在冷泉港实验室会面的前夕。含蓄地说,大家对这消息都不太能接受。我们这个全球性的计划已经花掉大约19亿美元的公共资金。如同《纽约时报》的说法,现在我们除了老鼠基因组的序列以外,可能拿不出别的成绩,而温特则可以轻松地抢走这场竞赛的圣杯:人类基因组。最令人不悦的是温特对后来被称为“百慕大原则”(Bermuda Principles)的做法嗤之以鼻。1996年,人类基因组计划在百慕大开会(温特也参加了),决议只要一获得序列数据,就立即公布。我们一致同意基因组序列应该是公共财产。现在成为叛徒的温特却有不同的想法:他宣称会延后三个月才公布新的序列数据,以便把专利权卖给有兴趣购买优先获知权的制药公司和其他任何人士。
幸运的是,维康信托基金会的摩根(Michael Man)适时提供了一剂强心针。在温特公布消息后短短数天内,摩根宣布维康将把提供给桑格中心的资金增倍,使总金额达到3.5亿美元左右。虽然这次宣布的时机看起来好像是在直接响应温特的挑战,事实上增加经费一事已酝酿了一段时间。不久,美国国会也提高了对公共人类基因组计划的补助。竞赛就此展开。其实,从一开始就注定至少会有两个优胜者。惟有两组人类基因组序列存在,科学才会受益,因为有两组结果,才能互相比对检视(在超过30亿碱基对的情况下,势必会有一两个错误)。另一个赢家无疑是应用生物系统公司:他们能卖出更多PRISM定序仪了,毕竟公共人类基因组计划中大多数的实验室现在都必须购买它们,才赶得上温特的进度。
在接下来的几年间,私人与公共计划领导人之间尖酸的言论交锋,成为报纸科学版中固定出现的题材。这些一来一往的言辞,终于连克林顿总统也看不下去,他对科学顾问说:“把这件事搞定……让这些家伙合作。”尽管如此,定序工作仍继续进行,而温特也证明全基因组随机定序法可用于相当庞大的基因组,通过和公共计划中负责研究果蝇的机构合作,他在2000年初宣布完成果蝇基因组的草图。然而,果蝇基因组仅含有极少的重复性垃圾DNA,因此赛雷拉基因公司成功组合了它,并不能保证全基因组随机定序法也适用于人类基因组。
<div class="imgbox ter">//..plate.pic/plate_220467_9.jpg" />
DNA定序进入量产:麻省理工学院的怀特海德研究所
在迎接赛雷拉的挑战上,最重要的人物莫过于兰德(Erider)。因为设想出几近完全自动化的定序过程、由机器人取代技术人员的人就是他,而拥有冲劲、能使这个设想成真的人也是他。从他的履历就可看出,他的确是很有冲劲的人。他出身纽约市布鲁克林区,在曼哈顿的司徒佛逊高中(Stuyvesant High)时是数学神童,曾赢得西屋科学奖第一名;他是普林斯顿那一届的毕业生代表(1978),后来以罗德奖学金(Rhodes fellowship)在牛津拿到博士学位。他在1987年拿到的麦克阿瑟“天才”奖似乎已 663e." >显多余。他母亲说她完全不知道儿子何以这么杰出:“我很想说这是我的功劳,其实不是……我只能说这是运气。”
兰德在纯数学圈子里,显得格外喜欢社交,最后他终于发现纯数学是“孤立、类似修道生活的领域”,于是加入比较有趣的哈佛商学院去任教,但他很快就发现自己对神经科学家弟弟的工作产生兴趣。在受到启发后,他晚上到哈佛和麻省理工的生物系进修,但白天在商学院的工作仍处理得好好的:“我几乎是在街角就把分子生物学念起来的,不过这里有很多非常好的街角可以让你私下学习。”麻省理工的怀特海德研究所就是这些街角之一,而兰德也在1989年成为该所的生物学教授。
即使在所谓的G5当中,兰德的实验室对DNA序列的贡献也是最大的。G5指基因组公共计划的五大中心——兰德的实验室、桑格中心、华盛顿大学的基因组定序中心、贝勒医学院和美国能源部在沃尔纳特克里克的实验室。他的麻省理工小组也是在促成基因组草图问世的最后冲刺阶段,大幅提高生产力的大功臣。1999年11月17日,人类基因组计划庆祝定序第十亿个碱基,那是一个G。短短四个月后,也就是2000年3月9日,T成为第二十亿个被定序的碱基。G5加足了马力。因为赛雷拉基因公司在使用公共计划的数据,这些数据总是在被发现后立即上网,现在公布的数据又多又快,可以借力使力的温特或许终于决定可以松懈一下,把赛雷拉原本预定要做的定序数量减半。
当公共与私人机构的竞赛在媒体的战场上达到高峰时,在后方,备战的焦点已逐渐转移到数学智库上,也就是隐身在密室中一排排计算机后的科学家。他们得设法解开所有这些A,T,G,C的原始序列。他们的任务主要有两项。第一,把手上许多分散的片段组合成完整的、确定的序列。大多数的部分都已经被定序了无数次,所以他们等于是要理清包含数个基因组的序列,而且得去芜存菁,直到只剩下一个标准的基因组序列。这是相当庞大的计算工作。第二,辨识最后序列中的成分,尤其是基因的位置。要确认基因组的成分(分辨这些由A,T,G,C构成的片段,哪些编码垃圾,哪些编码蛋白质),必须靠极度密集的计算机运算才能达成。
在赛雷拉基因公司负责计算机运作的人是迈尔斯(Gene Myers),这位计算机科学家是率先全力支持全基因组随机定序法的人。早在赛雷拉公司还没成立前,他和威斯康辛州马什菲尔德研究基金会(Marshfield Research Foundation)的韦伯(James Weber)就已建议公共计划采取随机定序法。因此对于迈尔斯来说,赛雷拉的成功是他的光荣,也让他获得平反。
由于先前已经建立起基因地标,因此尽管基因组序列相当庞大,比起迈尔斯在随机定序法的无地标世界的遭遇,公共计划的组合工作似乎没有那么吓人。(在最后的分析中,赛雷拉使用了公共计划供人自由取用的基因图谱信息。)事实上,公共计划正是以为可以依赖这些地标,才低估了运算上的困难,所以当赛雷拉增加计算机能力时,公共计划的注意力仍然集中在定序工作上。一直到相对后期的时候,公共计划的领导人才发现,尽管有图谱,他们仍然得解决如何去组合这个大问题,就像到圣诞夜还在努力组合新脚踏车的父亲一样。完成(以及组合好)基因组“草图”的日期已经定在6月底,但一直到5月初,公共计划仍找不到组合所有序列的方法。最后,前来解危的救星居然是加州大学圣克鲁斯分校的一位研究生。
<div class="imgbox ter">//..plate.pic/plate_220467_10.jpg" />
肯特用100台计算机为公共计划组合出基因组草图
他名叫肯特(Jim Kent),长得有点像“感恩而死”(Grateful Dead)摇滚乐团的一个成员。从进入个人计算机时代以来,他就一直在为计算机制图和动画撰写程序,但后来他决定念研究生,投身生物信息学(bioinfor-matics),亦即致力于分析DNA与蛋白质序列的新领域。有一天他在收到微软寄给Windows95程序开发人员的整整12张时,决定不再做商业程序设计:“我心想整个人类基因组可能只需要一张就够了,而且不必每3个月就更新一次。”到了5月时,他自信已经想出一个好方法,可以解开大家都在谈论的组合问题,于是他说服校方把刚为教学购置的100台个人计算机“借给”他。然后他展开为期四周的程序设计马拉松,晚上还冰敷手腕,以免白天编写大量程序代码时,手腕会变得僵硬。他的最后期限是6月26日,那也是预定宣布完成基因组草图的日期。他终于写好程序,让100台计算机开始运作,结果在6月22日,他的百台计算机大军成功解决了组合问题。赛雷拉的迈尔斯甚至到更接近底限的6月25日晚上才完成。
2000年6月26日终于来临。克林顿在白宫,布莱尔在唐宁街10号首相官邸同时宣布,人类基因组计划完成第一份草图。这场竞赛以平手收场,双方共享荣耀。至少在这天早上,对阵双方都把敌对情绪抛在脑后。克林顿宣称:“今日,我们学习上帝创造生命的语言。在获得这个深奥的新知识后,人类即将获得全新、庞大的治疗疾病的力量。”伟大的时刻搭配伟大的言辞。在面对这个被媒体喻为和阿波罗号首度登陆月球一样伟大的成就时,很难不感到光荣,即便这次成功的“官方”日期定得有点武断。其实这时定序工作根本还没完成,而且一直要到6个多月以后,基因组的正式科学报告才会问世。有人便嘲讽说,这个宣布时机不是根据人类基因组计划的时程,而是根据克林顿和布莱尔的行程制订的。
<div class="imgbox ter">//..plate.pic/plate_220467_11.jpg" />
2000年6月26日:草图在握的温特(左)和柯林斯暂时放下敌对意识,跟总统一起成为瞩目焦点。
<div class="imgbox ter">//..plate.pic/plate_220467_12.jpg" />
在白宫外:(左起)沃森、兰德(麻省理工怀特海德研究所)、吉布斯(Richard Gibbs,休斯敦贝勒医学院)、瓦特斯顿(圣路易华盛顿大学)和威尔逊(圣路易华盛顿大学)合影
在白宫的大肆宣扬下,人们很容易忽略这场庆祝的对象只是人类基因组的“草图”而已,还有许多工作尚待完成。其实称得上完整并已发表的序列,也只有最小的两条染色体(第21和22号染色体)而已,何况就连它们也不敢说是百分之百完整无缺。至于其他的染色体序列,有些都是空隙。自从那场隆重的宣布后,大家的目光已经放在2003年4月的新期限上,要在这个日期前填补好这些缺口,提出完整、正确的序列。然而后来证明,有些小区域根本无法定序,而实际目标也变成找出“基本上完整”的序列:至少完成95%的序列,而且误差率在万分之一个碱基以下。
带领各国的定序中心度过最后障碍的功臣之一,是出身美国中西部、作风豪迈的威尔逊(Rick Wilson),他继瓦特斯顿之后成为华盛顿大学基因组研究中心的主任。这场游戏的名称叫做“质量控制”,每条染色体都由一位协调人负责,他们必须监督进展,确保自己负责的对象符合这个计划的整体规定。在定序过程中偶尔会有问题发生(例如一条稻米序列莫名其妙地混入要送至数据库的数据中),但筛检程序证明可以有效地排除这种污染。在我撰写本书时,人类基因组计划正朝2003年4月前完成“基本上完整”的序列前进,也是双螺旋体发表50周年。
人类基因组计划是一项了不起的科技成就。如果在1953年时有人说,整个人类基因组会在50年内定序,克里克和我一定会大笑,请他再喝一杯酒。过了20多年,首批DNA定序法终于问世时,这种怀疑似乎仍很合理。这些方法当然都是技术上的突破,但当时定序过程仍极度缓慢(即使要定序长度只有数百个碱基对的基因,都是一项重大挑战)。如今,在仅仅又过了25个年头后,我们已经在庆祝完成大约31亿个碱基对的序列了。然而我们仍然必须牢记,虽然基因组定序是惊人的成就,但它绝不只是一个科技上的里程碑而已。不论直接的政治动机为何,克林顿在白宫庆祝会上说得很对:我们手中可能已经握有对抗疾病的强大新武器。而且,我们甚至可能对生物的组成与运作,以及我们和其他物种之间的差异有全新的了解,亦即洞察我们之所以为人的道理。
百度搜索 DNA:生命的秘密 天涯 或 DNA:生命的秘密 天涯在线书库 即可找到本书最新章节.