人类基因组计划研究进展.doc

人类基因组计划

摘要:综述了人类基因组计划的主要研究内容、研究历程和成果、人类基因组计划的研究对人类社会的意义以及我国人类基因组研究的概况等。

关键词:人类基因组计划 研究进展 成果 后基因组学

人类基因组计划(human genome project, HGP)是由美国科学家于1985年率先提出,1986年,诺贝尔奖得主杜尔贝科(Renato Dulbecco)在《科学》周刊撰文回顾肿瘤研究的进展,指出要么依旧采用“零敲碎打”的策略,要么从整体上研究和分析人类基因组。[1.Dulbecco R. Aturning poin tincancer research:sequencing the human genume[J].Science,1986,231: 1055—1056.]1990年10月,美国政府正式启动了HGP工程,投资30亿美元,预期于2005年完成人类基因组约30亿个碱基对的全序列测定。美国、英国、法兰西共和国、德意志联邦共和国、日本国和中国科学家共同参与了这一价值达30亿美元的人类基因组计划,6国科学家组成的国际人类基因组中心主要研究比例如表1。这一计划旨在为30多亿个碱基对构成的人类基因组精确测序,发现所有人类基因并搞清其在染色体上的位置,破译人类全部遗传信息。与曼哈顿计划和阿波罗计划并称为三大科学计划。

表1 六国科学家组成的国际人类基因组中心主要研究比例:

总之,HGP的主要任务是人类的DNA测序,主要包括四张谱图:遗传图谱(genetic map)、物理图谱(physical map)、序列图谱、基因图谱,此外还有测序技术、人类基因组序列变异、功能基因组技术、比较基因组学、社会、法律、伦理研究、生物信息学和计算生物学、教育培训等目的。

1.1 遗传图谱(genetic map)

又称连锁图谱(linkage map),它是以具有遗传多态性(在一个遗传位点上具有一个以上的等位基因,在群体中的出现频率皆高于1%)的遗传标记为“路标”,以遗传学距离(在减数分裂事件中两个位点之间进行交换、重组的百分率,1%的重组率称为1cM)为图距的基因组图。遗传图谱的建立为

基因识别和完成基因定位创造了条件。意义:6000多个遗传标记已经能够把人的基因组分成6000多个区域,使得连锁分析法可以找到某一致病的或表现型的基因与某一标记邻近(紧密连锁)的证据,这样可把这一基因定位于这一已知区域,再对基因进行分离和研究。对于疾病而言,找基因和分析基因是个关键。

1.2 物理图谱(physical map)

物理图谱是指有关构成基因组的全部基因的排列和间距的信息,它是通过对构成基因组的DNA分子进行测定而绘制的。绘制物理图谱的目的是把有关基因的遗传信息及其在每条染色体上的相对位置线性而系统地排列出来。DNA物理图谱是指DNA链的限制性酶切片段的排列顺序,即酶切片段在DNA链上的定位。因限制性内切酶在DNA链上的切口是以特异序列为基础的,核苷酸序列不同的DNA,经酶切后就会产生不同长度的DNA片段,由此而构成独特的酶切图谱。因此,DNA物理图谱是DNA分子结构的特征之一。DNA是很大的分子,由限制酶产生的用于测序反应的DNA片段只是其中的极小部分,这些片段在DNA链中所处的位置关系是应该首先解决的问题,故DNA物理图谱是顺序测定的基础,也可理解为指导DNA测序的蓝图。广义地说,DNA测序从物理图谱制作开始,它是测序工作的第一步。制作DNA物理图谱的方法有多种,这里选择一种常用的简便方法──标记片段的部分酶解法,来说明图谱制作原理。

1.3 序列图谱

随着遗传图谱和物理图谱的完成,测序就成为重中之重的工作。DNA序列分析技术是一个包括制备DNA片段化及碱基分析、DNA信息翻译的多阶段的过程。通过测序得到基因组的序列图谱。

大规模测序基本策略:①逐个克隆法:对连续克隆系中排定的BAC克隆逐个进行亚克隆测序并进行组装(公共领域测序计划)。②全基因组鸟枪法:在一定作图信息基础上,绕过大片段连续克隆系的构建而直接将基因组分解成小片段随机测序,利用超级计算机进行组装(美国Celera公司)。

1.4 基因图谱

基因图谱是在识别基因组所包含的蛋白质编码序列的基础上绘制的结合有关基因序列、位置及表达模式等信息的图谱。在人类基因组中鉴别出占具2%~5%长度的全部基因的位置、结构与功能,最主要的方法是通过基因的表达产物mRNA反追到染色体的位置。

基因图谱的意义在于它能有效地反应在正常或受控条件中表达的全基因的时空图。通过这张图可以了解某一基因在不同时间不同组织、不同水平的表达;也可以了解一种组织中不同时间、不同基因中不同水平的表达,还可以了解某一特定时间、不同组织中的不同基因不同水平的表达。

1.5 基因的鉴定和分析

通过基因的表现型来鉴定基因是最有效的手段之一。至今为止,已克隆了大约1000多个人类基因。这些技术主要包括以下几类:

1、定位克隆(positional cloning):例如ob基因和Huntington舞蹈症的基因

(1)、通过疾病家系,进行染色体缺失或平衡易位以及连锁分析将结果转化为物理信息,在染色体上进行物理定位。

(2)、利用邻近的DNA标记,构建contig。

(3)、编码序列的筛选 可采用cDNA文库直接筛选的方法或外显子捕获(exon trapping)。

(4)、疾病基因的鉴定 分析基因突变和缺失以及突变的规律。最后,可用基因敲除(knock-out)技术来验证基因的功能。

2、候选克隆(candidate cloing):包括定位候选克隆和功能候选克隆

(1)、定位候选克隆:指疾病基因以连锁分析或染色体分析定位后,再从基因组资料库(GDB)中检索邻近区域中所有已知的基因包括已证明与疾病有关的或尚未建立关系的基因、已知的EST,参考已知的模式生物对应的同源序列上的已知EST用它们来直接进行致病突变的筛选。

(2)、功能候选克隆:根据致病基因的功能,从GDB或基因库(GenBank)中寻找功能相近的基因,用于致病的改变。这些方法充分利用了HGP的成果,可起到事半功倍的效果。如用该法发现了神经退行性疾病--DRPLA症基因。还发现了亨廷顿舞蹈病、遗传性结肠癌和乳腺癌等一大批单基因遗传病致病基因【4.人类基因组计划的现状[ EB/OL ]. http: / /www. bioon. com /A rticle /molecu lar/168175 _ 2.shtm,l 2005- 01- 04.】,为这些疾病的基因诊断和基因治疗奠定了基础。通过利用此法的全基因组关联分析发现了人类9号染色体9p21.3区域和冠心病显著相关,而该区域在既往的研究中较少关通过全基因组关联分析发现了人类9号染色体9p21.3区域和冠心病显著相关,而该区域在既往的研究中较少关【5. Wellcome Trust Case Control Consortium.Genome—wide association studv of 14,000 cases of seven common diseases and 3,000 shared controls[J].Nature,2oo7,447(7145):661-678

6.McPhemon R,Pertsemlidis A,Kavaslar N,et a1.A common allele on chromo.some 9 associated with coronary heart disease[J]Science,2007,316(5830):l488.】491.

7.Helgadottir A,Thorleifsson G,Manolescu A.et a1.A common variant on chromo—some 9p21 affects the risk of myocardial infarction[J]Science,2007,316(5830):1491·1493.】。该区域尤其是rs1333049SNP多态性和冠心病明确相关【8.Farzaneh-Far R,Na B,Schiller NB,et al Lack of association of chromosome

9p21.3 genotype with cardiovascular structure and function in persons with stg—ble comnary anery disease:The Heart and Soul Study[J].Atherosclerosis,2008.205(2):492-496.

9.Summaries for patients.Does measuring genetic variations at chromosome 9p21.3 help to predict cardiovascular disease in women[J]?Ann InternMed,2009.150(2):I-36.

10.Sjorck HM,Lanne T,Alehagen U,et a1.Association of genetic variation on chromosome 9p21.3 and arterial stiffness[J].J Intern Med,2009,265(3):373.381.

11.Rodriguez-Menocal L,Pham SM,Mateu D,et a1.Aging increases pl6 Ink4a ex—pression in vascular smooth muscle cels[J].Biosci Rep,2009,30(1):11-18.

12.Schunkert H,Gotz A,Braund P,et a1.Repeated replication and a prospective lneta—analysis of the association between chromosome 9p21.3 and coronary ar_tery disease[J].Circulation,2008,117(13):1675-1684.

13.Paynter NP,Chasman DI,Buring JE,et al Cardiovascular disease risk predic—tion with and without knowledge of genetic variation at chromosome 9p21.3[J].Ann Intern Med,2009,150(2):65-72.

14.Zhou L,Zbaug X,He M,et a1.Associations between single nucleotide polymorphisms on chrmnosome 9p21 and risk of coronary heart disease in Chinese Han population[J].Arterioscler Thromb Vasc Biol,2008,28(11):2085-2089.】 3、功能克隆 (functional cloning):如镰刀状贫血基因的发现就是利用此法

最早采用的基因克隆策略。生化缺陷可能与某一类蛋白的功能缺陷有关,从相关的蛋白质氨基酸序列资料,可推测其mRNA序列,设计特异的寡核苷酸探针杂交而筛选cDNA文库,从而获得全基因cDNA。镰刀状贫血病基因的发现是功能克隆的例子。若可获得纯的蛋白质或有这些蛋白质的抗体,这种方法仍为克隆基因的首选策略。

2.人类基因组计划研究历程与成果

1990年10月,美国首先正式启动“人类基因组计划”(HGP).

1992年, 美国和法国的两支研究队伍分别完成了人类Y染色体和第21条染色体的第一张物理图谱;随后又分别完成了鼠和人的遗传图谱。

1993年, 位于英国剑桥的Sanger中心加入人类基因组计划,并成为一个重要的测序中心。美国对这一计划做了修订,其中最重要的任务就是人类基因组的基因图构建与序列分析,需最优先考虑、必须保质保量完成的是DNA序列图.随后,英国、法国、日本、加拿大、前苏联、中国等许多国家积极响应,都开始了不同规模、各有特色的人类基因组研究[[15] Timeline A. History of the Human Genome

Project[J].Science,2001,291: 1195—1203. ].

1994年, 美国与法国完成了人类基因组中的第一个完整遗传连接图谱。

1996年3月, Nature发表了法国、加拿大合作获得的完全由5 264个微卫星(AC/TG)n标记组成、遗传距离(分辨率)平均为1·6 cM (cM即厘摩,相当于1%的重组频率)的人类最新的遗传连锁图[16.Dib C, Faure S, Flzames C, et al. Acomprehensive gene to map of the human genome base don 5264 micros ate llites

[J].Nature,1996.380: 152—154.] 而包含15 086个STS标志、分辨率达199 kb的人类基因组物理图谱也在1996年建立[[17] Schuler G D, Boguski M S, Stewart E A. Age nemap of the human genome [J].Science,1996, 274: 540—546.]同年, 各国科学家聚集在百慕大群岛,讨论并通过了充分体现HGP精神(全球共有,国际合作,即时公布,免费共享)的百慕大原则。

到1997年,已完成或正在进行约330 Mb的人类染色体区域的测序,占总基因组的11%左右[[18] Spenger, SylviaL. Abstracts of the third international workshop on human chromo some mapping [ J ].Cytogenet Cell Genet,1997.78:236—239. [19] Alla L, Galleron N, Sorokin A, et al. Sequencing and function alannotation of the bacillus subtilis genes in the 200 kbrrnB-dna Bregion[J].Microbiology,1997,143(11): 3431—3441.]. cDNA的序列分析工作进展也很快, 1997年数据库中的EST数目已达719 076个.另外,已识别出与人类疾病相关的基因200个左右.就模式生物来看,到1997年,已完成了141种病毒、2种真菌和酿酒酵母的测序工作;小鼠的高密度遗传图谱已绘制完毕; 1997年10月,中国科学院国家基因研究中心发表了覆盖率约达92%的水稻基因组第一代BAC指纹物理图[[20] 安海谦,卢圣栋. DNA芯片技术及其应用[J].生物工程进展,1998,18(2): 37—39.]. 大肠杆菌基因组(5Mb)全部测序完成,毛细管测序仪上市。

1999年9月,中国加入HGP,承担位于人类第3号染色体短臂上3000万bp测序任务。同年12月,

第22条染色体破译,人类首次成功地完成人体染色体基因完整序列的测定.

2000年4月,中国完成1%测序任务,所有指标均达到国际人类基因组计划协作组对“完成图”的要求。精确度99.99%,发现142个基因,其中80个为预测基因。2000年6月26日, 六国科学家公布人类基因组工作框架图,成为人类基因组计划进展的一个重要里程碑.

2001年2月12日,人类基因组图谱及初步分析结果首次公布. 他们的题为《人类基因组的初步测定和分析》的学术论文发表在2月15日的美国《自然》杂志上,这是人类首次全面介绍人类基因组框架图的“基本信息”。2001年9月,HGP第十次战略大会在杭州召开,还有1% 的难测序列,约700个疑难点。

2002年英美日加拿大尼日利亚中国制定人类基因组单体型图计划。

2003年4月15日,美、英、德、日、法、中6个国家共同宣布人类基因组序列图完成,人类基因组计划的所有目标全部实现,提前2年实现了目标。[ [ 21] 骆建新,郑崛村,马用信,等.人类基因组计划与后基因组时代[J].中国生物工程杂志,2003,23(11): 87—94.]

2004年10月,人类基因组完成图公布。

2005年3月,人类X染色体测序工作基本完成,并公布了该染色体基因草图。2005年10.26六国在《自然》杂志发表报告宣布人类基因组单体型图计划第一期工作已经完成。

2006年5月18日美国和英国科学家在英国《自然》杂志网络版上发表了人类最后一个染色体——1号染色体的基因测序【22 S. G. Gregory et al., Nature, 2006, 441:315 .】在人体全部22对常染色体中,1号染色体包含基因数量最多,达3141个,是平均水平的两倍,共有超过2.23亿个碱基对,破译难度也最大。一个由150名英国和美国科学家组成的团队历时10年,才完成了1号染色体的测序工作。科学家不止一次宣布人类基因组计划完工,但推出的均不是全本,这一次杀青的“生命之书”更为精确,覆盖了人类基因组的99.99%。解读人体基因密码的“生命之书”宣告完成,历时16年的人类基因组计划书写完了最后一个章节。

2007年5月31日Watson的个人基因组图谱向全世界公开。2007年10月13日,在深圳高交会一号展馆,全球第一个中国人基因组图谱,即全球第一个黄种人基因图谱(炎黄一号)正是发布,这也是第一个亚洲人全基因序列图谱。

2010年1月,来自美国农业部、美国能源部联合基因组研究所等单位的研究人员联合在《自然》宣布,

该研究团队利用“全基因组鸟枪测序法”对大豆基因组的11亿个碱基进行测序,公布了第一张豆科植物完整基因组序列图谱。这也是目前利用全基因组鸟枪测序完成的最大植物基因组。

人类基因组草图基本信息显示:人类基因组由31.65亿bp组成,含2~3万基因,与蛋白质合成有关的基因只占2%。人类蛋白质的61%与果蝇同源,43%与线虫同源,46%与酵母同源。

人类基因组研究成果表明:

①,基因数目比想象的要少得多,人类基因组的DNA由3×10个碱基对组成,人类只有2-3万个遗传基因,编码序列不足总基因量的5%,这相当于线虫、果蝇遗传基因数的2倍,仅比老鼠多几百个遗传基因。如此少得基因数目,而能产生如此复杂的功能,说明基因组的大小和基因的数量在生命进化上可能不具有特别重大的意义,也说明人类的基因较其他生物体更‘有效’,人类某些基因的功能和控制蛋白质产生的能力与其他生物的不同。

②,人类基因组中存在“热点”和大片“荒漠”。在染色体上有基因成簇密集分布的区域,也有大片的区域只有“无用DNA”—不包含或含有极少数基因的成分。基因组上大约有1/4的区域没有基因的片段。在所有的DNA中,只有1%-1.5%DNA能编码蛋白,在人类基因组中98%以上序列都是所谓的 “无用DNA”,35.3%的基因组包含重复序列。这些重复的“无用”序列,绝不是无用的,它一定蕴含着人类基因的新功能和奥秘,包含着人类演化和差异的信息。经典分子生物学认为一个基因只能表达一种蛋白质,而人体中存在着非常复杂繁多的蛋白质,提示一个基因可以编码多种蛋白质,蛋白质比基因具有更为重要的意义。

③,平均的基因大小有27kbp;其中G+C含量偏低,仅占38%,而2号染色体中G+C的含量最多;17号、19号、22号染色体是含基因最丰富的染色体,X、4号、18号和Y染色体上相对贫瘠,而13号染色体含基因量最少。

④,目前已经发现和定位了26000多个功能基因,其中尚有42%的基因不知道功能。

⑤,人与人之间99.99%的基因密码是相同的,人与人之间的差异仅为万分之一,发现来自不同人种的人比来自同一人种的人在基因上更为相似。从而说明人类不同“种属”之间并没有本质上的区别。

⑥,男性的基因突变率是女性的两倍,而且大部分人类遗传疾病是在Y染色体上进行的。所以。可能男性在人类的遗传中起着更重要的作用。

⑦,人类基因组中大约有200多个基因是来自于插入人类祖先基因组的细菌基因。这种插入基因在无脊椎动物是很罕见的,说明是在人类进化晚期才插入我们的基因组的。可能是在我们人类的免疫防御系统建立起来前,寄生于机体中的细菌在共生过程中发生了与人类基因组的基因交换。

⑧,发现了大约一百四十万个单核苷酸多态性,并进行了精确的定位,初步确定了30多种致病基因。 ⑨,人类基因组编码的全套蛋白质(蛋白质组)比无脊椎动物编码的蛋白质组更复杂。人类和其他脊椎动物重排了已有蛋白质的结构域,形成了新的结构。也就是说人类的进化和特征不仅靠产生全新的蛋白质,更重要的是要靠重排和扩展已有的蛋白质,以实现蛋白质种类和功能的多样性。[23.贾 贞,安黎哲,徐世健.基因工程导论[M].兰州:兰州大学出版社, 2004. 189—198.] 9

3 人类基因组计划的意义

“人类基因组计划”(HGP)研究已经最终破译了人类DNA分子的全部核苷酸顺序,建立了人类遗传物质的一整套信息数据库;可以在DNA全序列阐明的基础上建立染色体的三维结构,进一步来解释扩增、插入、缺失、易位、重组等过程的分子机制;可以使医学上的5千多种遗传疾病以及恶性肿瘤、心血管疾病等、由此得到预测、预防、早期诊断和治疗; HGP作为整个生命科学发展的“突破口”,可以带动生命科学其他领域及应用生物技术的发展,并对所涉及的伦理、法律等社会科学领域也将产生巨大的影响.因此, HGP的研究不仅具有深刻的科学意义,也具有深远的社会意义. HGP对生命科学研究与生物产业发展的导向性意义,可以用规模化、序列化、信息化、产业化、医学化、人文化来归纳[24 张猛.“人类基因组计划”给我们带来什么[J].科技术语研究,2000,2(3): 41—43].

3·1 规模化

“基因组学”这一新的学科,是随着“人类基因组计划”的启动而诞生,并随着人类基因组计划的进展而发展起来的.生物学家第一次从整个基因组的规模去认识、研究1个物种或多个物种(通过比较基因组学)的全部基因,而不是大家分头1个1个去发现、研究自己“喜欢”的基因.这是基因组学与遗传学(genetics)及所有涉及基因的生物科学和其他学科的主要区别之一[25杨焕明.人类基因组计划及其意义[J].安徽科技,2003, (5): 8—10.].迄今为止,现代生物技术涉及到医疗卫生、制药工业[26郭晓华.人类基因组计划(HGP)的提出及重大意义[J].沈阳教育学院学报,2002,4(2): 114—116.]、环境改造、食品改良等与人们生产生活息息相关的许多领域.目前,人们所关注的转基因动植物(包括转基因食品)、高等动物的整体克隆、“人工器官”的活体培养、人类疾病的基因诊断和基因治疗、DNA疫苗等新技术已经对人类健康及其赖以生存的环境产生了深刻的影响. HGP的大规模运作也将推动生物技术科研与开发并肩走向操作的规模化、自动化,这无疑会使生物技术在未来经济发展中占有及其重要的位置.

3·2 序列化

生物信息的序列化,是生命科学进入21世纪划时代的里程碑,也是生命科学成熟的1个阶段性标志.只有数量化(定量)的学科才能称为科学.生物信息的序列化,提供了研究生物这样复杂的系统可比的、定量的数据,即生命科学以序列为基础,提供了使用大型计算机解读遗传信息的可能性.就人类来说,这一张序列图将与第一张解剖图一样永垂科学史册.这是21世纪的生命科学区别于以前的生物学最主要的特点.

3.3信息化

在某种意义上,序列化就是信息化.基因组学是从整体上研究1个物种的所有基因结构和功能的新科学,它将从整体上揭示生物活动规律的奥秘.人类基因组DNA序列共有30亿个碱基对,但控制人类性状的基因仅占全部序列的3%~5% (约6~10万个基因),迄今,已鉴定的人类基因约有4万个.这项工程最终可以解读人类DNA的全部核苷酸,建立人类遗传物质的一整套信息数据库,并逐步掌握生物种群所具有的全部遗传信息.在实施HGP的同时, 1993年,人类基因组多样性计划(Human genome diversity project,HGDP)又开始启动.其研究目标是通过不同种族和人群分子多态性(如微卫星多态MS、ALU序列、单核苷酸多态SNP、线粒体DNA等)的比较,分析人类起源、进化、迁徙与分子多态变化事件的相互关系;研究不同地理区域人群和种群的遗传个体差异性以及与进化的关系,为生物起源、进化的规律性探索提供证据,最终建立来自全世界人群的遗传多样性信息库.人类基因组计划的成功,是借助了同步发展的信息学和网络.同时,信息化改变了整个生命科学,改变了实验材料以及试剂(探针)的存在方式,以至于生物资源也信息化了.

3·4 产业化

“人类基因组计划”伊始,就定位在带动1个产业———生物产业. HGP研究是多学科的,它的继续研究将推进非线性(复杂性)科学、物理学、化学、数学和计算机科学的发展,更要促进生物工程学的发展[18贾 贞,安黎哲,徐世健.基因工程导论[M].兰州:兰州大学出版社, 2004. 189—198.]. HGP的实施使人类在了解致病遗传机理和发现新基因上迈出了至关重要的一步,为基因药物设计提供了重要的理论基础和设计原则.现已成功分离亨廷顿氏舞蹈症、杜氏肌营养不良、哮喘病、乳腺癌等各种癌症及糖尿病等70多种遗传病基因,必将使生物制药产业发生空前的变革.

3·5 医学化

人类基因组学是生物技术产业和健康产业的知识核心,蕴涵着无比巨大的产业化潜能和商业利益. HGP最初是作为1项治疗肿瘤等疾病的突破性计划提出的,因此,该计划一直将疾病基因的定位、克隆、鉴定作为研究核心,形成了疾病基因组学.随着基因组“工作框架图”的问世,许多致病单基因被确定为候选基因,并逐步对其结构与功能进行了分析.人类基因组计划已经把它的成果医学化,数十种基因产品,如人胰岛素、干扰素、生长激素等,已经投入工业化生产.基因预测,基因预防,基因诊断、检测和生物芯片,基因治疗,基因改良,器官复制与再生将使整个医学改观.届时,危害人类健康的5 000多种遗传病以及与遗传密切相关的癌症、心血管疾病、关节炎、糖尿病、高血压、精神病等,都可以得到早期诊断和治疗[27田 瑛.人类基因组计划研究展望[J].包头职大学报,2003, (2): 6—7.]. DNA序列差异的研究将有助于人类了解不同个体对环境易感性与疾病的抵抗力,因而DNA序列分析很有可能成为最快速、最准确,也最便宜的诊断手段之

一.随着人类基因组计划的不断推进,用不了几年,人们将看到1份描述人类自身的说明书,它是1本完整地

讲述人体构造和运转情况的指南,而现代医学则可根据每个人的“基因特点”对症下药,这即是21世纪的医学———“个体化医学”.

3·6 人文化

人类基因组计划使人类对于人性、人文、人权、平等等概念以至于社会结构都要重新讨论.它提供了重新审视人类自我的人文基础,也提供了重新认识人与人之间的关系、1个人在社会中的地位、人类与生命世界以至于在整个自然界中的位置与关系的基础.人类基因组计划告诉我们的是:基因组不应被视为1块僵硬的遗传模板,而是1个流动的、动态的结构, DNA分子恒久处在重排、插入和缺失造成的变动之中[28 Luningpraket, Kaza Zianzz, J R. Mobile element sand the human genome [ J ].Nature Reviews Genetics,2000, (1): 134—144.];物种之间的横向基因转移(HGT)不仅从远古起就持久、大量地发生,并且可能是生命进化的主要动力之一[29 Brown J R. Ancient horizontal gene transfer [ J].Nature Reviews Genetics,2003, (4): 121—132].

3.4 后基因组学

从1996年起,随着人类基因组测序计划的完成[30 Venter J C, Adams M D, Myers E W, et al. The sequence of the human genome[J].Science,2001,291(5507): 1304—1351.,31 Lander E S, Linton L M, Birren B, et al. Initial sequencing and analysis of the human genome[J].Nature,2001,409(6822): 860—921.]和后基因组时代的到来,国际上基因组、转录组、蛋白质组、代谢组乃至表型组工作的相继开展

[32 Bork P, Dandekar T, Diaz Lazcoz Y, et al.Predicting function: from genes to genomes and back

[J].J Mol Biol,1998,283(4): 707—725.],各种类型功能基因组数据的爆炸性增长,信息整合和数据挖掘的重要性显得尤为突出.有人将细胞的基因组、转录组和蛋白质组综合起来称为操纵子组(operomics)[33 Hanash S M. Operomics: molecular analysis of tissues from DNA to RNA to ptotein[J].Clin Chem Lab Med,2000,38(9): 805—813.]来研究功能,正体现了这种认识.这就是通常所说的“后基因组学”(postgenomics).“后基因组学”主要包括:

1)人类基因的识别和鉴定[34 Martienssen, Robert A. Functional genomics:probing plant gene function and expession with transposons[J].Proceedings of the National Acade my of Sciences of the United States of America,1998,95(5): 2021—2026.,35 Goffeau A, Barrell B G, Bussey H, et al. Life with 6000 genes [J].Science,1996,274: 546—567.].即采用生物信息学、计算机生物学技术和生物学实验手段以及两者相结合的方法,收集并不断扩充现有的各种数据库,研制、建立更多样化的数据库和信息处理软件.从基因的编码序列、调控序列、重复序列、保守序列、特征性序列、蛋白质序列等多角度、多方面入手,包括模式生物已得到的基因组序列,进行比较基因组学研究[36 Goffeau A, Barrell B G, Bussey H, et al. Life with 6000 genes [J].Science,1996,274: 546—567].

2)基因功能信息的提取和鉴定.即利用改进的定量PCR技术、原位杂交技术、微点阵技术[37 Lockhart

D J, Dong H, Byrne M C, et al.Expression monitoring by hybridization tohigh-densityoli go nucleotidearrays [ J ].Nature Biotechnology,1996,4: 1675.]和基因表达的连续分析方法绘制基因表达图谱,同时包括对人类基因突变体的系统鉴定.

3)蛋白质组学的研究.即蛋白质谱的建立与基因的相互作用关系的研究.蛋白质组学研究中的新方法是:采用双向凝胶电泳和测序质谱技术;建立蛋白质结构数据库,以研究其结构和功能的关系,并判断相关基因的结构与功能的关系[38舒 薇,郭 勇.人类基因组及后基因组研究进展及其应用与开发研究现状[J].生物技术通报,2000, (4): 1—5.];采用双杂交体系、三杂交体系、激酶蛋白靶和锌指蛋白的DNA靶检测技术构建基因组相互作用图;采用X射线衍射技术和核磁共振技术对晶体蛋白和水溶性蛋白进行空间构型分析,建立蛋白质结构数据库,以研究蛋白质和相关基因结构与功能的关系;采用显微定位、定量新技术和荧光原位杂交、共聚焦等新技术对蛋白质的结构与功能及其与基因的相互作用进行阐释[39 Muellner, Stefan, Thomas N, et al. Proteomics: a new way for drug target discovery [ J ].Arzneimittel—Forschung, 1998,48(1): 93—95.].科学家正对数万个蛋白质片段进行识别和分类,目的是最终绘制出一张蛋白质组图.可以预见,蛋白质组研究将导致药物开发方面的实质性突破,使得生命科学能够实现长期以来所追求的目标,

即研制出治疗诸如癌症和艾滋病等在内的各种疾病的药物.

除此之外,基因组与生命形式和生物形态进化的关系研究也将是21世纪“后基因组学”开展研究的主要问题.

4.中国人类基因组研究概况 中国自1987年开始设立人类基因组研究课题,经过各方面的努力,先后在1993年和1996年正式启动了“中华民族基因中若干位点基因结构的研究”和“重大疾病相关基因的定位、克隆、结构与功能研究”国家自然科学基金和863高科技计划课题.由于投资所限,中国的人类基因组研究不能像国外那样对全基因组或整条染色体作图和测序[40常凤滨.人类基因组计划研究的进展及其意义[J].晋中师范高等专科学校学报,2002,19(2): 107—108.],所以我国人类基因组研究目标主要是根据本国人群资源优势的特点,突出基因多样性研究和疾病基因识别.1998年,中国的HGP被确立为国家计划并在北京和上海成立了中国人类基因组北方研究中心和南方研究中心,着重收集和保存我国民族独特的基因组,研究民族间基因组的差异,分析其遗传学的意义,以及探明我国若干重要致病基因和易感基因的分布及发病机理,为基因诊断和基因治疗提供理论依据.1999年9月,中国获准加入HGP计划,成为参与其中的唯一发展中国家,负责3号染色体短臂从D3S3610至端粒区段约3 000万个碱基对(30Mb)的全序列测定,简称其为“1%测序任务”.虽参加时间较晚,但我国科学家提前2年于2001年8月26日绘制完成“中国卷”,赢得了国际科学界的高度评价.这一目标的实现,将为中国21世纪的医学和生物制药产业储备一批重要的基因,大大促进我国生物信息学、生物功能基因组及蛋白质等生命科学前沿领域的发展[18贾 贞,安黎哲,徐世健.基因工程导论[M].兰州:兰州大学出版社, 2004. 189—198.],同时将提高我国基因组科学的总体水平,为我国基因资源的开发利用开辟广阔的前景,更加体现出中国对基因组科学的贡献,从而获得与全球科学界共享人类基因组计划成果的权利[常凤滨.人类基因组计划研究的进展及其意义[J].晋中师范高等专科学校学

报,2002,19(2): 107—108.].

2003年4月,中国在现有工作基础上,加强了人类基因组的后续研究与开发,已将这项工作列入12个国家重大科技专项之一的“功能基因组与生物芯片”.超级水稻基因组计划已顺利完成,这必将对水稻研究和粮食生产产生重大影响[18贾 贞,安黎哲,徐世健.基因工程导论[M].兰州:兰州大学出版社, 2004. 189—198.].国家又投入6亿元,主要开展重大疾病、重要生理功能相关功能基因、中华民族单核苷酸多态性的开发应用,以及与人类重大疾病及重要生理功能相关的蛋白质、重要病原真菌功能基因组等的研究与开发,进一步完善我国生物技术创新体系,力争使中国在人类后基因组研究方面进入世界先进行列.

人类疾病基因研究的贡献

人类疾病相关的基因是人类基因组中结构和功能完整性至关重要的信息。对于单基因病,采用“定位克隆”和“定位候选克隆”的全新思路,导致了亨廷顿舞蹈病、遗传性结肠癌和乳腺癌等一大批单基因遗传病致病基因的发现,为这些疾病的基因诊断和基因治疗奠定了基础。对于心血管疾病、肿瘤、糖尿病、神经精神类疾病(老年性痴呆、精神分裂症)、自身免疫性疾病等多基因疾病是目前疾病基因研究的重点。非综合征性唇腭裂(nonsyndromic cleft Lip and/or palates,NSCL/P)为一种复杂的多基因遗传病,是遗传因素和环境因素综合作用的结果。随着人类基因组计划的完成,先天性唇腭裂易感基因的研究已成为该领域的研究热点。

国内研究证实TGF一8基因多态性与中国人群NCL/P的发生有相关性,与其他因素互相影响最终导致唇腭裂的发生。 【焦晓辉,王 丽,徐旭光.中

国人群非综合征性唇腭裂与TGF[33多态性的关系.哈尔滨医科大学学报,2003,37(5):415~418】3O 万伟东,王丽君,周小平,等.MTHFR基因C677T和A1298C多态与中国部分人群非综合征性唇腭裂的相关研究.中华整形外科杂志,2006,22(1);8~11.; 周小平,王海琦,万伟东,等.非综合征性唇腭裂的环境与基因多态性分析及归因危险度估算.中国优生与遗传杂志,2005,13(12):36~39.; 万伟东,王小宁,王海琦,等.环境暴露和MTHFR、TGFR等基因多态性与NSCL/P关系的探讨.中国卫生统计,2006,23(3):240~242】3l Pezzettil F,Martinelli M ,Scapoli L,et a1. Maternal MTHFR variant forms increase the risk in offspring of isolated nonsyn—dromic cleft lip with or without cleft palate.Hum Mutat,2004,24(1):104~105 ;吴平安,李运良,范国正,等.MSX1基因微卫星多态性与非综合征性唇腭裂的相关性研究.中华医学遗传学杂志,2007,24(3):325~327(2001年我国上海和北京科学家发现遗传性乳光牙本质II型基因

获取了操纵生命的工具

控制生命的孕育—优生优育 延长人的寿命 随着基因和基因组研究的进展,许多疾病在发作之前就能在分子水平上得到治疗,对人类 “衰老基因”和“长寿基因”的详细了解也将激发人类为增加自己寿命而努力。 目前,一些国家的人口平均寿命已突破80岁,中国也突破了70岁。柯林斯预测说,到2050 年,人类的平均寿命将达到90-95岁。中国工程院院士、中国医学科学院院长巴德年教授则说, 再过20年人类有望攻克癌症,心脑血管疾病可望得到有效防治,在2020-2030年间, 可能出现人 口平均寿命突破100岁的国家。

选择最佳生活环境

对医学的贡献

人类基因组计划的研究成果将带来一场医学革命。可用于基因诊断、基因治疗和基于基因组知识的治疗、基于基因组信息的疾病预防、疾病易感基因的识别、风险人群生活方式、环境因子的干预。重组人p53腺病毒药物(10 rAd/p53)对人鼻咽癌CNE细胞生长有明显抑制。结论重组人p53腺病毒药物(rAd/p53)对人鼻咽癌CNE细胞生长能有效抑制,为鼻咽癌的基因治疗提供了实验依据。【敖敏,何刚.p53基因药物抑制人鼻咽癌生长的免疫组化研究【J】四川医学,2009,3O(8):1193-1194】道Rosenberg等应用基因疗法将普通的免疫细胞转化成更有效杀死黑色素瘤的细胞,并在对恶性黑色素瘤患者的临床试验中接近治愈这一疾病。Morgan RA,Dudley ME,Wunderlich JR,Hughes MS,Yang JC.Sherry RM.et n.Cancer regression in patients after trails—fer of genetically engineered lymphocytesl J].Science,2006,10(6):126-129.

人类全基因组同步分析方法诞生

德国马普分子遗传学研究所和柏林夏洛蒂医科大学医学遗传学研究所的科学家们成功发明了一种新分析方法一一‘‘外显子组序列世系过滤法”(descent filtering of exolTle sequence),该方法可以同时分析人类基因组的所有基因.该方法首次应用于柏林一个家庭的3个孩子身上,他们惠有罕见的智力缺陷遗传病—— 马布里综合症(MabrySyndrome)研究利用高通量测序方法从整个基因组找出了22 000个基因,解码它们的序列并检查突变位点.最终,运用新的生物信息学分析方法,科学家将突变的数量限制到2个,而其中一个突变(PIGV突变)是最终导致马布里综合症发生的原因.马普分子遗传学研究所的Michal Ruth Schweiger形容这项_y-作就像“大海捞针”.PIGV基因发生了突变,导致某些蛋白质功能丧失,比如,使得碱性磷酸酶不能够与细胞膜表面结合.相关论文发表在8月29日出版的《自然 遗传学》杂志上这种新的基因组分析方法使得对极其罕见疾病中基因突变的鉴定成为可能,并向个性化的分子药物研发迈出了重要的一步

原载《科学网》,2010—09 02任春晓编译 对生物进化研究的影响:对进化过程各个阶段的生物进行系统的比较DNA测序,将揭开生命35亿年的进化史。生物的进化史,都刻写在各基因组的“天书”上;草履虫是人的亲戚——13亿年;人是由300~400万年前的一种猴子进化来的;人类第一次“走出非洲”——200万年的古猿;人类的“夏娃”来自于非洲,距今20万年——第二次“走出非洲”?这样的研究不仅能勾画出一张详尽的系统进化树,而且将显示进化过程中最主要的变化所发生的时间及特点,比如新基因的出现和全基因组的复制。

认识不同生物中基因序列的保守性,将能够使我们有效地认识约束基因及其产物的功能性的因素。对序列差异性的研究则有助于认识产生大自然多样性的基础。在不同生物体之间建立序列变异与基因表达的时空差异之间的相关性,将有助于揭示基因的网络结构。

得以进行精确的个体鉴定 基因身份证可以预测,在完成第一个人类基因组测序后,必然会出现对各人种、群体进行再测序和精细基因分型的热潮。这些资料与人类学、语言学的资料项结合,将有可能建立一个全人类的数据库资源,从而更好地了解人类的历史和自身特征。另外,基因组多样性的研究将成为疾病基因组学的主要内容之一,而群体遗传学将日益成为生物医药研究中的主流工具。需要对各种常见多因素疾病(如高血压、糖尿病和精神分裂症等)的相关基因及癌肿相关基因在基因组水平进行大规模的再测序,以识别其变异序列。

生物考古.来自哈佛医学院遗传系的Reich和来自德国人类进化马普研究所的Paabo等在Nature周刊上撰文,报告了他们对一块“类人(human-like)”指骨进行核DNA(即细胞核22对常染色体和1对性染色体中的DNA)测序的结果.这块指骨取自南西伯利亚(前苏联的一地区)的丹尼索娃洞穴(Denisova cave),约有40000年历史.根据对数据的分析,作者提出,除了尼安德特人(遗骨1856年发现于德国尼安德特河谷,约有50000年历史)与现代人的祖先发生过繁衍混合外,稍后很可能发生过丹尼索娃人与现代人祖先的繁衍混合.

今天除了在非洲,几乎所有的欧亚大陆人以及美洲人都能够通过基因组测试,找到共同的祖先(即走出非洲的那个群体).相反,今天的非洲人,由于他们的祖先分属于不同的群体,导致了基因组数据在地区间的高度离散,即基因组之间有多处相互区别的分类标记.现在的问题是:(1)我们现代人的祖先是否仅仅一次走出非洲,而后在散布到整个世界的迁徙中取代了当时存在的其他亚种群体(例如尼安德特人)?

(2)是否我们的祖先曾与其他的亚种群体(包括尼安德特人和这次基因组研究所针对的丹尼索娃人)有过生育繁衍?根据Reich-Paabo研究团队的分析,从智人到现代人的基因流经历过两个小“插曲”.第一个是在现代人的祖先刚刚离开非洲之后不久(距今5—6万年),他们中走向欧洲的一支,与当地的尼安德特人有过生育繁衍.通过比较当今欧亚大陆人和尼安德特人遗骨的基因组,研究者得出结论,当今的欧亚大陆人(但不是非洲人)继承了尼安德特人1%—4 %的基因.第二个插曲发生在距今45000年.通过比较当今美拉尼西亚(Melanesian)(在大洋洲北方的巴布亚新几内亚(Papua New Guinea))和丹尼索娃人遗骨的基因组,研究者推断,丹尼索娃人基因的4%—6 %遗传给了当今美拉尼西亚人.他们认为,现代人离开非洲之后,其中走向东亚的一支,与西伯利亚的丹尼索娃人有过生育繁衍. Reich-Paabo研究团队的此次工作是较早的丹尼索娃人指骨线粒体DNA (mt DNA)基因组研究的继续.线粒体DNA只能追寻“母亲—母亲的母亲”遗传序列.而此次核DNA测序则非常适于基因流分析,因为基因重组提供了数以万计的半独立的数据点,以此可以方便地比较当今样品和古样品之间 的遗传关系.(物理新闻和动态·新的基因组测序———理解人类起源 戴闻 编译自Nature,2010,468:1044—1045;1053—1060

1、疾病基因

人类基因组研究的一个关键应用是通过位置克隆寻找未知生物化学功能的疾病基因。(2001年我国上海和北京科学家发现遗传性乳光牙本质II型基因)

基因组序列对于揭示导致许多普通的染色体删除综合症的机制同样有帮助。在几个实例中,再发生的删除被发现,由同源体重组合在大的几乎同一的染色体内复制的不等交叉产生。例子包括在第22条染色体上的DiGeorge/ velocardiofacial综合症区和在第7条染色体上的Williams-Beuren综合症的重复删除。

基因组序列的可用性同样允许疾病基因的旁系同源性的快速识别,对于两个理由是有价值的。首先,旁系同源基因的突变可以引起相关遗传疾病。通过基因组序列使用发现的一个很好的例子是色盲(完全色盲)。CNGA3基因,编码视锥体光感受器环GMP门控通道的a亚单位,显示在一些色盲家系中存在突变体。基因组序列的计算机检索揭示了旁系同源基因编码相应的b亚单位,CNGB3(在EST数据库中没有出现)。CNGB3基因被快速认定为是其他家系的色盲的原因。另一个例子是由早衰1和早衰2基因提供的,它们的突变可能导致Alzheimer疾病的的早期发生。第二个理由是旁系同源体可以提供治疗敢于的机会,例子是在镰刀状细胞疾病或β地中海贫血的个体中试图再次激活胚胎表达的血红蛋白基因,它是由于β-球蛋白基因突变引起的。 应用RT-PCR法对75例少精不育患者(观察组)及36例健康男性(对 照组)精细胞GSTM1基因进行多态性研究。结果观察组GSTM1基因缺失率高于对照组,差异有统计学意义(P

我们在在线人类孟德尔遗传数据库(OMIM)和SwissProt 或TrEMBL蛋白质数据库中进行了971个已知的人类疾病基因的旁系同源体的系统检索。我们识别了286个潜在的旁系同源体(要求是至少50个氨基酸的匹配,在相同的染色体上一致性大于70%但小于90%,在不同的染色体上小于95%)。尽管这种分析也许识别一些假基因,89%的匹配显示在新靶序列一个外显子以上的同源性,意味着许多是有功能的。这种分析显示了在计算机中快速识别疾病基因的潜能。

2、药物靶

在过去的世纪里,制药产业很大程度上依赖于有限的药物靶来开发新的治疗手段。最近的纲要列举了483个药物靶被看作是解决了市场上的所有药物。知道了人类的全部基因和蛋白质将极大的扩展合适药物靶的寻找。虽然,仅仅人类的小部分基因可以作为药物靶,可以预测这个数目将在几千之上,这个前景将导致基因组研究在药物研究和开发中的大规模开展。一些例子可以说明这一点:

(1)神经递质(5-HT)通过化学门控通道介导快速兴奋响应。以前识别的5-HT3A受体基因产生功能受体,但是比在活体内有小得多的电导。交叉杂交实验和EST分析在揭示已知受体的其他同源体上都失败了。然而,最近,通过对人类基因组序列草图的低要求检索,一个推定的同源体被识别,在一个PAC克隆中第11号染色体长臂上。同源体显示在纹状体、尾状核、海马中表达,全长cDNA随后得到。这个编码胺受体地基因,被命名为5-HT3B。当与5-HT3A组合成异二聚体中,它显示负责大电导神经胺通道。假定胺途径在精神疾病和精神分裂症的中心作用,一个主要的新的治疗靶的发现是相当有兴趣的。

(2)半胱氨酰基白三烯的收缩和炎症作用,先前认为是过敏反应的慢反映物质(SRS-A),通过特定的受体介导。第二个类似的受体,CysLT2,使用老鼠EST和人类基因组序列的重组得到识别。这导致了与先前识别的唯一的其它受体有38%氨基酸一致性的基因的克隆。这个新的受体,显示高的亲和力和几个白三烯的结合,映射在与过敏性哮喘有关的第13号染色体区域上。这个基因在气道平滑肌和心脏中表达。作为白三烯途径中抗哮喘药物开发中一个重要的靶,新受体的发现有明显的重要的作用。

(3) Alzheimer疾病在老年斑中有丰富的β-淀粉样物沉积。β-淀粉样物由前体蛋白(APP)蛋白水解生成。有一个酶是β位 APP裂开酶,是跨膜天冬氨酸蛋白酶。公共的人类基因组草图序列计算机搜索最近识别了BACE的一个新的同源序列,编码一个蛋白,命名为BACE2,它与BACE有52%的氨基酸序列一致性。包含两个激活蛋白酶位点和象APP一样,映射到第21条染色体的必须Down综合症区域。 它提出了问题,BACE2和APP过多的拷贝是否有功于加速Down综合症病人的脑部β-淀粉样物沉积。

给出了这些例子,我们在基因组序列中进行系统的识别传统药靶蛋白质的旁系同源体。使用的靶列表在SwissPrott数据库中识别了603个入口,有唯一的访问码。

3、基础生物学

人体基因组图谱是全人类的财产,这一研究成果理应为全人类所分享、造福全人类,这是参与人类基因组工程计划的各国科学家的共识。

找到了一批主宰人体疾病的重要基因

如:肥胖基因、支气管哮喘基因。这类基因的新发现每年都有新报道。这些基因的发现,增进了人们对许多重要疾病机理的理解,并且推动整个医学思想更快的从重治疗转向重预防。 例如:湖南医科大学夏家辉教授组于1998.5.28发表克隆了人类神经性高频性耳聋的致病基因(GJB3),这是第一次在中国克隆的基因。

人类基因组计划

摘要:综述了人类基因组计划的主要研究内容、研究历程和成果、人类基因组计划的研究对人类社会的意义以及我国人类基因组研究的概况等。

关键词:人类基因组计划 研究进展 成果 后基因组学

人类基因组计划(human genome project, HGP)是由美国科学家于1985年率先提出,1986年,诺贝尔奖得主杜尔贝科(Renato Dulbecco)在《科学》周刊撰文回顾肿瘤研究的进展,指出要么依旧采用“零敲碎打”的策略,要么从整体上研究和分析人类基因组。[1.Dulbecco R. Aturning poin tincancer research:sequencing the human genume[J].Science,1986,231: 1055—1056.]1990年10月,美国政府正式启动了HGP工程,投资30亿美元,预期于2005年完成人类基因组约30亿个碱基对的全序列测定。美国、英国、法兰西共和国、德意志联邦共和国、日本国和中国科学家共同参与了这一价值达30亿美元的人类基因组计划,6国科学家组成的国际人类基因组中心主要研究比例如表1。这一计划旨在为30多亿个碱基对构成的人类基因组精确测序,发现所有人类基因并搞清其在染色体上的位置,破译人类全部遗传信息。与曼哈顿计划和阿波罗计划并称为三大科学计划。

表1 六国科学家组成的国际人类基因组中心主要研究比例:

总之,HGP的主要任务是人类的DNA测序,主要包括四张谱图:遗传图谱(genetic map)、物理图谱(physical map)、序列图谱、基因图谱,此外还有测序技术、人类基因组序列变异、功能基因组技术、比较基因组学、社会、法律、伦理研究、生物信息学和计算生物学、教育培训等目的。

1.1 遗传图谱(genetic map)

又称连锁图谱(linkage map),它是以具有遗传多态性(在一个遗传位点上具有一个以上的等位基因,在群体中的出现频率皆高于1%)的遗传标记为“路标”,以遗传学距离(在减数分裂事件中两个位点之间进行交换、重组的百分率,1%的重组率称为1cM)为图距的基因组图。遗传图谱的建立为

基因识别和完成基因定位创造了条件。意义:6000多个遗传标记已经能够把人的基因组分成6000多个区域,使得连锁分析法可以找到某一致病的或表现型的基因与某一标记邻近(紧密连锁)的证据,这样可把这一基因定位于这一已知区域,再对基因进行分离和研究。对于疾病而言,找基因和分析基因是个关键。

1.2 物理图谱(physical map)

物理图谱是指有关构成基因组的全部基因的排列和间距的信息,它是通过对构成基因组的DNA分子进行测定而绘制的。绘制物理图谱的目的是把有关基因的遗传信息及其在每条染色体上的相对位置线性而系统地排列出来。DNA物理图谱是指DNA链的限制性酶切片段的排列顺序,即酶切片段在DNA链上的定位。因限制性内切酶在DNA链上的切口是以特异序列为基础的,核苷酸序列不同的DNA,经酶切后就会产生不同长度的DNA片段,由此而构成独特的酶切图谱。因此,DNA物理图谱是DNA分子结构的特征之一。DNA是很大的分子,由限制酶产生的用于测序反应的DNA片段只是其中的极小部分,这些片段在DNA链中所处的位置关系是应该首先解决的问题,故DNA物理图谱是顺序测定的基础,也可理解为指导DNA测序的蓝图。广义地说,DNA测序从物理图谱制作开始,它是测序工作的第一步。制作DNA物理图谱的方法有多种,这里选择一种常用的简便方法──标记片段的部分酶解法,来说明图谱制作原理。

1.3 序列图谱

随着遗传图谱和物理图谱的完成,测序就成为重中之重的工作。DNA序列分析技术是一个包括制备DNA片段化及碱基分析、DNA信息翻译的多阶段的过程。通过测序得到基因组的序列图谱。

大规模测序基本策略:①逐个克隆法:对连续克隆系中排定的BAC克隆逐个进行亚克隆测序并进行组装(公共领域测序计划)。②全基因组鸟枪法:在一定作图信息基础上,绕过大片段连续克隆系的构建而直接将基因组分解成小片段随机测序,利用超级计算机进行组装(美国Celera公司)。

1.4 基因图谱

基因图谱是在识别基因组所包含的蛋白质编码序列的基础上绘制的结合有关基因序列、位置及表达模式等信息的图谱。在人类基因组中鉴别出占具2%~5%长度的全部基因的位置、结构与功能,最主要的方法是通过基因的表达产物mRNA反追到染色体的位置。

基因图谱的意义在于它能有效地反应在正常或受控条件中表达的全基因的时空图。通过这张图可以了解某一基因在不同时间不同组织、不同水平的表达;也可以了解一种组织中不同时间、不同基因中不同水平的表达,还可以了解某一特定时间、不同组织中的不同基因不同水平的表达。

1.5 基因的鉴定和分析

通过基因的表现型来鉴定基因是最有效的手段之一。至今为止,已克隆了大约1000多个人类基因。这些技术主要包括以下几类:

1、定位克隆(positional cloning):例如ob基因和Huntington舞蹈症的基因

(1)、通过疾病家系,进行染色体缺失或平衡易位以及连锁分析将结果转化为物理信息,在染色体上进行物理定位。

(2)、利用邻近的DNA标记,构建contig。

(3)、编码序列的筛选 可采用cDNA文库直接筛选的方法或外显子捕获(exon trapping)。

(4)、疾病基因的鉴定 分析基因突变和缺失以及突变的规律。最后,可用基因敲除(knock-out)技术来验证基因的功能。

2、候选克隆(candidate cloing):包括定位候选克隆和功能候选克隆

(1)、定位候选克隆:指疾病基因以连锁分析或染色体分析定位后,再从基因组资料库(GDB)中检索邻近区域中所有已知的基因包括已证明与疾病有关的或尚未建立关系的基因、已知的EST,参考已知的模式生物对应的同源序列上的已知EST用它们来直接进行致病突变的筛选。

(2)、功能候选克隆:根据致病基因的功能,从GDB或基因库(GenBank)中寻找功能相近的基因,用于致病的改变。这些方法充分利用了HGP的成果,可起到事半功倍的效果。如用该法发现了神经退行性疾病--DRPLA症基因。还发现了亨廷顿舞蹈病、遗传性结肠癌和乳腺癌等一大批单基因遗传病致病基因【4.人类基因组计划的现状[ EB/OL ]. http: / /www. bioon. com /A rticle /molecu lar/168175 _ 2.shtm,l 2005- 01- 04.】,为这些疾病的基因诊断和基因治疗奠定了基础。通过利用此法的全基因组关联分析发现了人类9号染色体9p21.3区域和冠心病显著相关,而该区域在既往的研究中较少关通过全基因组关联分析发现了人类9号染色体9p21.3区域和冠心病显著相关,而该区域在既往的研究中较少关【5. Wellcome Trust Case Control Consortium.Genome—wide association studv of 14,000 cases of seven common diseases and 3,000 shared controls[J].Nature,2oo7,447(7145):661-678

6.McPhemon R,Pertsemlidis A,Kavaslar N,et a1.A common allele on chromo.some 9 associated with coronary heart disease[J]Science,2007,316(5830):l488.】491.

7.Helgadottir A,Thorleifsson G,Manolescu A.et a1.A common variant on chromo—some 9p21 affects the risk of myocardial infarction[J]Science,2007,316(5830):1491·1493.】。该区域尤其是rs1333049SNP多态性和冠心病明确相关【8.Farzaneh-Far R,Na B,Schiller NB,et al Lack of association of chromosome

9p21.3 genotype with cardiovascular structure and function in persons with stg—ble comnary anery disease:The Heart and Soul Study[J].Atherosclerosis,2008.205(2):492-496.

9.Summaries for patients.Does measuring genetic variations at chromosome 9p21.3 help to predict cardiovascular disease in women[J]?Ann InternMed,2009.150(2):I-36.

10.Sjorck HM,Lanne T,Alehagen U,et a1.Association of genetic variation on chromosome 9p21.3 and arterial stiffness[J].J Intern Med,2009,265(3):373.381.

11.Rodriguez-Menocal L,Pham SM,Mateu D,et a1.Aging increases pl6 Ink4a ex—pression in vascular smooth muscle cels[J].Biosci Rep,2009,30(1):11-18.

12.Schunkert H,Gotz A,Braund P,et a1.Repeated replication and a prospective lneta—analysis of the association between chromosome 9p21.3 and coronary ar_tery disease[J].Circulation,2008,117(13):1675-1684.

13.Paynter NP,Chasman DI,Buring JE,et al Cardiovascular disease risk predic—tion with and without knowledge of genetic variation at chromosome 9p21.3[J].Ann Intern Med,2009,150(2):65-72.

14.Zhou L,Zbaug X,He M,et a1.Associations between single nucleotide polymorphisms on chrmnosome 9p21 and risk of coronary heart disease in Chinese Han population[J].Arterioscler Thromb Vasc Biol,2008,28(11):2085-2089.】 3、功能克隆 (functional cloning):如镰刀状贫血基因的发现就是利用此法

最早采用的基因克隆策略。生化缺陷可能与某一类蛋白的功能缺陷有关,从相关的蛋白质氨基酸序列资料,可推测其mRNA序列,设计特异的寡核苷酸探针杂交而筛选cDNA文库,从而获得全基因cDNA。镰刀状贫血病基因的发现是功能克隆的例子。若可获得纯的蛋白质或有这些蛋白质的抗体,这种方法仍为克隆基因的首选策略。

2.人类基因组计划研究历程与成果

1990年10月,美国首先正式启动“人类基因组计划”(HGP).

1992年, 美国和法国的两支研究队伍分别完成了人类Y染色体和第21条染色体的第一张物理图谱;随后又分别完成了鼠和人的遗传图谱。

1993年, 位于英国剑桥的Sanger中心加入人类基因组计划,并成为一个重要的测序中心。美国对这一计划做了修订,其中最重要的任务就是人类基因组的基因图构建与序列分析,需最优先考虑、必须保质保量完成的是DNA序列图.随后,英国、法国、日本、加拿大、前苏联、中国等许多国家积极响应,都开始了不同规模、各有特色的人类基因组研究[[15] Timeline A. History of the Human Genome

Project[J].Science,2001,291: 1195—1203. ].

1994年, 美国与法国完成了人类基因组中的第一个完整遗传连接图谱。

1996年3月, Nature发表了法国、加拿大合作获得的完全由5 264个微卫星(AC/TG)n标记组成、遗传距离(分辨率)平均为1·6 cM (cM即厘摩,相当于1%的重组频率)的人类最新的遗传连锁图[16.Dib C, Faure S, Flzames C, et al. Acomprehensive gene to map of the human genome base don 5264 micros ate llites

[J].Nature,1996.380: 152—154.] 而包含15 086个STS标志、分辨率达199 kb的人类基因组物理图谱也在1996年建立[[17] Schuler G D, Boguski M S, Stewart E A. Age nemap of the human genome [J].Science,1996, 274: 540—546.]同年, 各国科学家聚集在百慕大群岛,讨论并通过了充分体现HGP精神(全球共有,国际合作,即时公布,免费共享)的百慕大原则。

到1997年,已完成或正在进行约330 Mb的人类染色体区域的测序,占总基因组的11%左右[[18] Spenger, SylviaL. Abstracts of the third international workshop on human chromo some mapping [ J ].Cytogenet Cell Genet,1997.78:236—239. [19] Alla L, Galleron N, Sorokin A, et al. Sequencing and function alannotation of the bacillus subtilis genes in the 200 kbrrnB-dna Bregion[J].Microbiology,1997,143(11): 3431—3441.]. cDNA的序列分析工作进展也很快, 1997年数据库中的EST数目已达719 076个.另外,已识别出与人类疾病相关的基因200个左右.就模式生物来看,到1997年,已完成了141种病毒、2种真菌和酿酒酵母的测序工作;小鼠的高密度遗传图谱已绘制完毕; 1997年10月,中国科学院国家基因研究中心发表了覆盖率约达92%的水稻基因组第一代BAC指纹物理图[[20] 安海谦,卢圣栋. DNA芯片技术及其应用[J].生物工程进展,1998,18(2): 37—39.]. 大肠杆菌基因组(5Mb)全部测序完成,毛细管测序仪上市。

1999年9月,中国加入HGP,承担位于人类第3号染色体短臂上3000万bp测序任务。同年12月,

第22条染色体破译,人类首次成功地完成人体染色体基因完整序列的测定.

2000年4月,中国完成1%测序任务,所有指标均达到国际人类基因组计划协作组对“完成图”的要求。精确度99.99%,发现142个基因,其中80个为预测基因。2000年6月26日, 六国科学家公布人类基因组工作框架图,成为人类基因组计划进展的一个重要里程碑.

2001年2月12日,人类基因组图谱及初步分析结果首次公布. 他们的题为《人类基因组的初步测定和分析》的学术论文发表在2月15日的美国《自然》杂志上,这是人类首次全面介绍人类基因组框架图的“基本信息”。2001年9月,HGP第十次战略大会在杭州召开,还有1% 的难测序列,约700个疑难点。

2002年英美日加拿大尼日利亚中国制定人类基因组单体型图计划。

2003年4月15日,美、英、德、日、法、中6个国家共同宣布人类基因组序列图完成,人类基因组计划的所有目标全部实现,提前2年实现了目标。[ [ 21] 骆建新,郑崛村,马用信,等.人类基因组计划与后基因组时代[J].中国生物工程杂志,2003,23(11): 87—94.]

2004年10月,人类基因组完成图公布。

2005年3月,人类X染色体测序工作基本完成,并公布了该染色体基因草图。2005年10.26六国在《自然》杂志发表报告宣布人类基因组单体型图计划第一期工作已经完成。

2006年5月18日美国和英国科学家在英国《自然》杂志网络版上发表了人类最后一个染色体——1号染色体的基因测序【22 S. G. Gregory et al., Nature, 2006, 441:315 .】在人体全部22对常染色体中,1号染色体包含基因数量最多,达3141个,是平均水平的两倍,共有超过2.23亿个碱基对,破译难度也最大。一个由150名英国和美国科学家组成的团队历时10年,才完成了1号染色体的测序工作。科学家不止一次宣布人类基因组计划完工,但推出的均不是全本,这一次杀青的“生命之书”更为精确,覆盖了人类基因组的99.99%。解读人体基因密码的“生命之书”宣告完成,历时16年的人类基因组计划书写完了最后一个章节。

2007年5月31日Watson的个人基因组图谱向全世界公开。2007年10月13日,在深圳高交会一号展馆,全球第一个中国人基因组图谱,即全球第一个黄种人基因图谱(炎黄一号)正是发布,这也是第一个亚洲人全基因序列图谱。

2010年1月,来自美国农业部、美国能源部联合基因组研究所等单位的研究人员联合在《自然》宣布,

该研究团队利用“全基因组鸟枪测序法”对大豆基因组的11亿个碱基进行测序,公布了第一张豆科植物完整基因组序列图谱。这也是目前利用全基因组鸟枪测序完成的最大植物基因组。

人类基因组草图基本信息显示:人类基因组由31.65亿bp组成,含2~3万基因,与蛋白质合成有关的基因只占2%。人类蛋白质的61%与果蝇同源,43%与线虫同源,46%与酵母同源。

人类基因组研究成果表明:

①,基因数目比想象的要少得多,人类基因组的DNA由3×10个碱基对组成,人类只有2-3万个遗传基因,编码序列不足总基因量的5%,这相当于线虫、果蝇遗传基因数的2倍,仅比老鼠多几百个遗传基因。如此少得基因数目,而能产生如此复杂的功能,说明基因组的大小和基因的数量在生命进化上可能不具有特别重大的意义,也说明人类的基因较其他生物体更‘有效’,人类某些基因的功能和控制蛋白质产生的能力与其他生物的不同。

②,人类基因组中存在“热点”和大片“荒漠”。在染色体上有基因成簇密集分布的区域,也有大片的区域只有“无用DNA”—不包含或含有极少数基因的成分。基因组上大约有1/4的区域没有基因的片段。在所有的DNA中,只有1%-1.5%DNA能编码蛋白,在人类基因组中98%以上序列都是所谓的 “无用DNA”,35.3%的基因组包含重复序列。这些重复的“无用”序列,绝不是无用的,它一定蕴含着人类基因的新功能和奥秘,包含着人类演化和差异的信息。经典分子生物学认为一个基因只能表达一种蛋白质,而人体中存在着非常复杂繁多的蛋白质,提示一个基因可以编码多种蛋白质,蛋白质比基因具有更为重要的意义。

③,平均的基因大小有27kbp;其中G+C含量偏低,仅占38%,而2号染色体中G+C的含量最多;17号、19号、22号染色体是含基因最丰富的染色体,X、4号、18号和Y染色体上相对贫瘠,而13号染色体含基因量最少。

④,目前已经发现和定位了26000多个功能基因,其中尚有42%的基因不知道功能。

⑤,人与人之间99.99%的基因密码是相同的,人与人之间的差异仅为万分之一,发现来自不同人种的人比来自同一人种的人在基因上更为相似。从而说明人类不同“种属”之间并没有本质上的区别。

⑥,男性的基因突变率是女性的两倍,而且大部分人类遗传疾病是在Y染色体上进行的。所以。可能男性在人类的遗传中起着更重要的作用。

⑦,人类基因组中大约有200多个基因是来自于插入人类祖先基因组的细菌基因。这种插入基因在无脊椎动物是很罕见的,说明是在人类进化晚期才插入我们的基因组的。可能是在我们人类的免疫防御系统建立起来前,寄生于机体中的细菌在共生过程中发生了与人类基因组的基因交换。

⑧,发现了大约一百四十万个单核苷酸多态性,并进行了精确的定位,初步确定了30多种致病基因。 ⑨,人类基因组编码的全套蛋白质(蛋白质组)比无脊椎动物编码的蛋白质组更复杂。人类和其他脊椎动物重排了已有蛋白质的结构域,形成了新的结构。也就是说人类的进化和特征不仅靠产生全新的蛋白质,更重要的是要靠重排和扩展已有的蛋白质,以实现蛋白质种类和功能的多样性。[23.贾 贞,安黎哲,徐世健.基因工程导论[M].兰州:兰州大学出版社, 2004. 189—198.] 9

3 人类基因组计划的意义

“人类基因组计划”(HGP)研究已经最终破译了人类DNA分子的全部核苷酸顺序,建立了人类遗传物质的一整套信息数据库;可以在DNA全序列阐明的基础上建立染色体的三维结构,进一步来解释扩增、插入、缺失、易位、重组等过程的分子机制;可以使医学上的5千多种遗传疾病以及恶性肿瘤、心血管疾病等、由此得到预测、预防、早期诊断和治疗; HGP作为整个生命科学发展的“突破口”,可以带动生命科学其他领域及应用生物技术的发展,并对所涉及的伦理、法律等社会科学领域也将产生巨大的影响.因此, HGP的研究不仅具有深刻的科学意义,也具有深远的社会意义. HGP对生命科学研究与生物产业发展的导向性意义,可以用规模化、序列化、信息化、产业化、医学化、人文化来归纳[24 张猛.“人类基因组计划”给我们带来什么[J].科技术语研究,2000,2(3): 41—43].

3·1 规模化

“基因组学”这一新的学科,是随着“人类基因组计划”的启动而诞生,并随着人类基因组计划的进展而发展起来的.生物学家第一次从整个基因组的规模去认识、研究1个物种或多个物种(通过比较基因组学)的全部基因,而不是大家分头1个1个去发现、研究自己“喜欢”的基因.这是基因组学与遗传学(genetics)及所有涉及基因的生物科学和其他学科的主要区别之一[25杨焕明.人类基因组计划及其意义[J].安徽科技,2003, (5): 8—10.].迄今为止,现代生物技术涉及到医疗卫生、制药工业[26郭晓华.人类基因组计划(HGP)的提出及重大意义[J].沈阳教育学院学报,2002,4(2): 114—116.]、环境改造、食品改良等与人们生产生活息息相关的许多领域.目前,人们所关注的转基因动植物(包括转基因食品)、高等动物的整体克隆、“人工器官”的活体培养、人类疾病的基因诊断和基因治疗、DNA疫苗等新技术已经对人类健康及其赖以生存的环境产生了深刻的影响. HGP的大规模运作也将推动生物技术科研与开发并肩走向操作的规模化、自动化,这无疑会使生物技术在未来经济发展中占有及其重要的位置.

3·2 序列化

生物信息的序列化,是生命科学进入21世纪划时代的里程碑,也是生命科学成熟的1个阶段性标志.只有数量化(定量)的学科才能称为科学.生物信息的序列化,提供了研究生物这样复杂的系统可比的、定量的数据,即生命科学以序列为基础,提供了使用大型计算机解读遗传信息的可能性.就人类来说,这一张序列图将与第一张解剖图一样永垂科学史册.这是21世纪的生命科学区别于以前的生物学最主要的特点.

3.3信息化

在某种意义上,序列化就是信息化.基因组学是从整体上研究1个物种的所有基因结构和功能的新科学,它将从整体上揭示生物活动规律的奥秘.人类基因组DNA序列共有30亿个碱基对,但控制人类性状的基因仅占全部序列的3%~5% (约6~10万个基因),迄今,已鉴定的人类基因约有4万个.这项工程最终可以解读人类DNA的全部核苷酸,建立人类遗传物质的一整套信息数据库,并逐步掌握生物种群所具有的全部遗传信息.在实施HGP的同时, 1993年,人类基因组多样性计划(Human genome diversity project,HGDP)又开始启动.其研究目标是通过不同种族和人群分子多态性(如微卫星多态MS、ALU序列、单核苷酸多态SNP、线粒体DNA等)的比较,分析人类起源、进化、迁徙与分子多态变化事件的相互关系;研究不同地理区域人群和种群的遗传个体差异性以及与进化的关系,为生物起源、进化的规律性探索提供证据,最终建立来自全世界人群的遗传多样性信息库.人类基因组计划的成功,是借助了同步发展的信息学和网络.同时,信息化改变了整个生命科学,改变了实验材料以及试剂(探针)的存在方式,以至于生物资源也信息化了.

3·4 产业化

“人类基因组计划”伊始,就定位在带动1个产业———生物产业. HGP研究是多学科的,它的继续研究将推进非线性(复杂性)科学、物理学、化学、数学和计算机科学的发展,更要促进生物工程学的发展[18贾 贞,安黎哲,徐世健.基因工程导论[M].兰州:兰州大学出版社, 2004. 189—198.]. HGP的实施使人类在了解致病遗传机理和发现新基因上迈出了至关重要的一步,为基因药物设计提供了重要的理论基础和设计原则.现已成功分离亨廷顿氏舞蹈症、杜氏肌营养不良、哮喘病、乳腺癌等各种癌症及糖尿病等70多种遗传病基因,必将使生物制药产业发生空前的变革.

3·5 医学化

人类基因组学是生物技术产业和健康产业的知识核心,蕴涵着无比巨大的产业化潜能和商业利益. HGP最初是作为1项治疗肿瘤等疾病的突破性计划提出的,因此,该计划一直将疾病基因的定位、克隆、鉴定作为研究核心,形成了疾病基因组学.随着基因组“工作框架图”的问世,许多致病单基因被确定为候选基因,并逐步对其结构与功能进行了分析.人类基因组计划已经把它的成果医学化,数十种基因产品,如人胰岛素、干扰素、生长激素等,已经投入工业化生产.基因预测,基因预防,基因诊断、检测和生物芯片,基因治疗,基因改良,器官复制与再生将使整个医学改观.届时,危害人类健康的5 000多种遗传病以及与遗传密切相关的癌症、心血管疾病、关节炎、糖尿病、高血压、精神病等,都可以得到早期诊断和治疗[27田 瑛.人类基因组计划研究展望[J].包头职大学报,2003, (2): 6—7.]. DNA序列差异的研究将有助于人类了解不同个体对环境易感性与疾病的抵抗力,因而DNA序列分析很有可能成为最快速、最准确,也最便宜的诊断手段之

一.随着人类基因组计划的不断推进,用不了几年,人们将看到1份描述人类自身的说明书,它是1本完整地

讲述人体构造和运转情况的指南,而现代医学则可根据每个人的“基因特点”对症下药,这即是21世纪的医学———“个体化医学”.

3·6 人文化

人类基因组计划使人类对于人性、人文、人权、平等等概念以至于社会结构都要重新讨论.它提供了重新审视人类自我的人文基础,也提供了重新认识人与人之间的关系、1个人在社会中的地位、人类与生命世界以至于在整个自然界中的位置与关系的基础.人类基因组计划告诉我们的是:基因组不应被视为1块僵硬的遗传模板,而是1个流动的、动态的结构, DNA分子恒久处在重排、插入和缺失造成的变动之中[28 Luningpraket, Kaza Zianzz, J R. Mobile element sand the human genome [ J ].Nature Reviews Genetics,2000, (1): 134—144.];物种之间的横向基因转移(HGT)不仅从远古起就持久、大量地发生,并且可能是生命进化的主要动力之一[29 Brown J R. Ancient horizontal gene transfer [ J].Nature Reviews Genetics,2003, (4): 121—132].

3.4 后基因组学

从1996年起,随着人类基因组测序计划的完成[30 Venter J C, Adams M D, Myers E W, et al. The sequence of the human genome[J].Science,2001,291(5507): 1304—1351.,31 Lander E S, Linton L M, Birren B, et al. Initial sequencing and analysis of the human genome[J].Nature,2001,409(6822): 860—921.]和后基因组时代的到来,国际上基因组、转录组、蛋白质组、代谢组乃至表型组工作的相继开展

[32 Bork P, Dandekar T, Diaz Lazcoz Y, et al.Predicting function: from genes to genomes and back

[J].J Mol Biol,1998,283(4): 707—725.],各种类型功能基因组数据的爆炸性增长,信息整合和数据挖掘的重要性显得尤为突出.有人将细胞的基因组、转录组和蛋白质组综合起来称为操纵子组(operomics)[33 Hanash S M. Operomics: molecular analysis of tissues from DNA to RNA to ptotein[J].Clin Chem Lab Med,2000,38(9): 805—813.]来研究功能,正体现了这种认识.这就是通常所说的“后基因组学”(postgenomics).“后基因组学”主要包括:

1)人类基因的识别和鉴定[34 Martienssen, Robert A. Functional genomics:probing plant gene function and expession with transposons[J].Proceedings of the National Acade my of Sciences of the United States of America,1998,95(5): 2021—2026.,35 Goffeau A, Barrell B G, Bussey H, et al. Life with 6000 genes [J].Science,1996,274: 546—567.].即采用生物信息学、计算机生物学技术和生物学实验手段以及两者相结合的方法,收集并不断扩充现有的各种数据库,研制、建立更多样化的数据库和信息处理软件.从基因的编码序列、调控序列、重复序列、保守序列、特征性序列、蛋白质序列等多角度、多方面入手,包括模式生物已得到的基因组序列,进行比较基因组学研究[36 Goffeau A, Barrell B G, Bussey H, et al. Life with 6000 genes [J].Science,1996,274: 546—567].

2)基因功能信息的提取和鉴定.即利用改进的定量PCR技术、原位杂交技术、微点阵技术[37 Lockhart

D J, Dong H, Byrne M C, et al.Expression monitoring by hybridization tohigh-densityoli go nucleotidearrays [ J ].Nature Biotechnology,1996,4: 1675.]和基因表达的连续分析方法绘制基因表达图谱,同时包括对人类基因突变体的系统鉴定.

3)蛋白质组学的研究.即蛋白质谱的建立与基因的相互作用关系的研究.蛋白质组学研究中的新方法是:采用双向凝胶电泳和测序质谱技术;建立蛋白质结构数据库,以研究其结构和功能的关系,并判断相关基因的结构与功能的关系[38舒 薇,郭 勇.人类基因组及后基因组研究进展及其应用与开发研究现状[J].生物技术通报,2000, (4): 1—5.];采用双杂交体系、三杂交体系、激酶蛋白靶和锌指蛋白的DNA靶检测技术构建基因组相互作用图;采用X射线衍射技术和核磁共振技术对晶体蛋白和水溶性蛋白进行空间构型分析,建立蛋白质结构数据库,以研究蛋白质和相关基因结构与功能的关系;采用显微定位、定量新技术和荧光原位杂交、共聚焦等新技术对蛋白质的结构与功能及其与基因的相互作用进行阐释[39 Muellner, Stefan, Thomas N, et al. Proteomics: a new way for drug target discovery [ J ].Arzneimittel—Forschung, 1998,48(1): 93—95.].科学家正对数万个蛋白质片段进行识别和分类,目的是最终绘制出一张蛋白质组图.可以预见,蛋白质组研究将导致药物开发方面的实质性突破,使得生命科学能够实现长期以来所追求的目标,

即研制出治疗诸如癌症和艾滋病等在内的各种疾病的药物.

除此之外,基因组与生命形式和生物形态进化的关系研究也将是21世纪“后基因组学”开展研究的主要问题.

4.中国人类基因组研究概况 中国自1987年开始设立人类基因组研究课题,经过各方面的努力,先后在1993年和1996年正式启动了“中华民族基因中若干位点基因结构的研究”和“重大疾病相关基因的定位、克隆、结构与功能研究”国家自然科学基金和863高科技计划课题.由于投资所限,中国的人类基因组研究不能像国外那样对全基因组或整条染色体作图和测序[40常凤滨.人类基因组计划研究的进展及其意义[J].晋中师范高等专科学校学报,2002,19(2): 107—108.],所以我国人类基因组研究目标主要是根据本国人群资源优势的特点,突出基因多样性研究和疾病基因识别.1998年,中国的HGP被确立为国家计划并在北京和上海成立了中国人类基因组北方研究中心和南方研究中心,着重收集和保存我国民族独特的基因组,研究民族间基因组的差异,分析其遗传学的意义,以及探明我国若干重要致病基因和易感基因的分布及发病机理,为基因诊断和基因治疗提供理论依据.1999年9月,中国获准加入HGP计划,成为参与其中的唯一发展中国家,负责3号染色体短臂从D3S3610至端粒区段约3 000万个碱基对(30Mb)的全序列测定,简称其为“1%测序任务”.虽参加时间较晚,但我国科学家提前2年于2001年8月26日绘制完成“中国卷”,赢得了国际科学界的高度评价.这一目标的实现,将为中国21世纪的医学和生物制药产业储备一批重要的基因,大大促进我国生物信息学、生物功能基因组及蛋白质等生命科学前沿领域的发展[18贾 贞,安黎哲,徐世健.基因工程导论[M].兰州:兰州大学出版社, 2004. 189—198.],同时将提高我国基因组科学的总体水平,为我国基因资源的开发利用开辟广阔的前景,更加体现出中国对基因组科学的贡献,从而获得与全球科学界共享人类基因组计划成果的权利[常凤滨.人类基因组计划研究的进展及其意义[J].晋中师范高等专科学校学

报,2002,19(2): 107—108.].

2003年4月,中国在现有工作基础上,加强了人类基因组的后续研究与开发,已将这项工作列入12个国家重大科技专项之一的“功能基因组与生物芯片”.超级水稻基因组计划已顺利完成,这必将对水稻研究和粮食生产产生重大影响[18贾 贞,安黎哲,徐世健.基因工程导论[M].兰州:兰州大学出版社, 2004. 189—198.].国家又投入6亿元,主要开展重大疾病、重要生理功能相关功能基因、中华民族单核苷酸多态性的开发应用,以及与人类重大疾病及重要生理功能相关的蛋白质、重要病原真菌功能基因组等的研究与开发,进一步完善我国生物技术创新体系,力争使中国在人类后基因组研究方面进入世界先进行列.

人类疾病基因研究的贡献

人类疾病相关的基因是人类基因组中结构和功能完整性至关重要的信息。对于单基因病,采用“定位克隆”和“定位候选克隆”的全新思路,导致了亨廷顿舞蹈病、遗传性结肠癌和乳腺癌等一大批单基因遗传病致病基因的发现,为这些疾病的基因诊断和基因治疗奠定了基础。对于心血管疾病、肿瘤、糖尿病、神经精神类疾病(老年性痴呆、精神分裂症)、自身免疫性疾病等多基因疾病是目前疾病基因研究的重点。非综合征性唇腭裂(nonsyndromic cleft Lip and/or palates,NSCL/P)为一种复杂的多基因遗传病,是遗传因素和环境因素综合作用的结果。随着人类基因组计划的完成,先天性唇腭裂易感基因的研究已成为该领域的研究热点。

国内研究证实TGF一8基因多态性与中国人群NCL/P的发生有相关性,与其他因素互相影响最终导致唇腭裂的发生。 【焦晓辉,王 丽,徐旭光.中

国人群非综合征性唇腭裂与TGF[33多态性的关系.哈尔滨医科大学学报,2003,37(5):415~418】3O 万伟东,王丽君,周小平,等.MTHFR基因C677T和A1298C多态与中国部分人群非综合征性唇腭裂的相关研究.中华整形外科杂志,2006,22(1);8~11.; 周小平,王海琦,万伟东,等.非综合征性唇腭裂的环境与基因多态性分析及归因危险度估算.中国优生与遗传杂志,2005,13(12):36~39.; 万伟东,王小宁,王海琦,等.环境暴露和MTHFR、TGFR等基因多态性与NSCL/P关系的探讨.中国卫生统计,2006,23(3):240~242】3l Pezzettil F,Martinelli M ,Scapoli L,et a1. Maternal MTHFR variant forms increase the risk in offspring of isolated nonsyn—dromic cleft lip with or without cleft palate.Hum Mutat,2004,24(1):104~105 ;吴平安,李运良,范国正,等.MSX1基因微卫星多态性与非综合征性唇腭裂的相关性研究.中华医学遗传学杂志,2007,24(3):325~327(2001年我国上海和北京科学家发现遗传性乳光牙本质II型基因

获取了操纵生命的工具

控制生命的孕育—优生优育 延长人的寿命 随着基因和基因组研究的进展,许多疾病在发作之前就能在分子水平上得到治疗,对人类 “衰老基因”和“长寿基因”的详细了解也将激发人类为增加自己寿命而努力。 目前,一些国家的人口平均寿命已突破80岁,中国也突破了70岁。柯林斯预测说,到2050 年,人类的平均寿命将达到90-95岁。中国工程院院士、中国医学科学院院长巴德年教授则说, 再过20年人类有望攻克癌症,心脑血管疾病可望得到有效防治,在2020-2030年间, 可能出现人 口平均寿命突破100岁的国家。

选择最佳生活环境

对医学的贡献

人类基因组计划的研究成果将带来一场医学革命。可用于基因诊断、基因治疗和基于基因组知识的治疗、基于基因组信息的疾病预防、疾病易感基因的识别、风险人群生活方式、环境因子的干预。重组人p53腺病毒药物(10 rAd/p53)对人鼻咽癌CNE细胞生长有明显抑制。结论重组人p53腺病毒药物(rAd/p53)对人鼻咽癌CNE细胞生长能有效抑制,为鼻咽癌的基因治疗提供了实验依据。【敖敏,何刚.p53基因药物抑制人鼻咽癌生长的免疫组化研究【J】四川医学,2009,3O(8):1193-1194】道Rosenberg等应用基因疗法将普通的免疫细胞转化成更有效杀死黑色素瘤的细胞,并在对恶性黑色素瘤患者的临床试验中接近治愈这一疾病。Morgan RA,Dudley ME,Wunderlich JR,Hughes MS,Yang JC.Sherry RM.et n.Cancer regression in patients after trails—fer of genetically engineered lymphocytesl J].Science,2006,10(6):126-129.

人类全基因组同步分析方法诞生

德国马普分子遗传学研究所和柏林夏洛蒂医科大学医学遗传学研究所的科学家们成功发明了一种新分析方法一一‘‘外显子组序列世系过滤法”(descent filtering of exolTle sequence),该方法可以同时分析人类基因组的所有基因.该方法首次应用于柏林一个家庭的3个孩子身上,他们惠有罕见的智力缺陷遗传病—— 马布里综合症(MabrySyndrome)研究利用高通量测序方法从整个基因组找出了22 000个基因,解码它们的序列并检查突变位点.最终,运用新的生物信息学分析方法,科学家将突变的数量限制到2个,而其中一个突变(PIGV突变)是最终导致马布里综合症发生的原因.马普分子遗传学研究所的Michal Ruth Schweiger形容这项_y-作就像“大海捞针”.PIGV基因发生了突变,导致某些蛋白质功能丧失,比如,使得碱性磷酸酶不能够与细胞膜表面结合.相关论文发表在8月29日出版的《自然 遗传学》杂志上这种新的基因组分析方法使得对极其罕见疾病中基因突变的鉴定成为可能,并向个性化的分子药物研发迈出了重要的一步

原载《科学网》,2010—09 02任春晓编译 对生物进化研究的影响:对进化过程各个阶段的生物进行系统的比较DNA测序,将揭开生命35亿年的进化史。生物的进化史,都刻写在各基因组的“天书”上;草履虫是人的亲戚——13亿年;人是由300~400万年前的一种猴子进化来的;人类第一次“走出非洲”——200万年的古猿;人类的“夏娃”来自于非洲,距今20万年——第二次“走出非洲”?这样的研究不仅能勾画出一张详尽的系统进化树,而且将显示进化过程中最主要的变化所发生的时间及特点,比如新基因的出现和全基因组的复制。

认识不同生物中基因序列的保守性,将能够使我们有效地认识约束基因及其产物的功能性的因素。对序列差异性的研究则有助于认识产生大自然多样性的基础。在不同生物体之间建立序列变异与基因表达的时空差异之间的相关性,将有助于揭示基因的网络结构。

得以进行精确的个体鉴定 基因身份证可以预测,在完成第一个人类基因组测序后,必然会出现对各人种、群体进行再测序和精细基因分型的热潮。这些资料与人类学、语言学的资料项结合,将有可能建立一个全人类的数据库资源,从而更好地了解人类的历史和自身特征。另外,基因组多样性的研究将成为疾病基因组学的主要内容之一,而群体遗传学将日益成为生物医药研究中的主流工具。需要对各种常见多因素疾病(如高血压、糖尿病和精神分裂症等)的相关基因及癌肿相关基因在基因组水平进行大规模的再测序,以识别其变异序列。

生物考古.来自哈佛医学院遗传系的Reich和来自德国人类进化马普研究所的Paabo等在Nature周刊上撰文,报告了他们对一块“类人(human-like)”指骨进行核DNA(即细胞核22对常染色体和1对性染色体中的DNA)测序的结果.这块指骨取自南西伯利亚(前苏联的一地区)的丹尼索娃洞穴(Denisova cave),约有40000年历史.根据对数据的分析,作者提出,除了尼安德特人(遗骨1856年发现于德国尼安德特河谷,约有50000年历史)与现代人的祖先发生过繁衍混合外,稍后很可能发生过丹尼索娃人与现代人祖先的繁衍混合.

今天除了在非洲,几乎所有的欧亚大陆人以及美洲人都能够通过基因组测试,找到共同的祖先(即走出非洲的那个群体).相反,今天的非洲人,由于他们的祖先分属于不同的群体,导致了基因组数据在地区间的高度离散,即基因组之间有多处相互区别的分类标记.现在的问题是:(1)我们现代人的祖先是否仅仅一次走出非洲,而后在散布到整个世界的迁徙中取代了当时存在的其他亚种群体(例如尼安德特人)?

(2)是否我们的祖先曾与其他的亚种群体(包括尼安德特人和这次基因组研究所针对的丹尼索娃人)有过生育繁衍?根据Reich-Paabo研究团队的分析,从智人到现代人的基因流经历过两个小“插曲”.第一个是在现代人的祖先刚刚离开非洲之后不久(距今5—6万年),他们中走向欧洲的一支,与当地的尼安德特人有过生育繁衍.通过比较当今欧亚大陆人和尼安德特人遗骨的基因组,研究者得出结论,当今的欧亚大陆人(但不是非洲人)继承了尼安德特人1%—4 %的基因.第二个插曲发生在距今45000年.通过比较当今美拉尼西亚(Melanesian)(在大洋洲北方的巴布亚新几内亚(Papua New Guinea))和丹尼索娃人遗骨的基因组,研究者推断,丹尼索娃人基因的4%—6 %遗传给了当今美拉尼西亚人.他们认为,现代人离开非洲之后,其中走向东亚的一支,与西伯利亚的丹尼索娃人有过生育繁衍. Reich-Paabo研究团队的此次工作是较早的丹尼索娃人指骨线粒体DNA (mt DNA)基因组研究的继续.线粒体DNA只能追寻“母亲—母亲的母亲”遗传序列.而此次核DNA测序则非常适于基因流分析,因为基因重组提供了数以万计的半独立的数据点,以此可以方便地比较当今样品和古样品之间 的遗传关系.(物理新闻和动态·新的基因组测序———理解人类起源 戴闻 编译自Nature,2010,468:1044—1045;1053—1060

1、疾病基因

人类基因组研究的一个关键应用是通过位置克隆寻找未知生物化学功能的疾病基因。(2001年我国上海和北京科学家发现遗传性乳光牙本质II型基因)

基因组序列对于揭示导致许多普通的染色体删除综合症的机制同样有帮助。在几个实例中,再发生的删除被发现,由同源体重组合在大的几乎同一的染色体内复制的不等交叉产生。例子包括在第22条染色体上的DiGeorge/ velocardiofacial综合症区和在第7条染色体上的Williams-Beuren综合症的重复删除。

基因组序列的可用性同样允许疾病基因的旁系同源性的快速识别,对于两个理由是有价值的。首先,旁系同源基因的突变可以引起相关遗传疾病。通过基因组序列使用发现的一个很好的例子是色盲(完全色盲)。CNGA3基因,编码视锥体光感受器环GMP门控通道的a亚单位,显示在一些色盲家系中存在突变体。基因组序列的计算机检索揭示了旁系同源基因编码相应的b亚单位,CNGB3(在EST数据库中没有出现)。CNGB3基因被快速认定为是其他家系的色盲的原因。另一个例子是由早衰1和早衰2基因提供的,它们的突变可能导致Alzheimer疾病的的早期发生。第二个理由是旁系同源体可以提供治疗敢于的机会,例子是在镰刀状细胞疾病或β地中海贫血的个体中试图再次激活胚胎表达的血红蛋白基因,它是由于β-球蛋白基因突变引起的。 应用RT-PCR法对75例少精不育患者(观察组)及36例健康男性(对 照组)精细胞GSTM1基因进行多态性研究。结果观察组GSTM1基因缺失率高于对照组,差异有统计学意义(P

我们在在线人类孟德尔遗传数据库(OMIM)和SwissProt 或TrEMBL蛋白质数据库中进行了971个已知的人类疾病基因的旁系同源体的系统检索。我们识别了286个潜在的旁系同源体(要求是至少50个氨基酸的匹配,在相同的染色体上一致性大于70%但小于90%,在不同的染色体上小于95%)。尽管这种分析也许识别一些假基因,89%的匹配显示在新靶序列一个外显子以上的同源性,意味着许多是有功能的。这种分析显示了在计算机中快速识别疾病基因的潜能。

2、药物靶

在过去的世纪里,制药产业很大程度上依赖于有限的药物靶来开发新的治疗手段。最近的纲要列举了483个药物靶被看作是解决了市场上的所有药物。知道了人类的全部基因和蛋白质将极大的扩展合适药物靶的寻找。虽然,仅仅人类的小部分基因可以作为药物靶,可以预测这个数目将在几千之上,这个前景将导致基因组研究在药物研究和开发中的大规模开展。一些例子可以说明这一点:

(1)神经递质(5-HT)通过化学门控通道介导快速兴奋响应。以前识别的5-HT3A受体基因产生功能受体,但是比在活体内有小得多的电导。交叉杂交实验和EST分析在揭示已知受体的其他同源体上都失败了。然而,最近,通过对人类基因组序列草图的低要求检索,一个推定的同源体被识别,在一个PAC克隆中第11号染色体长臂上。同源体显示在纹状体、尾状核、海马中表达,全长cDNA随后得到。这个编码胺受体地基因,被命名为5-HT3B。当与5-HT3A组合成异二聚体中,它显示负责大电导神经胺通道。假定胺途径在精神疾病和精神分裂症的中心作用,一个主要的新的治疗靶的发现是相当有兴趣的。

(2)半胱氨酰基白三烯的收缩和炎症作用,先前认为是过敏反应的慢反映物质(SRS-A),通过特定的受体介导。第二个类似的受体,CysLT2,使用老鼠EST和人类基因组序列的重组得到识别。这导致了与先前识别的唯一的其它受体有38%氨基酸一致性的基因的克隆。这个新的受体,显示高的亲和力和几个白三烯的结合,映射在与过敏性哮喘有关的第13号染色体区域上。这个基因在气道平滑肌和心脏中表达。作为白三烯途径中抗哮喘药物开发中一个重要的靶,新受体的发现有明显的重要的作用。

(3) Alzheimer疾病在老年斑中有丰富的β-淀粉样物沉积。β-淀粉样物由前体蛋白(APP)蛋白水解生成。有一个酶是β位 APP裂开酶,是跨膜天冬氨酸蛋白酶。公共的人类基因组草图序列计算机搜索最近识别了BACE的一个新的同源序列,编码一个蛋白,命名为BACE2,它与BACE有52%的氨基酸序列一致性。包含两个激活蛋白酶位点和象APP一样,映射到第21条染色体的必须Down综合症区域。 它提出了问题,BACE2和APP过多的拷贝是否有功于加速Down综合症病人的脑部β-淀粉样物沉积。

给出了这些例子,我们在基因组序列中进行系统的识别传统药靶蛋白质的旁系同源体。使用的靶列表在SwissPrott数据库中识别了603个入口,有唯一的访问码。

3、基础生物学

人体基因组图谱是全人类的财产,这一研究成果理应为全人类所分享、造福全人类,这是参与人类基因组工程计划的各国科学家的共识。

找到了一批主宰人体疾病的重要基因

如:肥胖基因、支气管哮喘基因。这类基因的新发现每年都有新报道。这些基因的发现,增进了人们对许多重要疾病机理的理解,并且推动整个医学思想更快的从重治疗转向重预防。 例如:湖南医科大学夏家辉教授组于1998.5.28发表克隆了人类神经性高频性耳聋的致病基因(GJB3),这是第一次在中国克隆的基因。


相关内容

  • 基因工程药物的研究进展及其应用前景.doc
  • 基因工程药物研究与应用新进展 郭小周 生物技术药物(biotech drugs)或称生物药物(biopharmaceutics)是集生物学.医学.药学的先进技术为一体,以组合化学.药学基因(功能抗原学.生物信息学等高技术为依托,以分子遗传学.分子生物.生物物理等基础学科的突破为后盾形成的产业.现在, ...

  • 科技万有瘾力50期:可控核聚变
  • 2013-10-14 22:15:45,  科技万有瘾力 - [一日不掌握可控核聚变,"能源枯竭"这柄达摩克利斯之剑就一日人类在头顶高悬.上周,美国的核聚变实验装置首次实现释放能量大于消耗的燃料,可控核聚变距离现实又近一小步.本期<科技万有瘾力>将聊聊这个话题,并跟踪 ...

  • 转基因食品大量进入中国.doc
  • 转基因食品大量进入中国 2012-12-15 02:38:09 分享到: 据专家估计,截至目前进入中国人食物链的转基因食品起码超过了2000万吨.但这些原料到底制成了多少食品进了老百姓的肚子,却没有人能说得清. 新纪元周刊报导,中国社科院农村发展研究所研究员李国祥告诉<南方日报>记者.& ...

  • 遗传学综述.doc
  • 遗传学综述 摘要: 遗传学是一门探索生命起源和生物进化机理的理论学科.同时紧密联系生产实际的基础学科,是指导植物.动物和微生物育种工作的理论基础而且与医学和人民保健有着密切的联系.1910年进入现代遗传学阶段,并依次经历个体遗传学时期.细胞遗传学时期.数量遗传学和群体遗传学时期.细胞水平向分子水平过 ...

  • [第1节形形色色的生物]教案1.doc
  • <第1节 形形色色的生物>教学设计 第一课时 教学目标 1.知识: (1)概述生物圈的范围: (2)举例说明生物的多样性. 2.能力: (1)尝试运用统计.处理数据的能力和分析资料的方法: (2)通过讨论.交流,提高语言文字表达能力和信息交流能力. 3.情感态度与价值观: (1)生物圈是 ...

  • 生物化学在食品中的应用与展望.doc作业
  • 生物化学在食品中的应用与展望 张汝凡 2011级 食安(2)班 1104054206 摘要:在日常生活中,馒头时放些苏打,馒头会蒸的又大又白又好吃:各种饮用酒,经粮食等原料发生一系列化学变化制得:槟榔是少数民族喜爱的食物,在食用前,槟榔必须浸泡在熟石灰中,切成小,到一定时间后,才可食用:水是生命之源 ...

  • 人间传染的病原微生物名录
  • 人间传染的病原微生物名录 中华人民共和国卫生部制定 二○○六年一月十一日 表1. 病毒分类名录 11 12 13 14 15 16 17 18 附录:Prion 19 20 注:BSL-n/ABSL-n:不同生物安全级别的实验室/动物实验室. a. 病毒培养:指病毒的分离.培养.滴定.中和试验.活病 ...

  • 人间传染的病原微生物名录2006年
  • 人间传染的病原微生物名录 中华人民共和国卫生部制定 二○○六年一月十一日 表1. 病毒分类名录 附录:Prion 注:BSL-n/ABSL-n:不同生物安全级别的实验室/动物实验室. a. 病毒培养:指病毒的分离.培养.滴定.中和试验.活病毒及其蛋白纯化.病毒冻干以及产生活病毒的重组试验等操作.利用 ...

  • (新)史上最恶毒骂人的话(DOC)
  • 史上最恶毒骂人的话(DOC) 史上最恶毒骂人的话 你这个不忠不孝不仁不义无礼少德短命缺心眼的窝囊废真是该死,该骂,该打,该杀,就是欠损,欠啐,欠X ,欠教育~~进化不完全的生命体,基因突变的外星人,幼稚园程度的高中生,先天蒙古症的青蛙头,圣母峰雪人的弃婴,化粪池堵塞的凶手,非洲人搞上黑猪的後裔,阴阳 ...