人類基因組計畫
簡介
人類基因組計畫(human genome project, HGP)是由美國科學家于1985年率先提出,於1990年正式啟動的。
美國、英國、法蘭西共和國、德意志聯邦共和國、日本和我國科學家共同參與了這一價值達30億美元的人類基因組計畫。
這一計畫旨在為30多億個堿基對構成的人類基因組精確測序,發現所有人類基因並搞清其在染色體上的位置,
破譯人類全部遺傳信息。與曼哈頓原子彈計畫和阿波羅計畫並稱為三大科學計畫。
1986年,諾貝爾獎獲得者Renato Dulbecco發表短文《腫瘤研究的轉捩點:
人類基因組測序》(Science, 231: 1055-1056)。
文中指出:如果我們想更多地瞭解腫瘤,我們從現在起必須關注細胞的基因組。…… 從哪個物種著手努力?
如果我們想理解人類腫瘤,那就應從人類開始。……人類腫瘤研究將因對DNA的詳細知識而得到巨大推動。”
什麼是基因組(Genome)?基因組就是一個物種中所有基因的整體組成。
人類基因組有兩層意義:遺傳信息和遺傳物質。要揭開生命的奧秘,就需要從整體水準研究基因的存在、
基因的結構與功能、基因之間的相互關係。
為什麼選擇人類的基因組進行研究?
因為人類是在“進化”歷程上最高級的生物,對它的研究有助於認識自身、掌握生老病死規律、疾病的診斷和治療、瞭解生命的起源。
在人類基因組計畫中,還包括對五種生物基因組的研究:
大腸桿菌、酵母、線蟲、果蠅和小鼠,稱之為人類的五種“模式生物”。
HGP的目的是解碼生命、瞭解生命的起源、瞭解生命體生長發育的規律、認識種屬之間和個體之間存在差異的起因、
認識疾病產生的機制以及長壽與衰老等生命現象、為疾病的診治提供科學依據。
HGP的誕生和啟動
對人類基因組的研究在70年代已具有一定的雛形,在80年代在許多國家已形成一定規模。
1984年在Utah州的Alta,White R and Mendelsonhn M受美國能源部(DOE)的委託主持召開了一個小型專業會議討論
測定人類整個基因組的DNA序列的意義和前景(Cook Deegan RM,1989)……..
1985年5月在加州Santa Cruz由美國DOE的Sinsheimer RL主持的會議上提出了測定人類基因組全序列的動議,
形成了美國能源部的“人類基因組計畫”草案。……..
人類基因組計畫(Human genome project)由美國於1987年啟動,中共於1993年加入該計畫,承擔其中1%的任務,
即人類3號染色體短臂上約30Mb的測序任務。
2000年6月28日人類基因組工作草圖完成。由於人類基因測序和基因專利可能會帶來巨大的商業價值,
各國政府和一些企業都在積極地投入該項研究。
如1997年AMGE公司轉讓了一個與中樞神經疾病有關的基因而獲利3.92億美元。…

HGP的研究內容
HGP的主要任務是人類的DNA測序,包括下圖所示的四張譜圖,此外還有測序技術、人類基因組序列變異、
功能基因組技術、比較基因組學、社會、法律、倫理研究、生物資訊學和計算生物學、教育培訓等目的。
1、遺傳圖譜(genetic map)
又稱連鎖圖譜(linkage map),它是以具有遺傳多態性(在一個遺傳位點上具有一個以上的等位基因,
在群體中的出現頻率皆高於1%)的遺傳標記為“路標”,以遺傳學距離(在減數分裂事件中兩個位點之間進行交換、
重組的百分率,1%的重組率稱為1cM)為圖距的基因組圖。遺傳圖譜的建立為基因識別和完成基因定位創造了條件。
意義:6000多個遺傳標記已經能夠把人的基因組分成6000多個區域,
使得連鎖分析法可以找到某一致病的或表現型的基因與某一標記鄰近(緊密連鎖)的證據,
這樣可把這一基因定位於這一已知區域,再對基因進行分離和研究。
對於疾病而言,找基因和分析基因是個關鍵。

2、物理圖譜(physical map)
物理圖譜是指有關構成基因組的全部基因的排列和間距的資訊,它是通過對構成基因組的DNA分子進行測定而繪製的。
繪製物理圖譜的目的是把有關基因的遺傳信息及其在每條染色體上的相對位置線性而系統地排列出來。
DNA物理圖譜是指DNA鏈的限制性酶切片段的排列順序,即酶切片段在DNA鏈上的定位。
因限制性內切酶在DNA鏈上的切口是以特異序列為基礎的,核苷酸序列不同的DNA,
經酶切後就會產生不同長度的DNA片段,由此而構成獨特的酶切圖譜。
因此,DNA物理圖譜是DNA分子結構的特徵之一。
DNA是很大的分子,由限制酶產生的用於測序反應的DNA片段只是其中的極小部分,
這些片段在DNA鏈中所處的位置關係是應該首先解決的問題,
故DNA物理圖譜是順序測定的基礎,也可理解為指導DNA測序的藍圖。
3、序列圖譜
隨著遺傳圖譜和物理圖譜的完成,測序就成為重中之重的工作。
DNA序列分析技術是一個包括製備DNA片段化及堿基分析、DNA資訊翻譯的多階段的過程。
通過測序得到基因組的序列圖譜。
4、基因圖譜
基因圖譜是在識別基因組所包含的蛋白質編碼序列的基礎上繪製的結合有關基因序列、
位置及表達模式等資訊的圖譜。在人類基因組中鑒別出占具2%~5%長度的全部基因的位置、
結構與功能,最主要的方法是通過基因的表達產物mRNA反追到染色體的位置。

基因圖譜的意義:在於它能有效地反應在正常或受控條件中表達的全基因的時空圖。
通過這張圖可以瞭解某一基因在不同時間不同組織、不同水準的表達;
也可以瞭解一種組織中不同時間、不同基因中不同水準的表達,
還可以瞭解某一特定時間、不同組織中的不同基因不同水準的表達。
人類基因組是一個國際合作專案:表徵人類基因組,選擇的模式生物的DNA測序和作圖,
發展基因組研究的新技術,完善人類基因組研究涉及的倫理、法律和社會問題,
培訓能利用HGP發展起來的這些技術和資源進行生物學研究的科學家,促進人類健康。

HGP對人類的重要意義。
1、HGP對人類疾病基因研究的貢獻
人類疾病相關的基因是人類基因組中結構和功能完整性至關重要的資訊。
對於單基因病,採用“定位克隆”和“定位候選克隆”的全新思路,導致了亨廷頓舞蹈病、
遺傳性結腸癌和乳腺癌等一大批單基因遺傳病致病基因的發現,為這些疾病的基因診斷和基因治療奠定了基礎。
對於心血管疾病、腫瘤、糖尿病、神經精神類疾病(老年性癡呆、精神分裂症)、
自身免疫性疾病等多基因疾病是目前疾病基因研究的重點。
健康相關研究是HGP的重要組成部分,1997年相繼提出:“腫瘤基因組解剖計畫”“環境基因組學計畫”。
2、HGP對醫學的貢獻
基因診斷、基因治療和基於基因組知識的治療、基於基因組資訊的疾病預防、疾病易感基因的識別、
風險人群生活方式、環境因數的干預。
3、HGP對生物技術的貢獻
(1)基因工程藥物:分泌蛋白(多肽激素,生長因數,趨化因數,凝血和抗凝血因數等)及其受體。
(2)診斷和研究試劑產業:基因和抗體試劑盒、診斷和研究用生物晶片、疾病和篩藥模型。
(3)對細胞、胚胎、組織工程的推動:胚胎和成年期幹細胞、克隆技術、器官再造。
4、HGP對制藥工業的貢獻
篩選藥物的靶點:與組合化學和天然化合物分離技術結合,建立高通量的受體、
酶結合試驗以知識為基礎的藥物設計:基因蛋白產物的高級結構分析、預測、類比—藥物作用“口袋”。
5、HGP對社會經濟的重要影響
生物產業與資訊產業是一個國家的兩大經濟支柱;發現新功能基因的社會和經濟效益;轉基因食品;
轉基因藥物(如減肥藥,增高藥)
6、HGP對生物進化研究的影響:
生物的進化史,都刻寫在各基因組的“天書”上;草履蟲是人的親戚——13億年;
人是由300~400萬年前的一種猴子進化來的;人類第一次“走出非洲”——200萬年的古猿;
人類的“夏娃”來自於非洲,距今20萬年——第二次“走出非洲”?
7、HGP帶來的負面作用
侏羅紀公園不只是科幻故事;種族選擇性滅絕性生化武器;基因專利戰;基因資源的掠奪戰;基因與個人隱私。
草圖的作用
1、草圖,許多疾病相關的基因被識別
2、SNP(人與人之間的區別),草圖提供了一個理解遺傳基礎和人類特徵進化的框架。
3、草圖後,研究人員有了新的工具來研究調節區和基因網路。
4、比較其他基因組可以揭示共同的調控元件,和其他物種共用的基因的環境,
也許提供在個體水準之上的關於功能和調節的資訊。
5、草圖同樣是研究基因組三維壓縮到細胞核中的一個起點。
這樣的壓縮可能影響到基因調控
6、在應用上,草圖資訊可以開發新的技術,如DNA晶片、蛋白質晶片,作為傳統方法的補充,
目前,這樣的晶片可以包含蛋白質家族中所有的成員,從而在特定的疾病組織中可以找到那些是活躍的。
2001年2月12日,美國Celera公司與人類基因組計畫分別在《科學》和《自然》雜誌上公佈了
人類基因組精細圖譜及其初步分析結果。
其中,政府資助的人類基因組計畫採取基因圖策略,而Celera公司採取了“鳥槍策略”。
至此,兩個不同的組織使用不同的方法都實現了他們共同的目標:完成對整個人類基因組的測序的工作;
並且,兩者的結果驚人的相似。
整個人類基因組測序工作的基本完成,為人類生命科學開闢了一個新紀元,
它對生命本質、人類進化、生物遺傳、個體差異、發病機制、疾病防治、新藥開發、健康長壽等領域,
以及對整個生物學都具有深遠的影響和重大意義,標誌著人類生命科學一個新時代的來臨。
眾多的發現
1、分析得知:全部人類基因組約有2.91Gbp,約有39000多個基因;平均的基因大小有27kbp;
其中G+C含量偏低,僅占38%,而2號染色體中G+C的含量最多;
到目前仍有9%的堿基對序列未被確定,19號染色體是含基因最豐富的染色體,而13號染色體含基因量最少等等。
2、目前已經發現和定位了26000多個功能基因,其中尚有42%的基因尚不知道功能,
在已知基因中酶占10.28%,核酸酶占7.5%,信號傳導占12.2%,轉錄因數占6.0%,信號分子占1.2%,受體分子占5.3%,
選擇性調節分子占3.2%,等。發現並瞭解這些功能基因的作用對於基因功能和新藥的篩選都具有重要的意義。
3、基因數量少得驚人:一些研究人員曾經預測人類約有14萬個基因,
但Celera公司將人類基因總數定在2.6383萬到3.9114萬個之間,不超過40,000,
只是線蟲或果蠅基因數量的兩倍,人有而鼠沒有的基因只有300個。
如此少的基因數目,而能產生如此複雜的功能,說明基因組的大小和基因的數量在生命進化上可能不具有特別重大的意義,
也說明人類的基因較其他生物體更‘有效‘,人類某些基因的功能和控制蛋白質產生的能力與其他生物的不同。
這將對我們目前的許多觀念產生重大的挑戰,它為後基因組時代中生物醫學的發展提供新的非凡的機遇。
但由於基因剪切,EST資料庫的重複以及一些技術和方法上的誤差,將來亦可能人類的基因數會多於4萬。
4、人類單核苷酸多態性的比例約為1/1250bp,不同人群僅有140萬個核苷酸差異,人與人之間99.99%的基因密碼是相同的。
並且發現,來自不同人種的人比來自同一人種的人在基因上更為相似。在整個基因組序列中,人與人之間的變異僅為萬分之一,
從而說明人類不同“種屬”之間並沒有本質上的區別。
5、人類基因組中存在“熱點“和大片“荒漠“。 在染色體上有基因成簇密集分佈的區域,
也有大片的區域只有“無用DNA” ——不包含或含有極少基因的成分。基因組上大約有1/4的區域沒有基因的片段。
在所有的DNA中,只有1%-1.5%DNA能編碼蛋白,在人類基因組中98%以上序列都是所謂的“無用DNA”,
分佈著300多萬個長片斷重複序列。
這些重複的“無用”序列,決不是無用的,它一定蘊含著人類基因的新功能和奧秘,包含著人類演化和差異的資訊。
經典分子生物學認為一個基因只能表達一種蛋白質,而人體中存在著非常複雜繁多的蛋白質,
提示一個基因可以編碼多種蛋白質,蛋白質比基因具有更為重要的意義。
6、男性的基因突變率是女性的兩倍,而且大部分人類遺傳疾病是在Y染色體上進行的。
所以,可能男性在人類的遺傳中起著更重要的作用。
7、人類基因組中大約有200多個基因是來自于插入人類祖先基因組的細菌基因。
這種插入基因在無脊椎動物是很罕見的,說明是在人類進化晚期才插入我們基因組的。
可能是在我們人類的免疫防禦系統建立起來前,寄生於機體中的細菌在共生過程中發生了與人類基因組的基因交換。
8、發現了大約一百四十萬個單核苷酸多態性,並進行了精確的定位,初步確定了30多種致病基因。
隨著進一步分析,我們不僅可以確定遺傳病、腫瘤、心血管病、糖尿病等危害人類生命健康最嚴重疾病的致病基因,
尋找出個體化的防治藥物和方法,同時對進一步瞭解人類的進化產生重大的作用。
9、人類基因組編碼的全套蛋白質(蛋白質組)比無脊椎動物編碼的蛋白質組更複雜。
人類和其他脊椎動物重排了已有蛋白質的結構域,形成了新的結構。
也就是說人類的進化和特徵不僅靠產生全新的蛋白質,更重要的是要靠重排和擴展已有的蛋白質,
以實現蛋白質種類和功能的多樣性。有人推測一個基因平均可以編碼2-10種蛋白質,以適應人類複雜的功能。
模式生物:酵母(yeast)、大腸桿菌(Escherichia coli)、果蠅(Drosophila melanogaster)、線蟲(Caenorhabditis elegans)、
小鼠(Mus musculus)、擬南芥、水稻、玉米等等其他一些模式生物的基因組計畫也都相繼完成或正在順利進行。
目前基因組學的研究出現了幾個重心的轉移:
一是將已知基因的序列與功能聯繫在一起的功能基因組學研究;
二是從作圖為基礎的基因分離轉向以序列為基礎的基因分離;
三是從研究疾病的起因轉向探索發病機理;四是從疾病診斷轉向疾病易感性研究。
在後基因組時代,如果在已完成基因組測序的物種之間進行整體的比較、分析,
希望在整個基因組的規模上瞭解基因組和蛋白質組的功能意義,包括基因組的表達與調控、
基因組的多樣化和進化規律以及基因及其產物在生物體生長、發育、分化、行為、老化和治病過程中的作用機制
都必須發展新的演算法以充分利用超級電腦的超級計算能力。
美國和英國科學家2006年5月18日在英國《自然》雜誌網路版上發表了人類最後一個染色體——1號染色體的基因測序。
在人體全部22對常染色體中,1號染色體包含基因數量最多,達3141個,是平均水準的兩倍,
共有超過2.23億個堿基對,破譯難度也最大。一個由150名英國和美國科學家組成的團隊歷時10年,才完成了1號染色體的測序工作。
科學家不止一次宣佈人類基因組計畫完工,但推出的均不是全本,這一次殺青的“生命之書”
更為精確,覆蓋了人類基因組的99.99%。解讀人體基因密碼的“生命之書”宣告完成,歷時16年的人類基因組計畫書寫完了最後一個章節。
(節錄) (百度百科)
|