890 likes | 1.16k Views
CHAPTER 4. 基因、基因體與 DNA. DNA 為遺傳物質的歷史回溯. 1828 年 Friedrich Wohler 證實了可用實驗室的化學藥品 ammonium cyanate 在試管中合成出尿素,是一種由動物產生的「活」的分子。這是第一次證明,其實沒有神奇的力量在生命體的化學物裡。
E N D
CHAPTER 4 基因、基因體與DNA
DNA為遺傳物質的歷史回溯 • 1828年Friedrich Wohler 證實了可用實驗室的化學藥品ammonium cyanate在試管中合成出尿素,是一種由動物產生的「活」的分子。這是第一次證明,其實沒有神奇的力量在生命體的化學物裡。 • DNA是在1869由Frederich Miescher 感染傷口的膿中萃取物發現的。直到將近一百年後,才由Oswald Avery確認它的重要性。在1944年,Avery發現,利用化學萃取一些會引起肺炎的細菌株而得到的萃取物,可傳給其他類似但較無害的菌種,Avery純化這些必要的分子並證實它們就是DNA,即便他當時並沒有命名為DNA,因為DNA的結構還沒有被研究。 CHAPTER 4 基因、基因體與DNA
James Watson 與Francis Crick 在1953年,提出著名的雙股螺旋模型,證實基因代碼的化學性質也介紹DNA複製的機制。1950年,Maurice Wilkins與他的同事Raymond Gosling拿到第一張DNA X-光繞射的圖。Rosalind Franklin加入了Wilkins的實驗室並繼續Gosling的工作。Watson 與Crick在1952年拿了Rosalind Franklin與Raymond Gosling的X-光繞射圖,並用以做為雙股螺旋模型的基礎。 • 找出遺傳物質的化學基礎讓Watson、Crick與Wilkins在1962年贏得諾貝爾生理醫學獎,因為他們發現核酸的分子結構與活體基因訊息傳送的重要性。 CHAPTER 4 基因、基因體與DNA
維持生命需要多少的基因訊息才足夠 • 最小的真菌基因體是Mycoplasma genitalium,它有一個環狀的染色體,約有580,000個DNA鹼基對(bp)。一般一個基因的平均鹼基數目為1,000個鹼基,而在細菌中的非編碼DNA很少,約有500個基因。 • 與其他小的細菌基因體比較,我們知道約有 250個基因是活細胞存在最基本的數目。最簡單的活細胞可能需要約200到300個基因。 • 寄生的細菌,因為它並不能獨自生長,除非靠在其他微生物的表面。雖然有著較少的DNA,但它的基因較緊密且連續在一起,因此比M. genitalium有更多的基因代碼序列 ── 約550個。 CHAPTER 4 基因、基因體與DNA
非編碼DNA • 真核細胞存有大量DNA是非編碼DNA (non-coding DNA)。也正如字面意義所指,這些DNA的鹼基序列是毫無意義的,就我們目前所知是沒有任何有用的基因訊息。 • 任何區間的DNA,不管是否有基因代碼意義,都可視為是基因的地址(locus,複數為loci),也就是在染色體的位置 (或其他DNA分子上)。因為任何DNA的序列可能是一種形式,如果這段DNA是無基因代碼意義,則使用對偶基因(allele) 來代表。 • 雖然細菌相對地只有很少的非編碼DNA,但真核細胞卻有著很大的量。高等真核細胞有較多量的非編碼DNA。 CHAPTER 4 基因、基因體與DNA
在原核細胞中,幾乎所有的非編碼DNA都是存在於基因與基因之間(intergenic DNA)。真核細胞的情形則較為複雜,不僅是非編碼DNA散落在染色體的基因間,基因本身也會被這些非編碼DNA給打斷。這些非編碼DNA叫作基因間區段序列(intervening sequence),也就是內含子(intron),而真正含有基因訊息的DNA就是外顯子(exon)。大部分真核細胞基因的外顯子間夾雜著有內含子。 CHAPTER 4 基因、基因體與DNA
為了要利用被干擾打斷的基因做成蛋白質,內含子必須被移走。轉錄之後在mRNA的層級,內含子在細胞核中被移除。當基因被表達時DNA首先被轉錄成一條很長的RNA分子,也就是說在主要的初級轉錄物(primary transcript) 時期仍有內含子存在,再來初級轉錄物經由處理移走內含子產生了mRNA 。 CHAPTER 4 基因、基因體與DNA
非編碼DNA序列中也可能存在編碼DNA • 內含子並非完全不存在於原核細胞中,但是不尋常的是通常只有一個單一的內含子在一個基因上,並不像真核細胞中,有許多基因存在多個內含子。 • 在一些少見的例子中,原核細胞染色體基因被打斷,但這些基因是RNA分子的代碼而非蛋白質的代碼。在真細菌與古細菌的tRNA 與rRNA的基因是在內含子中被發現。 CHAPTER 4 基因、基因體與DNA
重複序列的DNA是較高等生物的特性 • 大部分的基因都是以一組存在,而這些特殊的序列基因,幾乎就是所有細菌的DNA。但在高等生物體,這些特殊的序列,就可能只有全部DNA的20%。如人類有65% 的DNA為基因,蛙則有22%。剩下來的DNA都是重複序列(repeated sequences 或repetitive sequences)。重複序列就正如它們的名字一樣,在基因體裡重複出現。某些例子中,這些重複序列一個緊接著一個 (tandem repeat),但有些則是任意分散在基因體裡 (interspersed sequences)。這些重複序列有些是真正的基因,但大部分則是非編碼DNA。 CHAPTER 4 基因、基因體與DNA
這些重複序列家族的成員,每一個鹼基幾乎都是一樣的,可以視為是沒有什麼變化的,即便有也是非常微小的差異,也就是所謂的共同序列(consensus sequence)。要找到這樣的共同序列,就是比較許多的個別序列的鹼基,在每一個位置都找出最常出現的鹼基,並得到所有的平均。 CHAPTER 4 基因、基因體與DNA
真核細胞也有所謂的假性基因(pseudogene)。這些真正基因的複製拷貝是有缺陷的,而這些缺失使得它們無法被表達。真核細胞也有所謂的假性基因(pseudogene)。這些真正基因的複製拷貝是有缺陷的,而這些缺失使得它們無法被表達。 • 有時基因的複製具有功能,而重複的拷貝可能產生一些相關基因的家族。這些重複的拷貝會逐漸分開,以或高或低的不同程度,來調節成相似的功能。因此這些重複序列形成非常相近但不是完全一樣的基因家族。 CHAPTER 4 基因、基因體與DNA
因為原核細胞有10,000個或更多核糖體,它們的DNA通常有六個複製本的rRNA和 tRNA基因。在更大的真核細胞,它們有上百上千個複製本的rRNA和 tRNA基因。這些存在於上百上千個複製本的序列,稱為中等重複序列(moderately repetitive sequence)。大約有25% 的人類DNA屬於這個種類。 • 許多中等重複非編碼DNA序列,由LINEs所組成,也就是「長的重複非編碼DNA序列(Long INterspersed Elements, LINE)」。它們被認為是由類似逆轉錄病毒衍生而來。 CHAPTER 4 基因、基因體與DNA
10% 的人類DNA有上萬到百萬個複製本的序列,大多數的高等重複DNA序列(highly repetitive DNA) 包含SINE或短的重複非編碼DNA序列 (Short INterspersed Elements, SINE)。這些序列至今所知幾乎全是無功能的。最廣為人知的SINE是300個鹼基對的Alu因子(Alu element)。 CHAPTER 4 基因、基因體與DNA
衛星DNA是非編碼DNA以重複序列出現 • LINEs 和SINEs的定義是這些重複序列隨意分散在基因體上,但還有一種在真核細胞中數量不少的高等重複DNA序列,被發現以長的聚集存在,就是縱列重複序列(tandem repeats),也就是所謂的衛星DNA (satellite DNA)。Tandem的意義為這些重複序列在DNA上是以一個接一個的形態出現,中間並無任何的空間存在。衛星DNA的數量變化極大,在哺乳類如小鼠中約有8% 的DNA是衛星DNA,而在果蠅則將近有50%。 • 長序列的縱列重複序列常有不正確的排列出現,當一對染色體在減數分裂做交換時會排列整齊,不相等的交換(unequal crossing over) 發生所產生一段重複序列的DNA較短,另一段重複序列的DNA較長 。 CHAPTER 4 基因、基因體與DNA
衛星DNA插入染色體,並緊緊的環繞在異染色質(heterochromatin) 上。異染色質位在染色體的中心體(centromere),推測它負責某些結構上的功能。但這些衛星DNA序列與中心體序列(centromere sequence) 是非常不同的,中心體是負責在細胞分裂中紡錘絲的附著。 CHAPTER 4 基因、基因體與DNA
迷你衛星DNA與VNTR • DNA片段中包含著短的縱列重複序列,但比衛星DNA有較少的數目,這些就是迷你衛星DNA (mini-satellite) 或稱為不同數目的縱列重複序列VNTR (Variable Number of Tandem Repeat)。 • 由於不相等的交換,在任一個VNTR的重複序列數目差異是極大的。雖然VNTR屬於無意義的沒功能的基因,但它的不同版本仍被視為對偶基因。 • 一些高變異的VNTR可能有多至1,000個不同的對偶基因,並在個別生物體產生非常不同的形式。這種數量上的變異可能以DNA指紋(DNA fingerprinting) 分析來確認個體。 CHAPTER 4 基因、基因體與DNA
自私DNA與垃圾DNA的起源 • 一般認為在真核細胞染色體,發現的大部分重複與非編碼DNA是無用的,如此無用處的DNA,通常視為垃圾DNA (junk DNA)。它被認為是許多的重複序列與非編碼DNA,包括內含子,可能原先都由病毒DNA來的。當病毒DNA插入真核細胞染色體,逆轉錄病毒在產生這樣的染色體插入,扮演重要的功能。另外,轉位因子 (transposable element) ) 可能負責產生顯著數量的重複序列DNA。 CHAPTER 4 基因、基因體與DNA
重複序列DNA的產生可分為兩個過程,原始的序列可能是病毒DNA或轉位因子,這些序列插入染色體而仍舊維持不變及具功能性。兩樣元素都可能複製,而複製本則插入染色體中的許多不同部位,因此這些寄生物序列的數目就增加了,再加上許多序列會有突變,可能是鹼基改變或是刪除,這些結果造成一系列家族的序列,但大部分的功能性已不存在了。重複序列DNA的產生可分為兩個過程,原始的序列可能是病毒DNA或轉位因子,這些序列插入染色體而仍舊維持不變及具功能性。兩樣元素都可能複製,而複製本則插入染色體中的許多不同部位,因此這些寄生物序列的數目就增加了,再加上許多序列會有突變,可能是鹼基改變或是刪除,這些結果造成一系列家族的序列,但大部分的功能性已不存在了。 • 轉位因子因為只注重自身的存活與複製,並不會在任何方面幫助寄主,所以稱之為自私DNA (selfish DNA)。 CHAPTER 4 基因、基因體與DNA
自私DNA在基因體裡增長,可視為細胞的寄生物感染寄主的染色體。這些自私DNA的累積是靠著兩個相反的過程,複製與自私DNA的重新插入,再加上它自行產生的鹼基刪除。自私DNA在基因體裡增長,可視為細胞的寄生物感染寄主的染色體。這些自私DNA的累積是靠著兩個相反的過程,複製與自私DNA的重新插入,再加上它自行產生的鹼基刪除。 CHAPTER 4 基因、基因體與DNA
迴文、倒轉重複序列、莖狀與環狀結構 • 迴文(palindrome) 的意思是一個字或句子,正著唸與倒著唸是相同的。在DNA的例子中,它是雙股螺旋,理論上兩種形式的迴文可被產生。如鏡子影像的迴文(mirror-like palindrome) 就像一般的文字,但牽涉到到兩條DNA。 • 倒轉重複(inverted repeat) 序列的迴文是比較常見的,並具有生物功能的特殊意義。在倒轉重複序列,一個序列是正著唸與另一個互補序列倒著唸是相同的。 CHAPTER 4 基因、基因體與DNA
倒轉重複序列在蛋白質要接上DNA時的辨識序列是非常重要的,許多調控蛋白質可辨識倒轉重複序列,一些限制 與修飾酵素也可辨識倒轉重複序列。倒轉重複序列在蛋白質要接上DNA時的辨識序列是非常重要的,許多調控蛋白質可辨識倒轉重複序列,一些限制 與修飾酵素也可辨識倒轉重複序列。 • 若以倒轉重複序列的單股來說,在每一股的右半段與左半段的序列,必須是互補的。如序列GGATATCC可被摺疊成髮夾(hairpin) 狀,兩端以鹼基配對結合而成 。 CHAPTER 4 基因、基因體與DNA
少數幾個非配對的鹼基 (以N代表任何鹼基),在鹼基對的直桿上方會形成個圈圈,稱為莖狀與環狀(stem and loop) 結構。單股DNA的任何倒轉重複序列,只要具有多餘的幾個鹼基在中間,就可形成這樣的結構。 CHAPTER 4 基因、基因體與DNA
多個A-tracts 造成DNA彎曲 • DNA序列若包含幾個有A的鹼基 (連續3到5個核 酸長),並由10 bp間隔開來,就可形成彎曲。注意這些A-tract間的間隔,相當於雙股螺旋的一個轉折,彎曲發生在有As轉的3-端。彎曲的DNA (bent DNA) 在電泳分離時,會跑得比同樣長度但沒有彎曲的DNA來得慢。 CHAPTER 4 基因、基因體與DNA
超螺旋在細菌DNA的包裝上是必要的 • 一般的細菌約有一百萬分之一公尺長,而一個攜帶4,000個或更多的基因的單一DNA分子,則有一毫米長。若將細菌染色體全拉開,將是一個細菌的一千倍長。在細胞內的雙股螺旋DNA必須是超螺旋(supercoiled) 狀,才能使得DNA更緊密。 CHAPTER 4 基因、基因體與DNA
DNA分子已是雙股螺旋,原先的雙股螺旋有著右手側扭轉,但超螺旋的扭轉是另一個方向,也就是左手側或「負向超螺旋(negative supercoils)」。在細菌DNA中,每一個超螺旋約有200個核 酸,在複製及轉錄時,負向超螺旋促使DNA螺旋解開,並幫助雙股分開。 • 負向超螺旋是利用DNA促旋酶 (gyrase) 引進到細菌染色體的。若沒有拓樸酶I (topoisomerase I) 和拓樸酶IV (topoisomerase IV),DNA就會是極度的負向超螺旋。 CHAPTER 4 基因、基因體與DNA
在大腸桿菌的超螺旋程度是依據拓樸酶I和拓樸酶 IV間的平衡,拓樸酶IV的功能是輔助拓樸酶I的作用,而拓樸酶I的功能是可移走多餘的負向超螺旋,這樣的功能恰好與DNA促旋酶的作用相反。一般的細菌染色體,繞在蛋白質鷹架裡約有50圈大型DNA超螺旋。在大腸桿菌的超螺旋程度是依據拓樸酶I和拓樸酶 IV間的平衡,拓樸酶IV的功能是輔助拓樸酶I的作用,而拓樸酶I的功能是可移走多餘的負向超螺旋,這樣的功能恰好與DNA促旋酶的作用相反。一般的細菌染色體,繞在蛋白質鷹架裡約有50圈大型DNA超螺旋。 CHAPTER 4 基因、基因體與DNA
細菌染色體和質體都是雙股環狀的DNA分子,並常稱為共價緊閉環狀DNA (covalently closed circular DNA或cccDNA)。如果雙股環狀的一股是有缺口,則超螺旋能被分開,這樣的分子為有缺口的環狀(open circle)。 CHAPTER 4 基因、基因體與DNA
拓樸酶和DNA促旋酶 • 在兩股扭曲DNA分子中所有的立體交叉處數目,稱為連接數(linking number (L)),這個是雙股螺旋加上超螺旋的總和。[雙股螺旋扭轉的數目,被認知為雙股螺旋轉(twist, T),而超螺旋扭轉的數目為超螺旋轉數目(writhe或writhing number, W)。至於linking number (L),就是twist的數目加上writhe的數目 (L=T+W)。] CHAPTER 4 基因、基因體與DNA
相同的環形DNA,能有不一樣數目的超螺旋,這樣的異構物,稱為topological異構物,也就是拓樸異構體(topoisomers)。能將超螺旋加入或移除的酵素,因而稱為拓樸酶 (topoisomerase)。第一型拓樸酶(type I topoisomerase) 打斷的只有一股DNA,可以減少一個連接數。相反的,第二型拓樸酶(type II topoisomerase) [包括DNA促旋酶 (DNA gyrase)] 可打斷DNA的兩股,當兩股都打斷時,雙股DNA會經由斷裂處將雙股螺旋打開,而使得超螺旋的數目減少兩個 。 CHAPTER 4 基因、基因體與DNA