遺傳密碼

Article in other languages:

RNA分子上一系列的密碼子,每個密碼子包括三個核苷酸,代表一個氨基酸

遗传密码是一组规则,将DNARNA序列以三個核苷酸為一組的密碼子轉譯蛋白质氨基酸序列,以用于蛋白质合成。几乎所有的生物都使用同样的遗传密码,称为标准遗传密码;即使是非細胞結構的病毒,它們也是使用标准遗传密码。但是也有少数生物使用一些稍微不同的遗传密码。

目录

破解歷史

自從發現了DNA的結構,科學家便開始致力研究有關製造蛋白質的秘密。伽莫夫指出需要以三個核酸一組才能為20個氨基酸編碼。1961年美國國家衛生院Matthaei馬歇爾·沃倫·尼倫伯格無細胞系統(Cell-free system)環境下,把一條只由尿嘧啶(U)組成的RNA轉釋成一條只有苯丙氨酸(Phe)的多肽,由此破解了首個密碼子(UUU -> Phe)。隨後哈爾·葛賓·科拉納破解了其它密碼子,接著羅伯特·W·霍利發現了負責轉錄過程的tRNA1968年,科拉納、霍利和尼倫伯格分享了諾貝爾生理學或醫學獎

基因组的表达

一个生物体携带的遗传信息-即基因组-被记录在DNA或RNA分子中,分子中每个有功能的单位被称作基因。每个基因均是由一連串單核苷酸組成。每个单核苷酸均由碱基戊糖(即五碳糖,DNA中为脱氧核糖,RNA中为核糖)和磷酸三部分组成。碱基不同构成了不同的单核苷酸。组成DNA的碱基有腺嘌呤(A),鸟嘌呤(G),胞嘧啶(C)及胸腺嘧啶(T)。组成RNA的碱基以尿嘧啶(U)代替了胸腺嘧啶(T)。三個單核苷酸形成一組密碼子,而每個密碼子代表一個氨基酸或停止訊號。

製造蛋白質的過程中,基因先被從DNA轉錄為对应的RNA模板,即信使RNA(mRNA)。接下来在核糖体转移RNA(tRNA)以及一些的作用下,由该RNA模板轉译成为氨基酸组成的链(多肽),然后经过轉译后修饰形成蛋白质。詳情參閱轉譯

因為密码子由三个核苷酸组成,故一共有43=64種密码子。例如,RNA序列UAGCAAUCC包含了三个密码子:UAG,CAA和UCC。这段RNA编码了代表了长度为3个氨基酸的一段蛋白质序列。(DNA也有类似的序列,但是以T代替了U)。

标准遗传密码如下表所示:由3个碱基对应到氨基酸的密码子表以及由氨基酸对应到3个碱基的反密码子表。

表一:密码子表

此表列出了64种密码子以及氨基酸的標準配對。
第二位碱基
U C A G




U

UUU (Phe/F)苯丙氨酸
UUC (Phe/F)苯丙氨酸
UUA (Leu/L)亮氨酸
UUG (Leu/L)亮氨酸

UCU (Ser/S)丝氨酸
UCC (Ser/S)丝氨酸
UCA (Ser/S)丝氨酸
UCG (Ser/S)丝氨酸

UAU (Tyr/Y)酪氨酸
UAC (Tyr/Y)酪氨酸
UAA 终止
UAG 终止

UGU (Cys/C)半胱氨酸
UGC (Cys/C)半胱氨酸
UGA 终止
UGG (Trp/W)色氨酸

C

CUU (Leu/L)亮氨酸
CUC (Leu/L)亮氨酸
CUA (Leu/L)亮氨酸
CUG (Leu/L)亮氨酸

CCU (Pro/P)脯氨酸
CCC (Pro/P)脯氨酸
CCA (Pro/P)脯氨酸
CCG (Pro/P)脯氨酸

CAU (His/H)组氨酸
CAC (His/H)组氨酸
CAA (Gln/Q)谷氨酰胺
CAG (Gln/Q)谷氨酰胺

CGU (Arg/R)精氨酸
CGC (Arg/R)精氨酸
CGA (Arg/R)精氨酸
CGG (Arg/R)精氨酸

A

AUU (Ile/I)异亮氨酸
AUC (Ile/I)异亮氨酸
AUA (Ile/I)异亮氨酸
AUG (Met/M)甲硫氨酸, 起始1

ACU (Thr/T)苏氨酸
ACC (Thr/T)苏氨酸
ACA (Thr/T)苏氨酸
ACG (Thr/T)苏氨酸

AAU (Asn/N)天冬酰胺
AAC (Asn/N)天冬酰胺
AAA (Lys/K)赖氨酸
AAG (Lys/K)赖氨酸

AGU (Ser/S)丝氨酸
AGC (Ser/S)丝氨酸
AGA (Arg/R)精氨酸
AGG (Arg/R)精氨酸

G

GUU (Val/V)缬氨酸
GUC (Val/V)缬氨酸
GUA (Val/V)缬氨酸
GUG (Val/V)缬氨酸

GCU (Ala/A)丙氨酸
GCC (Ala/A)丙氨酸
GCA (Ala/A)丙氨酸
GCG (Ala/A)丙氨酸

GAU (Asp/D)天冬氨酸
GAC (Asp/D)天冬氨酸
GAA (Glu/E)谷氨酸
GAG (Glu/E)谷氨酸

GGU (Gly/G)甘氨酸
GGC (Gly/G)甘氨酸
GGA (Gly/G)甘氨酸
GGG (Gly/G)甘氨酸

1標準起始編碼,同時為甲硫氨酸編碼。mRNA中第一个AUG就是蛋白质翻译的起始部位。

表二:逆密码子表

此表列出了和20种氨基酸和密码子的標準配對。

Ala A GCU, GCC, GCA, GCG Leu L UUA, UUG, CUU, CUC, CUA, CUG
Arg R CGU, CGC, CGA, CGG, AGA, AGG Lys K AAA, AAG
Asn N AAU, AAC Met M AUG
Asp D GAU, GAC Phe F UUU, UUC
Cys C UGU, UGC Pro P CCU, CCC, CCA, CCG
Gln Q CAA, CAG Ser S UCU, UCC, UCA, UCG, AGU, AGC
Glu E GAA, GAG Thr T ACU, ACC, ACA, ACG
Gly G GGU, GGC, GGA, GGG Trp W UGG
His H CAU, CAC Tyr Y UAU, UAC
Ile I AUU, AUC, AUA Val V GUU, GUC, GUA, GUG
起始 AUG 終止 UAG, UGA, UAA

技术细节

起始和终止密码子

蛋白质的轉译从初始化密码子(起始密码子)开始,但亦需要適當的初始化序列和起始因子才能使mRNA和核糖体结合。最常见的起始密码子为AUG,其同时编码的氨基酸在细菌为甲酰甲硫氨酸,在真核生物为甲硫氨酸,但在個別情況其它一些密碼子也具有起始的功能。

在经典遗传学中,终止密码子各有名称:UAG为琥珀(amber),UGA为蛋白石(opal),UAA为赭石(ochre)。这些名称来源于最初發現到这些终止密码子的基因的名称。终止密码子使核醣體和釋放因子結合,使多肽核醣體分離而結束轉譯的程序。

簡并性

大部分密码子具有简并性,即两个或者多个密码子编码同一氨基酸。简并的密码子通常只有第三位碱基不同,例如,GAA和GAG都编码谷氨酰胺。如果不管密码子的第三位为哪种核苷酸,都编码同一种氨基酸,则称之为四重简并;如果第三位有四种可能的核苷酸之中的两种,而且编码同一种氨基酸,则称之为二重简并,一般第三位上两种等价的核苷酸同为嘌呤(A/G)或者嘧啶(C/T)。只有两种氨基酸仅由一个密码子编码,一个是甲硫氨酸,由AUG编码,同时也是起始密码子;另一个是色氨酸,由UGG编码。

遗传密码的这些性质可使基因更加耐受點突变。例如,四重简并密码子可以容忍密码子第三位的任何变异;二重简并密码子使三分之一可能的第三位的变异不影响蛋白质序列。由于转换变异(嘌呤变为嘌呤或者嘧啶变为嘧啶)比颠换变异(嘌呤变为嘧啶或者嘧啶变为嘌呤)的可能性更大,因此二重简并密码子也具有很强的对抗突变的能力。不影響氨基酸序列的突變稱為沉默突变

简并性的出現是由於tRNA反密码子的第一位碱基可以和mRNA構成摆动碱基对,常見的情況為反密码子上的次黄嘌呤(I),以及和密碼子形成非標準的U-G配对。

另一種有助對抗點突变的情況,是NUN (N代表任何核苷酸) 傾向於代表疏水性氨基酸,故此即使出現突變,仍有較大機會維持蛋白質的親水度,減低致命破壞的可能。

阅读框

“密码子”是由閱讀的起始位点决定的。例如,一段序列GGGAAACCC,如果由第一个位置开始读,包括3个密码子GGG,AAA和CCC。如果从第二位开始读,包括GGA和AAC(忽略不完整的密码子)。如果从第三位开始读,则为GAA和ACC。故此每段序列都可以分为三个阅读框,每个都能产生不同的氨基酸序列(在上例中,相应为Gly-Lys-Pro,Gly-Asp,和Glu-Thr)。而因為DNA的雙螺旋結構,每段DNA實際上有六個阅读框。 实际的框架是由起始密码子确定,通常是mRNA序列上第一个出现的AUG。

破坏阅读框架的变异(例如,插入或删除1个或2个核苷酸)稱為阅读框变异,通常會严重影响到蛋白质的功能,故此並不常见,因为他们通常不能在演化中存活下来。

非標準的遗传密码

雖然遗传密码在不同生命之間有很強的一致性,但亦存在非標準的遗传密码。在有「細胞能量工廠」之稱的線粒體中,便有和標準遺傳密碼數個相異的之處,甚至不同生物的線粒體有不同的遗传密码。支原體會把UGA轉譯為色氨酸。纖毛蟲則把UAG(有時候還有UAA)轉譯為穀氨酰胺(一些綠藻也有同樣現象),或把UGA轉譯為半胱氨酸。一些酵母會把GUG轉譯為絲氨酸。在一些罕見情況,一些蛋白質會有AUG以外的起始密碼子。

真菌、原生生物和人以及其它动物的粒線體中的遺傳密碼與標準遺傳密碼的差異,主要變化如下:

密碼子 通常的作用 例外的作用 所属的生物
UGA 中止編碼 色氨酸編碼 人、牛、酵母线粒体,支原体(Mycoplasma)基因组,如Capricolum
UGA 中止編碼 半胱氨酸編碼 一些纤毛虫(ciliate)细胞核基因组,如游纤虫属(Euplotes)
AGR 精氨酸編碼 中止編碼 大部分动物线粒体,脊椎动物线粒体
AGA 精氨酸編碼 丝氨酸編碼 果蝇线粒体
AUA 異亮氨酸編碼 蛋氨酸編碼 一些动物和酵母线粒体
UAR 中止編碼 谷氨酰胺編碼 草履虫、一些纤毛虫(ciliate)细胞核基因组,如嗜热四膜虫(ThermophAilus tetrahymena)
UAG 中止編碼 谷氨酸編碼 草履虫核细胞核基因组
GUG 缬氨酸編碼 丝氨酸編碼 假丝酵母核基因组
AAA 赖氨酸編碼 天冬氨酸編碼 一些动物的线粒体,果蝇线粒体
CUG 亮氨酸編碼 中止編碼 圆柱念珠菌(Candida cylindracea)细胞核基因组
CUN 亮氨酸編碼 苏氨酸編碼 酵母线粒体

按信使RNA的序列,在一些蛋白質裏停止密碼子會被翻譯成非標準的氨基酸,例如UGA轉譯為硒半胱氨酸和UAG轉譯為吡咯賴氨酸,隨著對基因組序列加深了解,科學家可能還會發現其它非標準的轉譯方式,以及其它未知氨基酸在生物中的應用。

遺傳密碼的起源

除了少數的不同之外,地球上已知生物的遺傳密碼均非常接近;因此根據演化論,遺傳密碼應在生命歷史中很早期就出現。現有的證據表明遺傳密碼的設定並非是隨機的結果,對此有以下的可能解釋1:

  • 最近一項研究顯示,一些氨基酸與它們相對應的密碼子有選擇性的化學結合力2,這顯示現在複雜的蛋白質製造過程可能並非一早存在,最初的蛋白質可能是直接在核酸上形成。
  • 原始的遺傳密碼可能比今天簡單得多,隨著生命演化製造出新的氨基酸再被利用而令遺傳密碼變得複雜。雖然不少證據證明這觀點3,但詳細的演化過程仍在探索之中4,5

參考資料

其它參考資料

網路上有很多有關本題目的資料,由美國國家衛生院提供NCBI Bookshelf

相關條目

外部連結

Questions for article:

This article is from Wikipedia. All text is available under the terms of the GNU Free Documentation License.


IHS Europe: Infrared Heating Systems for Home and Business.