Genetický kód

Série kodonů v krátké molekule RNA. Každý kodon se skládá ze tří nukleotidů, představujících jedinou aminokyselinu.

Genetický kód je soubor pravidel, podle kterých je informace zakódovaná v genetickém materiálu (sekvence DNA nebo RNA) živými buňkami překládána do proteinů (sekvence aminokyselin). Konkrétně kód definuje mapování mezi tri-nukleotidovými sekvencemi nazývanými kodony a aminokyselinami; každá trojice nukleotidů v sekvenci nukleové kyseliny specifikuje jedinou aminokyselinu. Většina organismů používá téměř univerzální kód, který je označován jako standardní genetický kód. Dokonce i viry, které nejsou buněčné a samy proteiny nesyntrují, mají proteiny vytvořené pomocí tohoto standardního kódu. Po nějakou dobu se proto mělo za to, že kód je univerzální. Existují však pozoruhodné výjimky. Je také možné, aby jeden organismus překládal různé části genomu různými způsoby. Například u lidí se syntéza proteinů v mitochondriích opírá o modifikovaný genetický kód, který se liší od standardního.

Přenos informací prostřednictvím genetického kódu

Genetická informace nesená organismem, jeho genomem, je vepsána do jedné nebo více DNA, nebo v některých případech RNA, molekul. Každá funkční část DNA nebo RNA molekuly je označována jako gen. Genová sekvence vepsaná do DNA a do RNA je složena z tri-nukleotidových jednotek nazývaných kodony, z nichž každý kóduje jednu aminokyselinu. Každá nukleotidová podjednotka se skládá z fosfátu, cukru deoxyribózy a jedné ze 4 dusíkatých nukleotidových bází seskupených do 2 kategorií, purinu a pyrimidinu. Purinové báze adenin (A) a guanin (G) jsou větší a skládají se ze dvou aromatických kruhů. Pyrimidinové báze cytosin (C) a thymin (T) jsou menší a skládají se pouze z jednoho aromatického kruhu. V RNA je však thymin (T) nahrazen uracilem (U) a deoxyribóza je nahrazena ribózou.

Teoreticky existuje 4³ = 64 různých kombinací kodonů, které jsou možné s trojnásobným kodonem tří nukleotidů. Ve skutečnosti je všech 64 kodonů standardního genetického kódu přiřazeno buď aminokyselinám, nebo stop signálům během překladu. Pokud je například sekvence RNA, uvažuje se UUAAACCC a čtecí rámec začíná prvním U (podle konvence 5′ až 3′), existují tři kodony, a to UUU, AAA a CCC, z nichž každý specifikuje jednu aminokyselinu. Tato sekvence RNA bude přeložena do sekvence aminokyselin, dlouhé tři aminokyseliny.

Standardní genetický kód je uveden v následujících tabulkách. Tabulka 1 ukazuje, jaké aminokyseliny specifikuje každý z 64 kodonů. Tabulka 2 ukazuje, jaké kodony specifikují každou z 20 standardních aminokyselin zapojených do překladu. Ty se nazývají dopředné, respektive reverzní kodonové tabulky. Například kodon AAU představuje aminokyselinu asparagin a UGU a UGC představují cystein {standardní třípísmenná označení, Asn a Cys).

Doporučujeme:  Sebevražda

UUU (Phe/F)Fenylalanin
UUC (Phe/F)Fenylalanin
UUA (Leu/L)Leucin
UUG (Leu/L)Leucin

UCU (Ser/S)Serine
UCC (Ser/S)Serine
UCA (Ser/S)Serine
UCG (Ser/S)Serine

UAU (Tyr/Y)Tyrosin
UAC (Tyr/Y)Tyrosin
UAA Ochre (Stop)
UAG Amber (Stop)

UGU (Cys/C)Cystein
UGC (Cys/C)Cystein
UGA Opal (Stop)
UGG (Trp/W)Tryptofan

CUU (Leu/L)Leucin
CUC (Leu/L)Leucin
CUA (Leu/L)Leucin
CUG (Leu/L)Leucin

CCU (Pro/P)Proline
CCC (Pro/P)Proline
CCA (Pro/P)Proline
CCG (Pro/P)Proline

CAU (His/H)Histidin
CAC (His/H)Histidin
CAA (Gln/Q)Glutamin
CAG (Gln/Q)Glutamin

CGU (Arg/R)Arginin
CGC (Arg/R)Arginin
CGA (Arg/R)Arginin
CGG (Arg/R)Arginin

AUU (Ile/I)Isoleucin
AUC (Ile/I)Isoleucin
AUA (Ile/I)Isoleucin
AUG (Met/M)Methionin, Start

ACU (Thr/T)Threonine
ACC (Thr/T)Threonine
ACA (Thr/T)Threonine
ACG (Thr/T)Threonine

AAU (Asn/N)Asparagin
AAC (Asn/N)Asparagin
AAA (Lys/K)Lysin
AAG (Lys/K)Lysin

AGU (Ser/S)Serine
AGC (Ser/S)Serine
AGA (Arg/R)Arginine
AGG (Arg/R)Arginine

GUU (Val/V)Valine
GUC (Val/V)Valine
GUA (Val/V)Valine
GUG (Val/V)Valine

GCU (Ala/A)Alanin
GCC (Ala/A)Alanin
GCA (Ala/A)Alanin
GCG (Ala/A)Alanin

GAU (Asp/D)Kyselina asparagová
GAC (Asp/D)Kyselina asparagová
GAA (Glu/E)Kyselina glutamová
GAG (Glu/E)Kyselina glutamová

GGU (Gly/G)Glycin
GGC (Gly/G)Glycin
GGA (Gly/G)Glycin
GGG (Gly/G)Glycin

Tabulka 2: Tabulka obráceného kodonu

Tato tabulka uvádí 20 standardních aminokyselin používaných v proteinech a kodony, které kódují jednotlivé aminokyseliny.

Čtení snímku sekvence

Všimněte si, že kodon je definován initálním nukleotidem, ze kterého překlad začíná. Například řetězec GGGAAACCC, je-li čten z první pozice, obsahuje kodony GGG, AAA a CCC;a je-li čten z druhé pozice, obsahuje kodony GGA a AAC; je-li čten z třetí pozice, GAA a ACC. Částečné kodony byly v tomto příkladu ignorovány. Každá sekvence tak může být čtena ve třech čtecích rámcích, z nichž každý vytvoří jinou sekvenci aminokyselin (v daném příkladu Gly-Lys-Pro, Gly-Asp nebo Glu-Thr). U dvouvláknové DNA existuje šest možných čtecích rámců, tři v orientaci vpřed na jednom vlákně a tři vzad, nebo na opačném vlákně.

Skutečný rámec, ve kterém je proteinová sekvence přeložena, je definován počátečním kodonem, obvykle prvním AUG kodonem v mRNA sekvenci. Mutace, které narušují čtecí rámec vložením nebo odstraněním jedné nebo dvou nukleotidových bází, jsou známé jako frameshift mutace. Tyto mutace mohou narušit funkci výsledného proteinu, pokud je tvořen, a jsou tedy vzácné v in vivo sekvencích kódujících protein. Často jsou takto chybně vytvořené proteiny cíleny na proteolytickou degradaci. Jedním z důvodů vzácnosti zděděných frame-shift mutací je, že pokud je protein, který je přeložen, nezbytný pro růst pod selektivními tlaky, kterým organismus čelí, může absence funkčního proteinu způsobit letalitu dříve, než je organismus životaschopný.

Překlad začíná řetězcovým iniciačním kodonem (spouštěcím kodonem). Na rozdíl od stop kodonů samotný kodon k zahájení procesu nestačí. K zahájení překladu jsou nutné i blízké sekvence a iniciační faktory. Nejběžnějším spouštěcím kodonem je AUG, který kóduje také methionin, ale používají se i jiné spouštěcí kodony.

Degeneračnost genetického kódu

Mnoho kodonů je nadbytečných, což znamená, že dva nebo více kodonů může kódovat stejnou aminokyselinu. Degenerované kodony se mohou lišit ve svých třetích pozicích; např. GAA i GAG kód pro aminokyselinu glutamovou kyselinu. O kodonu se říká, že je čtyřnásobně degenerovaný, pokud nějaký nukleotid na své třetí pozici specifikuje stejnou aminokyselinu; říká se, že je dvojnásobně degenerovaný, pokud pouze dva ze čtyř možných nukleotidů na své třetí pozici specifikují stejnou aminokyselinu. U dvojnásobně degenerovaných kodonů jsou ekvivalentní nukleotidy na třetí pozici vždy buď dva puriny (A/G) nebo dva pyrimidiny (C/T). Pouze dvě aminokyseliny jsou specifikovány jedním kodonem; jedna z nich je aminokyselina methionin, specifikovaná kodonem AUG, který také specifikuje začátek překladu; druhá je tryptofan, specifikovaný kodonem UGG.
Degenerace genetického kódu je to, co vysvětluje existenci tichých mutací.

Doporučujeme:  Optický disk

Degeneracy má za následek to, že kód trojčat označuje 20 aminokyselin a stop kodon. Protože existují čtyři báze, jsou kodony trojčat vyžadovány k vytvoření nejméně 21 různých kódů. Například pokud by existovaly dvě báze na jeden kodon, pak by mohlo být kódováno pouze 16 aminokyselin (4²=16). Protože je vyžadováno nejméně 21 kódů, pak 4³ dává 64 možných kodonů, což znamená, že musí existovat nějaká degenerace.

Díky těmto vlastnostem genetického kódu je odolnější vůči poruchám bodových mutací. Teoreticky mohou například čtyřnásobné degenerované kodony tolerovat jakoukoliv bodovou mutaci na třetí pozici, i když zkreslení použití kodonu toto v praxi u mnoha organismů omezuje; dvounásobné degenerované kodony mohou tolerovat jednu ze tří možných bodových mutací na třetí pozici. Vzhledem k tomu, že přechodové mutace (purin na purin nebo pyrimidin na pyrimidin mutace) jsou pravděpodobnější než transverzální (purin na pyrimidin nebo naopak) mutace, ekvivalence purinů nebo pyrimidinů na dvojnásobně degenerovaných místech přidává další odolnost vůči poruchám.

Praktickým důsledkem redundance je, že některé chyby v genetickém kódu způsobují pouze tichou mutaci nebo chybu, která by protein neovlivnila, protože hydrofilita nebo hydrofobita je udržována rovnocennou substitucí aminokyselin; například kodon NUN (kde N = jakýkoli nukleotid) má tendenci kódovat hydrofobní aminokyseliny. I tak je to jednobodová mutace, která způsobuje modifikovanou molekulu hemoglobinu při srpkovité anémii. Hydrofilní glutamát (Glu) je nahrazen hydrofobním valinem (Val), který snižuje rozpustnost ß-globinu. V tomto případě tato mutace způsobuje, že hemoglobin vytváří lineární polymery spojené hydrofobní interakcí mezi valinovými skupinami způsobující srpkovitou buněčnou deformaci erytrocytů. Srpkovitá anémie obecně není způsobena de novo mutací. Spíše je selektována v malariálních oblastech (podobně jako talasemie), protože heterozygotní lidé mají určitou odolnost vůči malariálnímu parazitu plasmodium (výhoda heterozygotů).

Tyto proměnné kódy pro aminokyseliny jsou povoleny kvůli modifikovaným bázím v první bázi antikodonu tRNA a vzniklý pár bází se nazývá rozviklaný pár bází. Upravené báze zahrnují inosin a Non-Watson-Crick U-G bázi.

Doporučujeme:  Osvětlení

V některých proteinech jsou nestandardní aminokyseliny nahrazovány standardními stop kodony, v závislosti na přidružených signálních sekvencích v messenger RNA: UGA může kódovat selenocystein a UAG může kódovat pyrrolysin, jak je popsáno v příslušných článcích. Podrobný popis variací v genetickém kódu lze nalézt na webových stránkách NCBI. Mohou však existovat i jiné nestandardní interpretace, které ještě nejsou známy. Sekvenování genomů může odhalit unikátní genetické kódy, které umožňují začlenění dalších nových aminokyselin do proteinů.

Původ genetického kódu

Navzdory existujícím odchylkám jsou genetické kódy používané všemi známými formami života na Zemi velmi podobné. Vzhledem k tomu, že existuje mnoho možných genetických kódů, o kterých se předpokládá, že mají podobnou užitečnost jako ten, který používá pozemský život, evoluční teorie naznačuje, že genetický kód byl vytvořen velmi brzy v historii života.

Lze si položit otázku: je genetický kód zcela náhodný, jen jedna sada korespondence kodon-aminokyselina, která se náhodou etablovala a byla „zamrzlá“ v rané fázi evoluce, i když funkčně by se stejně dobře hodila kterákoli z mnoha dalších možných transkripčních tabulek? Už zběžný pohled na tabulku ukazuje vzory, které naznačují, že tomu tak není.

Existují tři témata procházející mnoha teoriemi, které se snaží vysvětlit vývoj genetického kódu (a tedy i původ těchto vzorců). Jedno z nich je ilustrováno nedávnými experimenty s aptamery, které ukazují, že některé aminokyseliny mají selektivní chemickou afinitu k základním trojčatům, které pro ně kódují. To naznačuje, že současný, složitý transkripční mechanismus zahrnující tRNA a přidružené enzymy může být pozdější vývoj a že původně byly proteinové sekvence přímo šablonovány na bázových sekvencích. Další je, že standardní genetický kód, který vidíme dnes, vyrostl z jednoduššího, staršího kódu procesem „biosyntetické expanze“. Zde je myšlenka, že prvotní život „vynalezl“ nové aminokyseliny (např. jako vedlejší produkty metabolismu) a později některé z nich zpětně začlenil do mašinérie genetického kódování. Ačkoli bylo nalezeno mnoho nepřímých důkazů, které naznačují, že původně mohl být počet různých použitých aminokyselin podstatně menší než dnes, přesné a podrobné hypotézy o tom, které aminokyseliny přesně vstoupily do kódu v jakém pořadí, se ukázaly jako mnohem kontroverznější. Třetí je, že přirozený výběr zorganizoval přiřazení kodonu genetického kódu tak, aby se minimalizovaly účinky genetických chyb (mutací).