Noncoding DNA

V genetice nekódující DNA popisuje komponenty sekvencí DNA organismu, které nekódují proteinové sekvence. V mnoha eukaryotech je velké procento celkové velikosti genomu organismu nekódující DNA, i když množství nekódující DNA a poměr mezi kódováním a nekódující DNA se mezi jednotlivými druhy značně liší.

Velká část této DNA nemá žádnou známou biologickou funkci a svého času byla někdy označována jako „junk DNA“. Nicméně mnoho typů nekódujících sekvencí DNA má známé biologické funkce, včetně transkripční a translační regulace sekvencí kódujících proteiny. Jiné nekódující sekvence mají pravděpodobné, ale dosud neurčené funkce (to je odvozeno z vysoké úrovně homologie a konzervace pozorované u sekvencí, které nekódují proteiny, ale přesto
se zdají být pod silným selektivním tlakem).

Frakce nekódující genomové DNA

Množství celkové genomové DNA se mezi organismy značně liší a také podíl kódování a nekódování DNA v těchto genomech se značně liší. Více než 98% lidského genomu nekóduje sekvence proteinů, včetně většiny sekvencí v intronech a většiny intergenní DNA.

I když celková velikost genomu a potažmo množství nekódující DNA koreluje se složitostí organismu, existuje mnoho výjimek. Například genom jednobuněčného Polychaos dubium (dříve známého jako Amoeba dubia) obsahuje více než 200krát větší množství DNA než u lidí. Genom pufferfish Takifugu rubripes je jen asi osmina velikosti lidského genomu, přesto se zdá, že má srovnatelný počet genů; přibližně 90% genomu Takifugu je nekódující DNA a většina rozdílů ve velikosti genomu se zdá být v nekódující DNA. Rozsáhlá variace ve velikosti nukleárního genomu mezi eukaryotickými druhy je známá jako enigma hodnoty C nebo paradox hodnoty C.

Asi 80 procent nukleotidových bází v lidském genomu může být přepsáno, ale transkripce nemusí nutně znamenat funkci.

Typy nekódujících sekvencí DNA

Nekódující RNA jsou funkční molekuly RNA, které nejsou přeloženy do proteinu. Příklady nekódující RNA zahrnují ribozomální RNA, transferovou RNA, Piwi-interagující RNA a mikroRNA.

Předpokládá se, že mikroRNA kontrolují translační aktivitu přibližně 30% všech genů kódujících bílkoviny u savců a mohou být životně důležitými složkami při progresi nebo léčbě různých onemocnění včetně rakoviny, kardiovaskulárních onemocnění a reakce imunitního systému na infekci.

Cis- a Transregulační prvky

Cis-regulační prvky jsou sekvence, které řídí transkripci blízkého genu. Cis-prvky se mohou nacházet v 5′ nebo 3′ nepřeložených oblastech nebo uvnitř intronů. Transregulační prvky řídí transkripci vzdáleného genu.

Promotory usnadňují transkripci konkrétního genu a jsou typicky proti proudu kódující oblasti. Enhancerové sekvence mohou mít také velmi vzdálené účinky na transkripční úrovně genů.

Doporučujeme:  Etnická protekce

Introny jsou nekódující úseky genu, přepsané do prekurzorové mRNA sekvence, ale nakonec odstraněné sestřihem RNA během zpracování do zralé messenger RNA. Mnoho intronů se jeví jako mobilní genetické prvky.

Studie intronů skupiny I z Tetrahymeny naznačují, že některé introny se zdají být sobeckými genetickými prvky, neutrálními vůči hostiteli, protože se během zpracování RNA samy odstraňují z boků exonů a nevytvářejí expresivní zkreslení mezi alelami s intronem a bez něj. Některé introny se zdají mít významnou biologickou funkci, možná díky ribozymové funkčnosti, která může regulovat aktivitu tRNA a rRNA, stejně jako expresi genů kódujících proteiny, což je patrné u hostitelů, kteří se stali závislými na takových intronech po dlouhou dobu; například trnL-intron se nachází ve všech zelených rostlinách a zdá se, že byl vertikálně děděn po několik miliard let, včetně více než miliardy let v rámci chloroplastů a dalších 2-3 miliardy let před tím u sinic předků chloroplastů.

Pseudogeny jsou sekvence DNA, příbuzné se známými geny, které ztratily schopnost kódovat proteiny nebo se již jinak v buňce neprojevují. Pseudogeny vznikají retrotranspozicí nebo genomovou duplikací funkčních genů a stávají se „genomickými fosíliemi“, které jsou nefunkční kvůli mutacím, které brání transkripci genu, například v oblasti genového promotoru, nebo fatálně mění translaci genu, jako jsou předčasné stop kodony nebo frameshifty. Pseudogeny vzniklé retrotranspozicí RNA meziproduktu jsou známé jako zpracované pseudogeny; pseudogeny, které vznikají z genomických pozůstatků duplicitních genů nebo reziduí inaktivovaných genů, jsou nezpracované pseudogeny.

Zatímco Dollův zákon naznačuje, že ztráta funkce u pseudogenů je pravděpodobně trvalá, umlčené geny si mohou ve skutečnosti zachovat funkci několik milionů let a mohou být „reaktivovány“ do sekvencí kódujících proteiny a podstatný počet pseudogenů je aktivně přepsán. Protože se předpokládá, že se pseudogeny mění bez evolučního omezení, mohou sloužit jako užitečný model typu a frekvence různých spontánních genetických mutací.

Opakované sekvence, transpozony a virové elementy

Transpozony a retrotranspozony jsou mobilní genetické prvky. Retrotranspozonové opakované sekvence, které zahrnují dlouhé intersperované jaderné prvky (LINEs) a krátké intersperované jaderné prvky (SINEs), tvoří u mnoha druhů velkou část genomických sekvencí. Alu sekvence, klasifikované jako krátký intersperovaný jaderný prvek, jsou nejrozšířenějšími mobilními prvky v lidském genomu. Bylo zjištěno několik příkladů, kdy SINEs uplatňují transkripční kontrolu některých genů kódujících proteiny.

Doporučujeme:  Umělá neuronová síť

Endogenní retrovirové sekvence jsou produktem reverzní transkripce retrovirových genomů do genomů zárodečných buněk. Mutace v rámci těchto retro-transkribovaných sekvencí může virový genom inaktivovat.

Více než 8% lidského genomu tvoří (většinou rozpadlé) endogenní retrovirové sekvence jako součást více než 42% frakce, která je rozpoznatelně odvozena z retrotranspozonů, zatímco další 3% lze identifikovat jako pozůstatky DNA transpozonů. Předpokládá se, že velká část zbývající poloviny genomu, která je v současnosti bez vysvětleného původu, našla svůj původ v transposabilních prvcích, které byly aktivní tak dávno (> 200 milionů let), že je náhodné mutace učinily nerozpoznatelnými. Rozdíly ve velikosti genomu nejméně u dvou druhů rostlin jsou většinou výsledkem retrotranspozonových sekvencí.

Telomery jsou oblasti opakující se DNA na konci chromozomu, které poskytují ochranu před zhoršením chromozomů během replikace DNA.

Funkce nekódující DNA

Mnoho nekódujících sekvencí DNA má důležité biologické funkce, jak naznačují srovnávací genomické studie, které uvádějí některé oblasti nekódující DNA, které jsou vysoce konzervované, někdy v časových škálách představujících stovky milionů let, což znamená, že tyto nekódující oblasti jsou pod silným evolučním tlakem a pozitivním výběrem. Například v genomech lidí a myší, které se lišily od společného předka před 65-75 miliony let, tvoří sekvence DNA kódující proteiny jen asi 20% konzervované DNA, přičemž zbývající většina konzervované DNA je zastoupena v nekódujících oblastech. Mapování vazeb často identifikuje chromozomální oblasti spojené s onemocněním bez důkazů o funkčních kódovacích variantách genů v dané oblasti, což naznačuje, že genetické varianty způsobující onemocnění leží v nekódující DNA.

Některé specifické sekvence nekódující DNA mohou být vlastnostmi nezbytnými pro strukturu chromozomů, funkci centromer a rozpoznávání homologů při meióze.

Podle srovnávací studie více než 300 prokaryotických a více než 30 eukaryotických genomů se zdá, že eukaryota vyžadují minimální množství nekódující DNA. Toto minimální množství lze předpovědět pomocí růstového modelu pro regulační genetické sítě, což znamená, že je vyžadováno pro regulační účely. U lidí je předpokládané minimum asi 5% celkového genomu.

Některé nekódující sekvence DNA jsou genetické „přepínače“, které regulují, kdy a kde jsou geny exprimovány.

Regulace genové exprese

Některé nekódující sekvence DNA určují úroveň exprese různých genů.

Některé nekódující sekvence DNA určují, kde se transkripční faktory vážou. Transkripční faktor je bílkovina, která se váže na specifické nekódující sekvence DNA, a tím kontroluje tok (nebo transkripci) genetické informace z DNA do mRNA. Transkripční faktory působí na velmi rozdílných místech genomů různých lidí.

Doporučujeme:  Lokální anestetika

Operátor je segment DNA, na který se váže represor. Represor je protein vázající DNA, který reguluje expresi jednoho nebo více genů tím, že se váže na operátora a blokuje vazbu RNA polymerázy na promotor, čímž zabraňuje transkripci genů. Toto blokování exprese se nazývá represe.

Enhancer je krátká oblast DNA, která se může vázat na proteiny (trans-acting factors), podobně jako soubor transkripčních faktorů, za účelem zvýšení transkripčních hladin genů v genovém shluku.

Promotor je oblast DNA, která usnadňuje transkripci určitého genu. Promotoři se obvykle nacházejí v blízkosti genů, které regulují.

Noncoding DNA a evoluce

Sdílené sekvence zjevně nefunkční DNA jsou hlavní linií důkazů pro společný původ.

Zdá se, že pseudogenní sekvence akumulují mutace rychleji než kódovací sekvence v důsledku ztráty selektivního tlaku. To umožňuje tvorbu mutovaných alel, které zahrnují nové funkce, jež mohou být upřednostňovány přirozeným výběrem; tudíž pseudogeny mohou sloužit jako surovina pro evoluci a mohou být považovány za „protogeny“.

Junk DNA, termín, který zavedl v roce 1972 Susumu Ohno, byl prozatímní označení pro části sekvence genomu, pro které nebyla identifikována žádná rozpoznatelná funkce. Podle recenze z roku 1980 v časopise Nature od Leslieho Orgela a Francise Cricka má junk DNA „malou specificitu a poskytuje organismu malou nebo žádnou selektivní výhodu“. Termín je však v současnosti zastaralý pojem, používá se hlavně v populární vědě a hovorově ve vědeckých publikacích a může zpomalit výzkum biologických funkcí nekódující DNA. Několik linií důkazů naznačuje, že mnoho sekvencí „junk DNA“ má pravděpodobně neidentifikovanou funkční aktivitu a jiné sekvence mohly mít funkce v minulosti.

Přesto se zdá, že významná část sekvence genomů eukaryotických organismů v současné době nespadá do žádné jiné existující klasifikace než „junk“. Například jeden experiment odstranil 0,1% myšího genomu bez zjistitelného účinku na fenotyp. Tento výsledek naznačuje, že odstraněná DNA byla z velké části nefunkční. Navíc jsou tyto sekvence obohaceny o heterochromatickou histonovou modifikaci H3K9me3.

Nekódující DNA a korelace dlouhého rozsahu

Bylo zjištěno statistické rozlišení mezi kódováním a nekódujícími sekvencemi DNA. Bylo zjištěno, že nukleotidy v nekódujících sekvencích DNA vykazují dalekosáhlé pravomocné korelace, zatímco kódovací sekvence nikoliv.