Transposable element (TE) je sekvence DNA, která může měnit svou pozici v genomu, někdy vytváří mutace a mění velikost genomu buňky. Transpozice často vede k duplikaci TE. Objev těchto skákajících genů Barbary McClintockové na začátku její kariéry jí vynesl v roce 1983 Nobelovu cenu.[1]
TEs tvoří velký zlomek hodnoty C eukaryotických buněk. Obecně jsou považovány za „junk DNA“. V Oxytricha, která má jedinečný genetický systém, hrají rozhodující roli ve vývoji.[2] Jsou také velmi užitečné pro výzkumníky jako prostředek ke změně DNA uvnitř živého organismu.
Přenosné prvky jsou pouze jedním z několika typů mobilních genetických prvků. Jsou zařazeny do jedné ze dvou tříd podle jejich transpozičního mechanismu, který lze popsat buď jako „copy and paste“ (pro třídy I TES), nebo „cut and paste“ (pro třídy II TES).[3]
Třída I (retrotranspozony):
Kopírují se ve dvou fázích, nejprve z DNA do RNA transkripcí, poté z RNA zpět do DNA reverzní transkripcí. Kopie DNA je pak vložena do genomu v nové pozici. Reverzní transkripce je katalyzována reverzní transkriptázou, která je často kódována samotným TE. Retrotranspozony se chovají velmi podobně jako retroviry, například HIV.
Existují tři hlavní řády retrotranspozonů (jiné řády jsou méně hojné):
Retroviry lze považovat za TEs. Retroviry totiž po vstupu do hostitelské buňky a přeměně své RNA na DNA integrují tuto DNA do DNA hostitelské buňky. Integrovaná forma DNA (provirus) retroviru je považována za zvláště specializovanou formu eukaryotického retrotranspozonu, který je schopen kódovat RNA meziprodukty, které obvykle mohou opustit hostitelské buňky a infikovat další buňky. Transpoziční cyklus retrovirů má také podobnost s cyklem prokaryotických TES. Podobnosti naznačují vzdálený familiární vztah mezi těmito dvěma typy TES.
Třída II (transpozony DNA):
Naproti tomu transpoziční mechanismus cut-and-paste TEs třídy II nezahrnuje RNA meziprodukt. Transpozice jsou katalyzovány různými typy enzymů transposázy. Některé transposázy se mohou vázat nespecificky na jakékoli cílové místo, zatímco jiné se vážou na specifické sekvenční cíle. Transposáza provede na cílovém místě stupňovitý řez, který vytvoří lepivé konce, vyřízne transpozon DNA a podváže ho na cílové místo. DNA polymeráza vyplní vzniklé mezery z lepivých konců a DNA ligáza uzavře kostru z cukru a fosfátu. Výsledkem je duplikace cílového místa a místa vložení transpozonů DNA mohou být identifikována krátkými přímými opakováními (stupňovitý řez v cílové DNA vyplněný DNA polymerázou) následovanými obrácenými opakováními (které jsou důležité pro excizi TE transposázou). Duplikace v cílovém místě může mít za následek genovou duplikaci, která hraje důležitou roli v evoluci[4]:284.
Ne všechny transpozony DNA se transponují mechanismem cut-and-paste. V některých případech je pozorována replikační transpozice, při které se transpozon replikuje do nového cílového místa (např. Helitron (biologie)).
Cut-and-paste TEs mohou být duplikovány, pokud transpozice probíhá během S fáze buněčného cyklu, kdy již bylo „dárcovské“ místo replikováno, ale „cílové“ místo nikoli.
Tento článek je označen od října 2010.
TEs jsou mutageny. Mohou poškodit genom hostitelské buňky různými způsoby [16]:
Mezi nemoci, které jsou často způsobeny TEs, patří hemofilie A a B, těžká kombinovaná imunodeficience, porfyrie, predispozice k rakovině a Duchennova svalová dystrofie.[17][18]
Mnoho TES navíc obsahuje promotory, které řídí transkripci jejich vlastní transposase. Tyto promotory mohou způsobit aberantní expresi propojených genů, což způsobuje onemocnění nebo mutované fenotypy.
Rychlost transpozice, indukce a obrana
Jedna studie odhadla míru transpozice konkrétního retrotranspozonu, prvku Ty1 v Saccharomyces cerevisiae. Za použití několika předpokladů vyšlo najevo, že míra úspěšné transpozice na jeden prvek Ty1 je přibližně jednou za několik měsíců až jednou za několik let.[19]
Buňky se proti šíření TES brání mnoha způsoby. Patří mezi ně piRNA a siRNA[20], které umlčují TES poté, co byly přepsány.
Některé TEs obsahují promotory podobné tepelným šokům a jejich rychlost transpozice se zvyšuje, pokud je buňka vystavena stresu,[21] čímž se za těchto podmínek zvyšuje rychlost mutace, což může být pro buňku prospěšné.
Vývoj TEs a jejich vliv na evoluci genomu je v současné době dynamickým oborem studia.
TEs se vyskytují v mnoha hlavních větvích života. Mohou mít původ v posledním univerzálním společném předkovi, nebo vznikat nezávisle vícekrát, nebo možná vznikat jednou a pak se šířit do dalších království horizontálním přenosem genů.[22] Zatímco některé TEs mohou svým hostitelům přinášet výhody, většina z nich je považována za sobecké DNA parazity. V tomto směru jsou podobné virům. Různé viry a TEs také sdílejí rysy ve svých genomových strukturách a biochemických schopnostech, což vede ke spekulacím, že sdílejí společného předka.
Vzhledem k tomu, že nadměrná aktivita TE může zničit genom, mnoho organismů vyvinulo mechanismy, jak tuto aktivitu inhibovat. Bakterie mohou procházet vysokou mírou genové delece jako součást mechanismu k odstranění TEs a virů z jejich genomů, zatímco eukaryotické organismy používají k inhibici aktivity TE interferenci RNA (RNAi). Nicméně některé TEs vytvořily velké rodiny často spojené se speciačními událostmi.
Evoluce byla obzvláště tvrdá vůči DNA transpozonům. V buňkách obratlovců mají téměř všechny >100 000 DNA transpozonů na genom geny, které kódují neaktivní transposasové polypeptidy.[23] U lidí jsou všechny transpozony podobné Tc1 neaktivní. Výsledkem je, že první DNA transpozon použitý jako nástroj pro genetické účely, transpozonový systém Šípkové Růženky, byl transpozon podobný Tc1/mariner, který byl vzkříšen z dlouhého evolučního spánku.[24]
Interpolované opakování v rámci genomů jsou vytvářeny transpozičními událostmi hromadícími se v průběhu evolučního času. Protože interpolované opakování blokuje konverzi genů, chrání nové genové sekvence před přepsáním podobnými genovými sekvencemi a tím usnadňují vývoj nových genů.
TEs mohly být kooptovány imunitním systémem obratlovců jako prostředek k vytvoření diverzity protilátek: V(D)J rekombinační systém funguje podobným mechanismem jako některé TEs.
První TE byl objeven v rostlinné kukuřici (Zea mays, kukuřičné druhy) a je pojmenován disociator (Ds). Stejně tak první TE, které bylo molekulárně izolováno, bylo z rostliny (Snapdragon).
Vhodné je, že TEs byly zvláště užitečným nástrojem v molekulární biologii rostlin. Výzkumníci je používají jako prostředek mutageneze. V této souvislosti skočí TE do genu a vyvolá mutaci. Přítomnost takového TE poskytuje přímý prostředek identifikace mutované alely, ve srovnání s metodami chemické mutageneze.
Někdy může vložení TE do genu narušovat funkci tohoto genu reverzibilním způsobem, v procesu zvaném inserční mutageneze; transposázou zprostředkovaná excize DNA transpozonu obnovuje funkci genu. Tak vznikají rostliny, v nichž sousední buňky mají různé genotypy. Tato vlastnost umožňuje výzkumníkům rozlišovat mezi geny, které musí být přítomny uvnitř buňky, aby fungovaly (buňka-autonomní) a geny, které vyvolávají pozorovatelné účinky v jiných buňkách, než v těch, kde je gen exprimován.
TEs jsou také široce používaným nástrojem pro mutagenezi většiny experimentálně tažných organismů. Transpozonový systém Šípková Růženka se hojně používá jako vkládací značka pro identifikaci nádorových genů [25]
Transpozonový systém Tc1/mariner třídy TEs Sleeping Beauty, oceněný jako Molekula roku 2009[26], působí v savčích buňkách a je zkoumán pro použití v lidské genové terapii.[27][28][29]
De novo opakovaná identifikace
De novo opakovaná identifikace je prvotní skenování sekvenčních dat, které se snaží najít opakující se oblasti genomu a klasifikovat tyto opakování. Existuje mnoho počítačových programů, které provádějí de novo opakovanou identifikaci, všechny pracují na stejných obecných principech. Vzhledem k tomu, že krátké tandemové opakování mají obecně délku 1-6 párů bází a jsou často po sobě jdoucí, je jejich identifikace relativně jednoduchá.[30] Oproti tomu rozptýlené opakující se prvky jsou obtížněji identifikovatelné, vzhledem k tomu, že jsou delší a často získaly mutace. Je však důležité tyto opakování identifikovat, protože jsou často shledávány jako transposabilní prvky (TEs).[31]
De novo identifikace transpozonů zahrnuje tři kroky: 1) najít všechny opakování v genomu, 2) vybudovat shodu každé skupiny sekvencí a 3) klasifikovat tyto opakování (Makalowski a kol. 2012). Pro první krok existují tři skupiny algoritmů. Jedna skupina je označována jako k-mer přístup, kde k-mer je posloupnost délky k. V tomto přístupu je genom skenován pro nadměrně zastoupené k-mery; tedy k-mery, které se vyskytují častěji, než je pravděpodobné pouze na základě pravděpodobnosti. Délka k je určena typem hledaného transpozonu. K-mer přístup také umožňuje neshody, jejichž počet určuje analytik. Některé programy k-mer přístupu používají k-mer jako základ a prodlužují oba konce každého opakovaného k-meru, dokud mezi nimi není větší podobnost, označující konce opakování.[32] Jiná skupina algoritmů používá metodu zvanou sekvenční samosrovnání. Programy sekvenčního samoporovnávání používají databáze jako AB-BLAST k provedení počátečního zarovnání sekvence. Protože tyto programy nacházejí skupiny prvků, které se částečně překrývají, jsou užitečné pro hledání vysoce odlišných transpozonů, nebo transpozonů s pouze malou oblastí zkopírovaných do jiných částí genomu.[33] Jiná skupina algoritmů se řídí přístupem periodicity. Tyto algoritmy provádějí Fourierovu transformaci sekvenčních dat, identifikují periodicity, oblasti, které se periodicky opakují, a jsou schopny použít vrcholy ve výsledném spektru k nalezení kandidátských opakujících se prvků. Tato metoda funguje nejlépe pro tandemové opakování, ale může být použita i pro rozptýlené opakování. Je to však pomalý proces, což z něj činí nepravděpodobnou volbu pro analýzu genomového měřítka.[34]
Druhý krok de novo opakované identifikace zahrnuje vybudování konsensu každé rodiny sekvencí. Konsensuální sekvence je sekvence, která je vytvořena na základě opakování, které tvoří rodinu TE. Základní pár v konsensu je ten, který se vyskytoval nejčastěji v porovnávaných sekvencích, aby se dosáhlo konsensu. Například v rodině 50 opakování, kde 42 má T základní pár ve stejné pozici, by konsensuální sekvence měla T také v této pozici, protože základní pár je reprezentativní pro rodinu jako celek v této konkrétní pozici a je s největší pravděpodobností základní pár nalezený v předkovi rodiny v této pozici.[35] Jakmile je konsensuální sekvence vytvořena pro každou rodinu, je pak možné přejít k další analýze, jako je klasifikace TE a maskování genomu za účelem kvantifikace celkového obsahu TE v genomu.