V molekulární biologii a genetice se propojení dvou dusíkatých bází na protilehlé komplementární DNA nebo určitých typech řetězců RNA, které jsou spojeny vodíkovými vazbami, nazývá párem bází (často zkráceně bp). V kanonickém Watsonově-Crickově párování bází DNA tvoří adenin (A) pár bází s thyminem (T) a guanin (G) tvoří pár bází s cytosinem (C). V RNA je thymin nahrazen uracilem (U). Také se vyskytují alternativní vzory vodíkových vazeb, jako je rozviklaný pár bází a Hoogsteenův pár bází, což vede – zejména v RNA – ke vzniku komplexních a funkčních terciálních struktur. Párování je mechanismus, kterým jsou kodony na molekulách RNA messengeru rozpoznávány antikodony na transferové RNA během proteinového překladu. Některé DNA nebo RNA-vazebné enzymy mohou rozpoznat specifické vzory párování bází, které identifikují konkrétní regulační oblasti genů.
Velikost jednotlivého genu nebo celého genomu organismu se často měří v párech bází, protože DNA je obvykle dvouvláknová. Počet celkových párů bází se tedy rovná počtu nukleotidů v jednom z řetězců (s výjimkou nekódujících jednovláknových oblastí telomer). Haploidní lidský genom (23 chromozomů) je odhadován na délku asi 3 miliardy párů bází a obsahuje 20 000 – 25 000 odlišných genů.[1] Kilobáza (kb) je měrná jednotka v molekulární biologii rovnající se 1000 párů bází DNA nebo RNA.[2]
Vazba vodíku a stabilita
Dvojice bází GC demonstrující tři intermolekulární vodíkové vazby
Dvojice AT bází demonstrující dvě intermolekulární vodíkové vazby
Vazba vodíku je chemická interakce, která je základem výše popsaných pravidel pro párování bází. Vhodná geometrická shoda dárců a akceptorů vodíkových vazeb umožňuje stabilní tvorbu pouze „správných“ párů. DNA s vysokým obsahem GC je stabilnější než DNA s nízkým obsahem GC, ale na rozdíl od všeobecného přesvědčení vodíkové vazby DNA výrazně nestabilizují a stabilizace je způsobena především interakcemi při skládání.[3]
Spárované molekuly DNA a RNA jsou při pokojové teplotě poměrně stabilní, ale oba nukleotidové řetězce se oddělí nad bodem tání, který je určen délkou molekul, rozsahem chybného spárování (pokud existuje) a obsahem GC. Vyšší obsah GC vede k vyšším teplotám tání; není proto překvapením, že genomy extremofilních organismů, jako je Thermus thermophilus, jsou obzvláště bohaté na GC. Naopak oblasti genomu, které se potřebují často oddělovat – například promotorové oblasti pro často přepisované geny – jsou poměrně chudé na GC (například viz rámeček TATA). Obsah GC a teplota tání musí být také vzaty v úvahu při navrhování primerů pro PCR reakce.
Interakce základního skládání v DNA a RNA jsou způsobeny přitahováním disperze, odpuzováním výměny krátkého dosahu a elektrostatickými interakcemi, které také přispívají ke stabilitě.[4] Opět platí, že interakce GC skládání s přilehlými bázemi bývají příznivější. (Všimněte si však, že interakce GC skládání s dalším párem bází je geometricky odlišná od interakce CG.) Účinky základního skládání jsou zvláště důležité v sekundární struktuře a terciární struktuře RNA; například struktury RNA kmenové smyčky jsou stabilizovány skládáním bází v oblasti smyčky.
Základní analoga a mezialatory
Chemické analogie nukleotidů mohou nahradit řádné nukleotidy a vytvořit nekanonické párování bází, což vede k chybám (většinou bodovým mutacím) v replikaci DNA a transkripci DNA. Je to způsobeno jejich izotermickou chemií. Jedním z běžných analogů mutagenních bází je 5-bromouracil, který se podobá thyminu, ale může se ve své enolové formě párovat s guaninem.
Jiné chemikálie, známé jako DNA interalatory, zapadají do mezery mezi sousedními bázemi na jednom vlákně a vyvolávají framovité mutace tím, že se „maskují“ jako báze, což způsobuje, že zařízení pro replikaci DNA vynechává nebo vkládá další nukleotidy do místa mezialace. Většina interalatorů jsou velké polyaromatické sloučeniny a jsou známy nebo existuje podezření na karcinogeny. Příkladem jsou ethidium-bromid a akridin.
Následující sekvence DNA ilustrují párové dvouvláknové vzory. Podle konvence se horní vlákno píše od 5′ konce do 3′ konce; tedy spodní vlákno se píše od 3′ do 5′.
Pro popis délky molekuly D/RNA se běžně používají následující zkratky:
V případě jednovláknové DNA/RNA jsou použity jednotky nukleotidů, zkratka nt (nebo knt, Mnt, Gnt), neboť nejsou spárovány.
Pro rozlišení jednotek počítačového úložiště a bází kbp lze pro páry bází použít Mbp, Gbp atd. Délka 16S rDNA pro bakterie je 1542 párů bází na délku.
Centimorgan se také často používá k určení vzdálenosti podél chromozomu, ale počet párů bází, kterým odpovídá, se značně liší. V lidském genomu je centimorgan asi 1 milion párů bází.[5][6]