Tento stylistický schematický diagram znázorňuje gen ve vztahu ke struktuře dvojité šroubovice DNA a k chromozomu (vpravo). Introny jsou oblasti, které se často nacházejí v genech eukaryot a které jsou odstraněny v procesu slučování: pouze exony kódují protein. Tento diagram označuje oblast o pouhých 40 bázích jako gen. Ve skutečnosti je mnoho genů mnohem větších, stejně jako introny a exony.
Geny jsou jednotky dědičnosti v živých organismech. Jsou zakódovány v genetickém materiálu organismu (obvykle DNA nebo RNA) a řídí vývoj a chování organismu. Během rozmnožování je genetický materiál předáván z rodiče (rodičů) na potomka. Genetický materiál může být předáván i mezi nespřízněnými jedinci (např. transfekcí nebo na virech). Geny kódují informace nezbytné pro konstrukci chemických látek (proteinů atd.) potřebných pro fungování organismu.
Slovo „gen“ (vytvořené v roce 1909 dánským botanikem Wilhelmem Johannsenem) pochází z řeckého genosu („původ“) a je společné mnoha oborům, včetně klasické genetiky, molekulární genetiky, evoluční biologie a populační genetiky. Protože každá disciplína modeluje biologii života odlišně, použití slova gen se mezi obory liší. Může označovat buď materiální, nebo konceptuální entity.
Po objevu, že DNA je genetický materiál, a s růstem biotechnologie a projektem sekvence lidského genomu se v běžném používání slova „gen“ stále více odráží jeho význam v molekulární biologii, konkrétně v segmentech DNA, které buňky přepisují do RNA a alespoň částečně překládají do proteinů. Projekt Sekvenční ontologie definuje gen jako: „Lokalizovatelná oblast genomové sekvence, odpovídající jednotce dědičnosti, která je spojena s regulačními oblastmi, přepisovanými oblastmi a/nebo jinými oblastmi funkčních sekvencí“.
V běžné řeči se „gen“ často používá k odkazu na dědičnou příčinu rysu, nemoci nebo stavu – jako v „genu pro obezitu“. Přesněji řečeno, biolog může odkazovat na alelu nebo mutaci, která byla zapletena do obezity nebo je s ní spojena. Je to proto, že biologové vědí, že o tom, zda je člověk obézní či ne, rozhoduje mnoho jiných faktorů než geny: například stravovací návyky, cvičení, prenatální prostředí, výchova, kultura a dostupnost potravin.
Navíc je velmi nepravděpodobné, že by variace v rámci jednoho genu – nebo jediného genetického lokusu – plně určovaly genetickou predispozici člověka k obezitě. Tyto aspekty dědičnosti – souhra mezi geny a prostředím, vliv mnoha genů – se zdají být normou s ohledem na mnoho a možná většinu („komplexních“ nebo „multifaktorických“) rysů. Termín fenotyp odkazuje na charakteristiky, které vyplývají z této souhry (viz rozlišení genotyp-fenotyp).
V molekulární biologii je gen považován za oblast DNA (nebo RNA, v případě některých virů), která určuje strukturu proteinu (kódovací sekvence), společně s oblastí DNA, která kontroluje, kdy a kde bude protein vyroben (regulační sekvence). Genetický kód určuje, jak je kódovací sekvence DNA převedena na proteinovou sekvenci (transkripce a translace). Genetický kód je v podstatě stejný pro všechny známé druhy života, od bakterií po lidi.
Prostřednictvím bílkovin, které kódují, řídí geny buňky, v nichž sídlí. V mnohobuněčných organismech řídí vývoj jedince z oplodněného vajíčka a každodenní funkce buněk, které tvoří tkáně a orgány. Přístrojové role jejich bílkovinných produktů sahají od mechanické podpory buněčné struktury až po přepravu a výrobu jiných molekul a regulaci činnosti jiných bílkovin.
Geny, které dnes existují, jsou ty, které se v minulosti úspěšně rozmnožily. Mnohé jednotlivé organismy často sdílejí gen; smrt jedince tedy nemusí znamenat zánik genu. Pokud totiž obětování jednoho jedince zvyšuje přežití dalších jedinců se stejným genem, může smrt jedince zvýšit celkové přežití genu. To je základ sobeckého genového názoru, který zpopularizoval Richard Dawkins. Ten ve své knize Sobecký gen poukazuje na to, že k tomu, aby byly geny úspěšné, nemusí mít jiný „účel“ než se množit, a to i na úkor prospěchu svého hostitelského organismu. Člověk, který by se takto choval, by byl označen za „sobeckého“, i když sobecký gen může paradoxně podporovat altruistické chování. Podle Dawkinse může být možná neuspokojivou odpovědí na otázku „jaký je smysl života?“ přežívání a zachovávání ribonukleových kyselin a s nimi spojených bílkovin.
V důsledku vzácných, spontánních chyb (např. při replikaci DNA) mohou vzniknout mutace v sekvenci genu. Jakmile se tato mutace rozšíří do další generace, může vést k variacím v rámci druhové populace. Varianty jednoho genu jsou známé jako alely a rozdíly v alelách mohou vést k rozdílům ve vlastnostech, např. v barvě očí. Nejběžnější alela genu se nazývá wild type allele a vzácné alely se nazývají mutanty.
Ve většině případů je RNA meziproduktem v procesu výroby proteinů z genů. Pro některé genové sekvence jsou však molekuly RNA skutečnými funkčními produkty. Například RNA známé jako ribozymy jsou schopné enzymatické funkce a malé interferující RNA mají regulační roli. Sekvence DNA, z nichž jsou takové RNA přepisovány, jsou známé jako nekódující RNA, neboli geny RNA.
Většina živých organismů nese své geny a přenáší je na potomky jako DNA, ale některé viry nesou pouze RNA. Protože používají RNA, jejich buněční hostitelé mohou syntetizovat své proteiny, jakmile jsou infikovány, a bez prodlení s čekáním na transkripci. Na druhou stranu RNA retroviry, jako je AIDS, vyžadují reverzní transkripci svého genomu z RNA do DNA, než mohou být jejich proteiny syntetizovány.
Pro každý známý lidský gen schvaluje HUGO Gene Nomenclature Committee (HGNC) název genu a symbol (zkrácená zkratka). Všechny schválené symboly jsou uloženy v databázi HGNC. Každý symbol je jedinečný a každému genu je přidělen pouze jeden schválený genový symbol. Pro každý gen je nutné poskytnout jedinečný symbol, aby o něm lidé mohli mluvit. To také usnadňuje elektronické vyhledávání dat z publikací. Přednostně každý symbol udržuje paralelní konstrukci u různých členů genové rodiny a může být použit u jiných druhů, zejména u myši.
Typický počet genů v organismu
V uvedené tabulce jsou uvedeny typické počty genů a velikost genomu pro některé organismy. Odhady počtu genů v organismu jsou poněkud kontroverzní, protože závisejí na objevu genů, a v současné době neexistují žádné techniky, které by dokazovaly, že sekvence DNA neobsahuje žádný gen. (V rané genetice mohly být geny identifikovány pouze v případě, že existovaly mutace, nebo alely.) Odhady jsou nicméně založeny na současných znalostech.
Chemie a funkce genů
Chemická struktura genu
Čtyři druhy sekvenčně vázaných nukleotidů tvoří molekulu nebo vlákno DNA (více v DNA). Tyto čtyři nukleotidy tvoří genetickou abecedu. Sekvence tří po sobě jdoucích nukleotidů, nazývaná kodon, je slovník kódující proteiny. Sekvence kodonů v genu určuje aminokyselinovou sekvenci proteinu, který kóduje.
U většiny eukaryotických druhů jen velmi málo DNA v genomu kóduje proteiny a geny mohou být odděleny rozsáhlými sekvencemi tzv. nevyžádané DNA. Geny jsou navíc často vnitřně fragmentovány nekódujícími sekvencemi zvanými introny, které mohou být mnohonásobně delší než kódovací sekvence. Introny se odstraňují hned po transkripci splétáním. V primárním molekulárním smyslu však představují části genu.
Všechny geny a zasahující DNA dohromady tvoří genom organismu, který je u mnoha druhů rozdělen mezi několik chromozomů a obvykle je přítomen ve dvou nebo více kopiích. Umístění (nebo lokus) genu a chromozomu, na kterém se nachází, je v jistém smyslu libovolné. Geny, které se objevují společně na chromozomech jednoho druhu, například u člověka, se mohou objevit na samostatných chromozomech u jiného druhu, například u myší. Dva geny umístěné blízko sebe na chromozomu mohou kódovat proteiny, které figurují ve stejném buněčném procesu nebo ve zcela nesouvisejících procesech. Jako příklad prvního z nich lze uvést, že mnoho genů zapojených do spermatogeneze sídlí společně na chromozomu Y.
Mnoho druhů přenáší více než jednu kopii svého genomu v každé ze svých somatických buněk. Tyto organismy se nazývají diploidní, pokud mají dvě kopie, nebo polyploidní, pokud mají více než dvě kopie. U takových organismů nejsou kopie prakticky nikdy identické. S ohledem na každý gen jsou kopie, které jedinec vlastní, pravděpodobně odlišnými alelami, které mohou působit synergicky nebo antagonisticky a vytvářet znak nebo fenotyp. Způsoby interakce genových kopií se vysvětlují vztahy chemické dominance (více v genetice, alela).
Exprese molekulárních genů
Z různých důvodů není vztah mezi řetězcem DNA a fenotypovým rysem přímý. Stejný řetězec DNA u dvou různých jedinců může mít za následek rozdílné rysy v důsledku působení jiných řetězců DNA nebo prostředí.
Tento složitý proces pomáhá vysvětlit různé významy „genu“:
Druhý význam genu je výsledkem více „hmotné entity“ než první.
Stejně jako existuje mnoho faktorů ovlivňujících expresi konkrétního řetězce DNA, existuje mnoho způsobů, jak mít genetické mutace.
Například přirozené variace v rámci regulačních sekvencí se zdají být základem mnoha dědičných vlastností pozorovaných u organismů. Vliv takových variací na trajektorii evoluce prostřednictvím přirozeného výběru může být stejně velký nebo větší než variace v sekvencích, které kódují proteiny. Tudíž ačkoli se regulační prvky v molekulární biologii často odlišují od genů, ve výsledku uspokojují sdílený a historický smysl tohoto slova. Chovatel nebo genetik totiž při sledování dědičného vzorce znaku nemá žádný bezprostřední způsob, jak zjistit, zda tento vzorec vzniká z kódování sekvencí nebo regulačních sekvencí. Obvykle jej jednoduše přisoudí variacím v rámci genu.
Chyby během replikace DNA mohou vést k duplikaci genu, který se může časem lišit. I když obě sekvence mohou zůstat stejné nebo mohou být jen mírně pozměněny, jsou obvykle považovány za samostatné geny (tj. ne za alely stejného genu). Totéž platí, pokud se duplicitní sekvence objeví u různých druhů. Přesto, i když se alely genu liší v sekvenci, jsou přesto považovány za jediný gen (obsazující jediný lokus).
Existenci genů poprvé naznačil Gregor Mendel, který v šedesátých letech 19. století studoval dědičnost v rostlinách hrachu a vyslovil hypotézu o faktoru, který přenáší znaky z rodiče na potomka. Ačkoli nepoužil termín gen, vysvětlil své výsledky pomocí dědičných znaků. Mendel byl také první, kdo vyslovil hypotézu o nezávislém sortimentu, rozdílu mezi dominantními a recesivními znaky, rozdílu mezi heterozygotou a homozygotou a rozdílu mezi tím, co by později bylo popsáno jako genotyp a fenotyp. Mendelův koncept byl nakonec pojmenován, když Wilhelm Johannsen v roce 1909 vytvořil slovo gen.
Na počátku 20. století se Mendelově práci opět dostalo pozornosti vědců. V roce 1910 Thomas Hunt Morgan ukázal, že geny sídlí na specifických chromozomech. Později ukázal, že geny zaujímají specifická místa na chromozomech. S těmito znalostmi Morgan a jeho studenti začali s první chromozomální mapou octomilky Drosophila. V roce 1928 Frederick Griffith ukázal, že geny lze přenášet. V tom, co je dnes známo jako Griffithův experiment, injekce smrtícího kmene bakterií, které byly tepelně usmrceny, přenesly genetickou informaci na bezpečný kmen stejné bakterie a myš zabily.
V roce 1941 George Wells Beadle a Edward Lawrie Tatum ukázali, že mutace v genech způsobují chyby v určitých krocích metabolických drah. To ukázalo, že specifické geny kódují specifické proteiny, což vedlo k hypotéze „jeden gen, jeden enzym“. Oswald Avery, Collin Macleod a Maclyn McCarty ukázali v roce 1944, že DNA obsahuje informace o genu. V roce 1953 James D. Watson a Francis Crick demonstrovali molekulární strukturu DNA. Společně tyto objevy vytvořily ústřední dogma molekulární biologie, které říká, že proteiny se překládají z RNA, která se přepisuje z DNA. Od té doby se ukázalo, že toto dogma má výjimky, jako je reverzní transkripce u retrovirů.
Evoluční koncept genu
George C. Williams poprvé ve své knize Adaptation and Natural Selection (Přizpůsobení a přirozený výběr) výslovně obhajoval pohled na evoluci zaměřený na gen. Navrhl také evoluční koncept genu, který má být použit, když mluvíme o přirozeném výběru upřednostňujícím nějaký gen. Definice zní: „ten, který segreguje a rekombinuje s citelnou frekvencí.“ Podle této definice by i asexuální genom mohl být považován za gen, pokud má citelnou stálost po mnoho generací.
Rozdíl je v tom, že molekulární gen se přepisuje jako jednotka a evoluční gen se dědí jako jednotka.
Richard Dawkins v knize The Selfish Gene and The Extended Phenotype obhajoval myšlenku, že gen je jediným replikátorem v živých systémech. To znamená, že pouze geny přenášejí svou strukturu do značné míry neporušenou a jsou potenciálně nesmrtelné ve formě kopií. Geny by tedy měly být jednotkou výběru.