F-statistika

V populační genetice F-statistika (také známá jako fixační indexy) popisuje statisticky očekávanou úroveň heterozygozity v populaci; přesněji očekávaný stupeň (obvykle) snížení heterozygozity v porovnání s Hardyho-Weinbergovým očekáváním.

F-statistika může být také považována za měřítko korelace mezi geny nakreslenými na různých úrovních (hierarchicky) rozdělené populace. Tato korelace je ovlivněna několika evolučními procesy, jako je mutace, migrace, příbuzenské křížení, přirozený výběr nebo Wahlundův efekt, ale původně byla navržena tak, aby měřila množství alelické fixace v důsledku genetického driftu.

Koncepci F-statistiky vyvinul ve dvacátých letech americký genetik Sewall Wright, který se zajímal o příbuzenský chov skotu. Protože však naprostá dominance způsobuje, že fenotypy homozygotních dominantů a heterozygotů jsou stejné, až s nástupem molekulární genetiky od šedesátých let bylo možné měřit heterozygozitu v populacích.

F lze použít k definování efektivní velikosti populace.

Měřítka FIS, Fst a FIT souvisí s množstvím heterozygozity na různých úrovních populační struktury. Dohromady se nazývají F-statistika a jsou odvozeny z F, koeficientu příbuzenského křížení. V jednoduchém dvoualelovém systému s příbuzenským křížením jsou genotypové frekvence:

Hodnota F se zjistí vyřešením rovnice pro F pomocí heterozygotů ve výše uvedené inbrední populaci. To se stane jedním minus pozorovaný počet heterozygotů v populaci vydělený očekávaným počtem heterozygotů v Hardyho-Weinbergově rovnováze:

kde očekávaná hodnota v Hardyho–Weinbergově rovnováze je dána

kde p a q jsou četnosti alel A, respektive a. Je to také pravděpodobnost, že na jakémkoli lokusu jsou dvě alely z náhodného individua populace shodné svým původem.

Například, vezměte v úvahu údaje z E.B. Ford (1971) o jedné populaci motýla tygra šarlatového:

Z toho lze vypočítat četnost alel a odvodit očekávání ƒ(AA):

Různé F-statistiky se zaměřují na různé úrovně struktury populace. FIT je koeficient příbuzenského křížení jedince (I) v poměru k celkové (T) populaci, jak je uvedeno výše; FIS je koeficient příbuzenského křížení jedince (I) v poměru k subpopulaci (S), přičemž výše uvedený koeficient se použije pro subpopulace a zprůměruje je; a FST je vliv subpopulací (S) v poměru k celkové populaci (T) a vypočte se vyřešením rovnice:

Doporučujeme:  Fabryho choroba

jak je ukázáno v následující části.

Rozdělení vzhledem ke struktuře populace

FIT lze rozdělit na FST kvůli Wahlundovu efektu a FIS kvůli příbuzenskému křížení.

Představme si populaci, která má populační strukturu dvou úrovní; jednu od jedince (I) k subpopulaci (S) a jednu od subpopulace k celkovému počtu (T). Pak lze celkové F, zde známé jako FIT, rozdělit na FIS (nebo f) a FST (nebo θ):

Ta může být dále dělena pro populační substrukturu a rozšiřuje se podle pravidel binomického rozšiřování, takže pro I oddíly:

Přeformulování definice F by bylo poměrem průměrného počtu rozdílů mezi dvojicemi chromozomů odebranými v rámci diploidních jedinců s průměrným počtem získaným při odběru chromozomů náhodně z populace (bez seskupení na jedince).
Tuto definici lze upravit a zvážit seskupení na subpopulaci místo na jedince. Populační genetici tuto myšlenku použili k měření stupně struktury v populaci.

Bohužel existuje velké množství definic pro Fst, což způsobuje určité nejasnosti ve vědecké literatuře. Obvyklá definice je následující:

kde rozptyl p je vypočítán napříč subpopulacemi a p(1 −p) je očekávaná frekvence heterozygotů.

Je dobře prokázáno, že genetická rozmanitost mezi lidskými populacemi je nízká, i když rozložení genetické rozmanitosti bylo jen zhruba odhadnuto. První studie tvrdily, že 85-90% genetické variace se nachází u jedinců žijících ve stejných populacích v rámci kontinentů (vnitrokontinentální populace) a jen dalších 10-15% se nachází mezi populacemi různých kontinentů (kontinentální populace). Pozdější studie založené na statisících jednonukleotidových polymorfismech (SNP) naznačily, že genetická rozmanitost mezi kontinentálními populacemi je ještě menší a tvoří 3 až 7% Většina těchto studií použila Fst statistiky nebo úzce související statistiky. V roce 2012 provedl Elhaik hierarchickou Fst analýzu a ukázal, že mezi kontinentálními populacemi je rozloženo jen málo (12%) celkové genetické variace a dokonce i menší genetická variace (1%) se nachází mezi vnitrokontinentálními populacemi. Ukázalo se, že globální Fst distribuce úzce sleduje exponenciální distribuci.