Fylogenetický strom, také nazývaný evoluční strom nebo strom života, je strom ukazující evoluční vzájemné vztahy mezi různými druhy nebo jinými entitami, o kterých se předpokládá, že mají společného předka. Ve fylogenetickém stromě představuje každý uzel s potomky nejnovějšího společného předka potomků, přičemž délka hran někdy odpovídá časovým odhadům. Každý uzel ve fylogenetickém stromě se nazývá taxonomická jednotka. Vnitřní uzly se obecně označují jako hypotetické taxonomické jednotky (HTU), protože je nelze přímo pozorovat.
I když myšlenka „stromu“ původně vznikla z dřívějších představ o životě jako postupu z nižších do vyšších forem (Velký řetěz bytí), moderní evoluční biologové stále používají stromy k zobrazení evoluce, protože stále efektivně zachycuje myšlenku speciace, ke které dochází rozštěpením rodokmenů.
Druhy fylogenetických stromů
Obr. 1: Spekulativně zakořeněný strom pro rRNA geny
Obr. 2: Nekořenový strom z čeledi myosinových supergenů
Kořenový fylogenetický strom je směrovaný strom s jedinečným uzlem, který odpovídá (obvykle imputovanému) nejnovějšímu společnému předkovi všech entit na listech stromu. Obrázek 1 znázorňuje kořenový fylogenetický strom, který byl vybarven podle systému tří domén. Nejběžnější metodou pro zakořenění stromů je použití nekontroverzní outgroup – dostatečně blízko, aby bylo možné usuzovat z dat sekvence nebo znaku, ale dostatečně daleko, aby šlo o jasnou outgroup.
Nezakořeněné stromy ilustrují příbuznost listových uzlů, aniž by dělaly předpoklady o původu. Zatímco nezakořeněné stromy mohou být vždy vytvořeny z těch zakořeněných pouhým vynecháním kořene, kořen nemůže být odvozen z nezakořeněného stromu bez nějakého prostředku k identifikaci předků; to se obvykle dělá zahrnutím vnější skupiny do vstupních dat nebo zavedením dodatečných předpokladů o relativních rychlostech vývoje na každé větvi, jako je aplikace hypotézy molekulárních hodin. Obrázek 2 znázorňuje nezakořeněný fylogenetický strom pro myosin, nadrodinu proteinů.
Kořenové i nekořeněné fylogenetické stromy mohou být buď bifurkační, nebo multifurkační a buď označené, nebo neoznačené. Bifurkační strom má maximálně dva potomky vznikající z každého vnitřního uzlu, zatímco multifurkační strom může mít více než dva. Označený strom má přiřazeny specifické hodnoty svým listům, zatímco neoznačený strom, někdy nazývaný tvar stromu, definuje pouze topologii. Počet možných stromů pro daný počet listových uzlů závisí na konkrétním typu stromu, ale vždy existuje více multifurkačních stromů než bifurkačních stromů, více označených než neoznačených stromů a více zakořeněných než nekořeněných stromů. Poslední rozdíl je biologicky nejrelevantnější; vzniká proto, že na nekořenovaném stromě je mnoho míst, kam se dá kořen. Pro označené bifurkační stromy existují
celkový počet nekořeněných stromů, kde n představuje počet listových uzlů. Počet nekořeněných stromů pro n vstupních sekvencí nebo druhů se rovná počtu zakořeněných stromů pro n-1 sekvencí.
Dendrogram je široký termín pro diagrammatické znázornění fylogenetického stromu.
Kladogram je strom vytvořený kladistickými metodami. Tento typ stromu představuje pouze vzor větvení, tj. jeho délka větví nepředstavuje čas.
Fylogram je fylogenetický strom, který explicitně reprezentuje počet znakových změn prostřednictvím délky větví.
Chronogram je fylogenetický strom, který explicitně reprezentuje evoluční čas prostřednictvím délky větví.
Stavba fylogenetických stromů
Fylogenetické stromy mezi netriviálním počtem vstupních sekvencí jsou konstruovány pomocí výpočetních fylogenetických metod. Metody vzdálenostní matice, jako je sousedské spojování, které vyžadují vícenásobné sekvenční zarovnání pro výpočet genetické vzdálenosti, jsou nejjednodušší na implementaci; mnoho sekvenčních zarovnávacích metod, jako je ClustalW, produkuje jak sekvenční zarovnání, tak fylogenetické stromy. Jiné metody zahrnují techniky maximální parsimonie a pravděpodobnostní inference, jako je maximální pravděpodobnost; Bayesovská inference byla také aplikována na fylogenetiku, ale byla kontroverzní. Identifikace optimálního stromu pomocí mnoha z těchto technik je NP-úplná nebo NP-tvrdá, takže heuristické vyhledávací a optimalizační metody jsou používány v kombinaci s funkcemi stromového bodování pro identifikaci přiměřeně dobrého stromu, který odpovídá datům.
Metody budování stromů lze posuzovat na základě několika kritérií:
Pozornost matematiků si získaly také techniky pro stavbu stromů. Stromy lze také stavět pomocí T-teorie.
Omezení fylogenetických stromů
Ačkoli fylogenetické stromy produkované na základě sekvenovaných genů nebo genomických dat u různých druhů mohou poskytnout evoluční vhled, mají důležitá omezení. Fylogenetické stromy nemusí nutně (a pravděpodobně ani nemusí) představovat skutečnou evoluční historii. Data, na kterých jsou založeny, jsou hlučná; horizontální přenos genů, hybridizace mezi druhy, které nebyly nejbližšími sousedy na stromě před hybridizací, konvergentní evoluce a konzervované sekvence, to vše může zmást analýzu. Jedna metoda analýzy implementovaná v programu PhyloCode nepředpokládá stromovou strukturu, aby se předešlo těmto omezením.
Kromě toho může být problematické zakládat analýzu na jediném genu nebo bílkovině odebrané ze skupiny druhů, protože takové stromy sestavené z jiného nepříbuzného genu nebo sekvence bílkovin se často liší od prvního, a proto je třeba velké opatrnosti při odvozování fylogenetických vztahů mezi druhy. Nejvíce to platí pro genetický materiál, který podléhá laterálnímu přenosu genů a rekombinaci, kdy různé bloky haplotypu mohou mít různou historii.
Když jsou vyhynulé druhy zařazeny do stromu, měly by být vždy konečnými uzly, protože je nepravděpodobné, že by byly přímými předky jakéhokoli vyhynulého druhu. Skepticismus musí platit, když jsou vyhynulé druhy zařazeny do stromů, které jsou zcela nebo částečně založeny na údajích sekvence DNA, díky důkazům, že „starověká DNA“ není zachována neporušená déle než 100 000 let.[Jak odkazovat a odkaz na shrnutí nebo text]