Kladistika

Adaptace
Genetický drift
Tok genů
Mutace
Výběr
Speciace

Důkazy
Historie
Moderní syntéza
Sociální efekt

Ekologická genetika
Evoluční vývoj
Lidská evoluce
Molekulární evoluce
Fylogenetika
Populační genetika

Kladistika je hierarchická klasifikace druhů založená na evolučních předcích. Kladistika se odlišuje od ostatních taxonomických klasifikačních systémů, protože se zaměřuje na evoluci (spíše než na podobnosti mezi druhy), a protože klade velký důraz na objektivní, kvantitativní analýzu. Kladistika generuje diagramy zvané kladogramy, které představují evoluční strom života. Data sekvenování DNA a RNA se používají v mnoha důležitých kladistických snahách. Počítačové programy se v kladistice široce používají, vzhledem k velmi složité povaze postupů generování kladogramů. Hlavním přispěvatelem ke kladistice byl německý entomolog Willi Hennig, který ji označoval jako fylogenetickou systematiku. Termín fylogenetika se často používá jako synonymum ke kladistice. Kladistika vznikla v oblasti biologie, ale v posledních letech našla uplatnění i v jiných oborech. Slovo kladistika je odvozeno ze starořeckého κλάδος, klados nebo „větev“.

Tento kladogram ukazuje evoluční vztah mezi různými hmyzími skupinami odvozený z datového souboru.

Kladogramy jsou stromy v grafovém teoretickém smyslu.

Kladogram ukazující, že Eukaryota a Archaea jsou si bližší než Bakterie. Všimněte si trojcestné vidlice uprostřed kladogramu.

Výchozím bodem kladistické analýzy je skupina druhů a molekulární, morfologické nebo jiné údaje charakterizující tyto druhy. Konečným výsledkem je stromovitý vztahový diagram zvaný kladogram. Kladogram graficky představuje hypotetický evoluční proces. Kladogramy podléhají revizi, jakmile budou k dispozici další údaje.

Synonyma – Termín evoluční strom se často používá jako synonymum pro kladogram. Termín fylogenetický strom se někdy používá jako synonymum pro kladogram, ale jiní považují fylogenetický strom za širší termín, který zahrnuje stromy generované s neexevolučním důrazem.

Podstromy jsou Clades – V kladogramu leží všechny organismy na listech. Dva taxony po obou stranách rozdělení se nazývají sesterské taxony nebo sesterské skupiny. Každý podstrom, ať už obsahuje jednu položku nebo sto tisíc položek, se nazývá clade.

2-Way versus 3-Way Forks – Mnoho kladistů vyžaduje, aby všechny vidlice v kladogramu byly 2-Way Forks. Některé kladogramy zahrnují 3-Way nebo 4-Way Forks, když data nejsou dostatečná k vyřešení vidlice na vyšší úroveň detailu, ale uzly s více než dvěma větvemi jsou odrazovány mnoha kladisty. Viz fylogenetický strom pro více informací o výběru vidlice ve stromech.

Hloubka kladogramu – Pokud kladogram reprezentuje N druhů, počet úrovní (dále jen „hloubka“) v kladogramu je v řádu log2(N). Pokud například existuje 32 druhů jelenů, kladogram reprezentující jeleny bude přibližně 5 úrovní hluboký (protože 25=32). Kladogram reprezentující kompletní strom života s přibližně 10 miliony druhů by byl přibližně 23 úrovní hluboký. Tento vzorec udává spodní hranici: ve většině případů bude skutečná hloubka větší hodnotou, protože různé větve kladogramu nebudou rovnoměrně hluboké. Naopak hloubka může být mělčí, pokud jsou povoleny vidlice větší než dvoucestné vidlice.

Počet odlišných kladogramů – Pro danou množinu druhů je počet odlišných zakořeněných kladogramů, které lze nakreslit (bez ohledu na to, který kladogram nejlépe odpovídá charakteristikám druhu), následující:

Tento exponenciální růst počtu možných kladogramů vysvětluje, proč se manuální tvorba kladogramů stává velmi obtížnou, když je počet druhů velký.

Vyhynulé druhy v Cladograms – Cladistics nerozlišují mezi vyhynulými a nevyhynulými druhy a je vhodné zařadit vyhynulé druhy do skupiny analyzovaných organismů. Cladogramy, které jsou založeny na DNA/RNA, obecně nezahrnují vyhynulé druhy, protože vzorky DNA/RNA z vyhynulých druhů jsou vzácné. Cladogramy založené na morfologii, zejména na morfologických vlastnostech, které jsou zachovány ve fosiliích, zahrnují spíše vyhynulé druhy.

Časová stupnice kladogramu – Kladogramový strom má implicitní časovou osu, kdy čas běží vpřed od paty stromu k listům stromu. Pokud by bylo známo přibližné datum (například vyjádřené jako před miliony let) všech vývojových větví, tato data by mohla být zachycena v kladogramu. Časová osa kladogramu by tedy mohla být přiřazena časovému měřítku (např. 1 cm = 1 milion let) a větve stromu by mohly být graficky umístěny podél časové osy. Takovým kladogramům se říká škálované kladogramy. Mnoho kladogramů není škálováno podél časové osy, a to z různých důvodů:

Doporučujeme:  Strojové učení

Kladistika ve srovnání s linnaeanskou taxonomií

Vysoce rozlišený, automaticky generovaný strom života založený na kompletně sekvenovaných genomech

Před nástupem kladistiky používala většina taxonomů k organizování životních forem linnaeanskou taxonomii. Tento tradiční přístup používal několik pevných úrovní hierarchie, jako je Království, Fylum, Třída, Řád a Rodina. Kladistika tyto termíny nepoužívá, protože jedním ze základních předpokladů kladistiky je, že evoluční strom je velmi hluboký a velmi složitý a nemá smysl používat pevný počet úrovní.

Linnaeanská taxonomie trvá na tom, že skupiny odrážejí fylogenie, ale na rozdíl od kladistiky povoluje monofyletické i parafyletické skupiny jako taxony. Od počátku 20. století se linnaeanští taxonomové obecně pokoušeli o to, aby geny a nižší taxony byly monofyletické.

Kladistika vznikla v díle Williho Henniga a od té doby se vášnivě diskutuje o relativních zásluhách kladistiky versus linnaejská klasifikace. Některé debaty, do kterých se kladisté zapojili, běžely od 19. století, ale vstoupili do těchto debat s novým zápalem, jak se lze dozvědět z předmluvy k Hennigovi (1979), ve které Rosen, Nelson a Patterson napsali následující:

Neodarwinismus (shrnutý v „evoluční“ systematice Mayra a Simpsona) zatížený vágními a kluzkými představami o adaptaci, kondici, biologických druzích a přírodním výběru nejenže postrádal definovatelnou výzkumnou metodu, ale začal záviset, jak na evoluční interpretaci, tak na klasifikaci, na konsensu či autoritě. (Předmluva, strana ix)

Zastánci kladistiky vyjmenovávají klíčové rozdíly mezi kladistikou a linnaejskou taxonomií následovně:

Zastánci linnaeanské taxonomie tvrdí, že má některé výhody oproti kladistice, například:

Kladistika ve srovnání s fenetikou

Po několik desetiletí v polovině 20. století byla běžně používanou metodikou fenetika („numerická taxonomie“). To lze považovat za předchůdce některých metod dnešní kladistiky (konkrétně metod distanční matice jako sousedské spojování), ale nepokusil se vyřešit fylogenezi, pouze podobnosti. Fenetické metody, považované ve své době za špičkové, protože patřily mezi první aplikace bioinformatiky, jsou dnes nahrazovány kladistickými analýzami[How to reference and link to summary or text] kvůli jejich neschopnosti fenetiky poskytnout evoluční hypotézu, leda náhodou.

Monofyletické skupiny podporovány

Zjednodušený postup krok za krokem

Nekořenovitý kladogram čeledi myosinových supergenů

Zjednodušený postup pro generování kladogramu je:

Krok 1: Shromažďovat a organizovat data

Kladistická analýza začíná následujícími daty:

Pokud například analyzujeme 20 druhů ptáků, mohou být údaje následující:

Molekulární versus morfologická data

Charakteristiky použité k vytvoření kladogramu lze zhruba rozdělit buď na morfologické (synapsidní lebka, teplokrevná, notochord, jednobuněčná atd.) nebo molekulární (DNA, RNA nebo jiná genetická informace). Před nástupem sekvenování DNA používaly všechny kladistické analýzy morfologická data.

S tím, jak je sekvenování DNA levnější a snazší, stává se molekulární systematika stále populárnějším způsobem rekonstrukce fylogenií. Použití kritéria parsimonie je pouze jednou z několika metod, jak odvodit fylogenii z molekulárních dat; maximální pravděpodobnost a bayesovská inference, které zahrnují explicitní modely evoluce sekvencí, jsou ne-hennigovské způsoby hodnocení sekvenčních dat. Další mocnou metodou rekonstrukce fylogenií je použití genomových retrotranspozonových markerů, o kterých se předpokládá, že jsou méně náchylné k problému reverze, který trápí sekvenční data. Obecně se také předpokládá, že mají nízký výskyt homoplasií, protože se kdysi předpokládalo, že jejich integrace do genomu byla zcela náhodná; zdá se však, že tomu tak alespoň někdy není.

Doporučujeme:  Love and Will

Plesiomorfie a synapomorfie

Výzkumník rozhodne, které znakové stavy byly přítomny před posledním společným předkem druhové skupiny (plesiomorphies) a které byly přítomny u posledního společného předka (synapomorphies) zvážením jedné nebo více outgroups. To činí volbu outgroup důležitým úkolem, protože tato volba může hluboce změnit topologii stromu. Všimněte si, že pouze synapomorphies jsou užitečné při charakterizaci clades.

Homoplazie je znak, který sdílí více druhů kvůli nějaké jiné příčině, než je společný původ. Homoplazie se obvykle vyskytují kvůli konvergentní evoluci. Používání homoplazií při sestavování kladogramu je někdy nevyhnutelné, ale pokud je to možné, je třeba se mu vyhnout.

Známým příkladem homoplazie v důsledku konvergentní evoluce by byla znaková „přítomnost křídel“. Ačkoli křídla ptáků, netopýrů a hmyzu plní stejnou funkci, každý se vyvíjel nezávisle, jak je patrné z jejich anatomie. Pokud by byl za znakovou „přítomnost křídel“ ohodnocen pták, netopýr a okřídlený hmyz, byla by do datového souboru zanesena homoplazie, což by zmátlo analýzu, což by mohlo vést k falešnému evolučnímu scénáři.

Homoplaziím se lze v morfologických datasetech často rovnou vyhnout přesnější definicí znaků a zvýšením jejich počtu. Ve výše uvedeném příkladu by se homoplazii vyhnulo použití „křídel podepřených kostěným endoskeletem“ a „křídel podepřených chitinovým exoskeletem“ jako znaků. Při analýze „superstromů“ (datasetů zahrnujících co nejvíce taxonů podezřelého kladu) se může stát nevyhnutelným zavést definice znaků, které jsou nepřesné, protože jinak by znaky nemusely platit vůbec pro velký počet taxonů. Příklad „křídel“ by byl stěží užitečný, pokud bychom se pokoušeli o fylogenezi všech Metazoa, protože většina z nich nemá křídla vůbec. Opatrná volba a definice znaků je tedy dalším důležitým prvkem v kladistických analýzách. Při chybné outgroup nebo znakové sadě není pravděpodobné, že by žádná metoda hodnocení vytvořila fylogenezi představující evoluční realitu.

Krok 2: Zvažte možné kladogramy

Když je organizováno jen několik druhů, je možné tento krok provést ručně, ale většina případů vyžaduje počítačový program. K dispozici jsou desítky počítačových programů, které podporují kladistiku. Více informací o počítačových programech vytvářejících stromy najdete ve fylogenetickém stromu.

Protože celkový počet možných kladogramů roste exponenciálně s počtem druhů, je nepraktické, aby počítačový program vyhodnocoval každý jednotlivý kladogram. Typický kladistický program začíná použitím heuristických technik k identifikaci malého počtu kandidátských kladogramů. Mnoho kladistických programů pak pokračuje v hledání následujícími opakujícími se kroky:

Počítačové programy, které generují cladogramy, používají algoritmy, které jsou velmi výpočetně náročné, protože algoritmus cladogramů je NP-hard.

Krok 3: Vyberte nejlepší kladogram

K identifikaci „nejlepšího“ kladogramu je k dispozici několik algoritmů. Většina algoritmů používá metriku k měření, jak je kandidátský kladogram konzistentní s daty. Většina algoritmů kladogramu používá matematické techniky optimalizace a minimalizace.

Obecně platí, že algoritmy pro generování cladogramů musí být implementovány jako počítačové programy, i když některé algoritmy mohou být provedeny ručně, když jsou datové soubory triviální (například jen několik druhů a pár charakteristik).

Některé algoritmy jsou užitečné pouze tehdy, jsou-li charakteristickými daty molekulární (DNA, RNA) data. Jiné algoritmy jsou užitečné pouze tehdy, jsou-li charakteristickými daty morfologická data. Jiné algoritmy mohou být použity tehdy, jsou-li charakteristickými daty jak molekulární, tak morfologická data.

Algoritmy pro kladogramy zahrnují nejmenších čtverců, spojování sousedů, parsimonii, maximální pravděpodobnost a bayesovskou inferenci.

Biologové někdy používají termín parsimonie pro určitý druh algoritmu generování kladogramů a někdy jako zastřešující termín pro všechny algoritmy kladogramů.

Algoritmy, které provádějí optimalizační úlohy (například sestavování cladogramů), mohou být citlivé na pořadí, v jakém jsou vstupní údaje (seznam druhů a jejich charakteristiky) prezentovány. Zadávání dat v různých pořadích může způsobit, že stejný algoritmus vytvoří různé „nejlepší“ cladogramy. V těchto situacích by uživatel měl zadávat data v různých pořadích a porovnávat výsledky.

Doporučujeme:  Jaterní encefalopatie

Použití různých algoritmů na jednom datovém souboru může někdy přinést různé „nejlepší“ cladogramy, protože každý algoritmus může mít jedinečnou definici toho, co je „nejlepší“.

Vzhledem k astronomickému počtu možných kladogramů nemohou algoritmy zaručit, že řešení je celkově nejlepším řešením. Optimální kladogram bude vybrán, pokud se program spokojí s lokálním minimem namísto požadovaného globálního minima. K vyřešení tohoto problému používá mnoho algoritmů kladogramu simulovaný přístup žíhání, aby se zvýšila pravděpodobnost, že vybraný kladogram je optimální.

Jak složitý je Strom života?

Jedním z argumentů ve prospěch kladistiky je, že podporuje libovolně složité, libovolně hluboké stromy. Zvláště když se uvažuje o vyhynulých druzích (známých i neznámých), složitost a hloubka stromu může být velmi velká. Každá jednotlivá speciační událost, včetně všech druhů, které jsou nyní vyhynulé, představuje další rozcestí na hypotetickém, kompletním kladogramu představujícím celý strom života. Fraktály mohou být použity k znázornění této představy o vzrůstajících detailech: jak se pohled přibližuje ke stromu života, složitost zůstává prakticky konstantní. Tato velká složitost stromu a nejistota spojená se složitostí je jedním z důvodů, které kladisti uvádějí pro atraktivitu kladistiky oproti tradiční taxonomii.

Zastánci nekládistických přístupů k taxonomii poukazují na puncuated equilibrium, aby podpořili tvrzení, že strom života má konečnou hloubku a konečnou složitost. Pokud je počet žijících druhů v současnosti konečný a počet vyhynulých druhů, o kterých se kdy dozvíme, je konečný, pak je hloubka a složitost stromu života ohraničena a není třeba zacházet s libovolně hlubokými stromy.

Phylocode přístup k pojmenování druhů

Formální kód fylogenetické nomenklatury, PhyloCode, je v současné době vyvíjen pro kladistickou taxonomii. Je určen jak pro ty, kteří by chtěli opustit linnaeanskou taxonomii, tak pro ty, kteří by chtěli používat taxony a klady vedle sebe. V několika případech (viz např. Hesperornithes) byl použit k objasnění nejistot v linnaeanské systematice tak, že v kombinaci vytvářejí taxonomii, která jednoznačně umisťuje skupinu do evolučního stromu způsobem, který je v souladu se současnými poznatky.

Žlutá skupina (sauropsidi) je monofyletická, modrá skupina (plazi) je parafyletická a červená skupina (teplokrevní živočichové) je polyfyletická.

Původ pojmu „kladistika“

Hennigova hlavní kniha, dokonce ani verze z roku 1979, neobsahuje v indexu termín kladistika. Odkazoval na svůj vlastní přístup jako na fylogenetickou systematiku, což vyplývá z názvu knihy. Recenzní práce Dupuise poznamenává, že termín clade byl zaveden v roce 1958 Julianem Huxleyem, kladistický Cainem a Harrisonem v roce 1960 a kladistický (pro přívržence Hennigovy školy) Mayrem v roce 1965.

Tři definice kladu

Existují tři způsoby, jak definovat klad pro použití v kladistické taxonomii.

Aplikace kladistiky na jiné disciplíny

Procesy používané pro generování kladogramů nejsou omezeny pouze na oblast biologie. Generická povaha kladistiky znamená, že kladistika může být použita pro uspořádání skupin položek v mnoha různých sférách. Jediným požadavkem je, aby položky měly charakteristické znaky, které mohou být identifikovány a měřeny.

Například lze vzít skupinu 200 mluvených jazyků, změřit různé charakteristiky každého jazyka (slovní zásoba, fonémy, rytmy, přízvuky, dynamika atd.) a pak na data aplikovat kladogramový algoritmus. Výsledkem bude strom, který může osvětlit, jak a v jakém pořadí jazyky vznikly.

Kladistické metody byly tedy v poslední době užitečně aplikovány na nebiologické systémy, včetně určování jazykových rodin v historické lingvistice, kultuře, historii,
a filializace rukopisů v textové kritice.