Homologen – Dobrá psychoterapie

HomoloGene, nástroj Národního centra pro biotechnologické informace (NCBI), je systém pro automatizovanou detekci homologů (podobnost přičitatelná potomkům společného předka) mezi anotovanými geny několika kompletně sekvenovaných eukaryotických genomů.

Zpracování HomoloGene se skládá z analýzy bílkovin ze vstupních organismů. Sekvence se porovnávají pomocí blastpu, pak se porovnávají a dávají do skupin pomocí taxonomického stromu postaveného z podobnosti sekvencí, kde se nejdříve porovnávají bližší příbuzné organismy a pak se do stromu přidávají další organismy. Srovnání bílkovin se mapuje zpět na jejich odpovídající sekvence DNA a pak se měří vzdálenosti jako molekulární vzdálenosti Jukes a Cantor (1969), lze vypočítat poměr Ka/Ks.

Sekvence se porovnávají pomocí heuristického algoritmu pro maximalizaci skóre globálně, nikoliv lokálně, v oboustranné shodě (viz kompletní bipartitní graf). A pak se vypočítá statistická významnost každé shody. Dělí se výřezy na pozici a hodnoty Ks jsou nastaveny tak, aby se zabránilo seskupování falešných „orthologů“. „Paralogy“ se identifikují tak, že se najdou sekvence, které jsou blíže v rámci druhu než jiné druhy.

Homo sapiens, Mus musculus, Danio rerio, Rattus norvegicus, Pan troglodytes, Canis lupus familiaris, Arabidopsis thaliana, Gallus gallus, Oryza sativa, Anopheles gambiae, Drosophila melanogaster, Magnaporthe grisea, Neurospora crassa, Caenorhabditis elegans, Saccharomyces cerevisiae, Kluyveromyces lactis, Eremothecium gossypii, Schizosaccharomyces pombe a Plasmodium falciparum.

HomoloGene je propojen se všemi databázemi Entrez a je založen na homologii a fenotypové informaci těchto odkazů:

Výsledkem je, že HomoloGene zobrazuje informace o genech, proteinech, fenotypech a konzervovaných doménách.