Projekt genové ontologie neboli GO (Gene Ontology project) poskytuje kontrolovanou slovní zásobu pro popis genových a genových atributů v jakémkoli organismu. Lze ji zhruba rozdělit na dvě části. První je ontologie samotná – ve skutečnosti tři ontologie, z nichž každá představuje klíčový koncept v molekulární biologii: molekulární funkce genových produktů, jejich role ve vícekrokových biologických procesech a jejich lokalizace do buněčných složek. ontologie jsou průběžně aktualizovány a nové verze jsou k dispozici každý měsíc.
Druhou částí je anotace, charakterizace genových produktů pomocí termínů z ontologie. Členové konsorcia GO předkládají své údaje a jsou veřejně zpřístupněny prostřednictvím webových stránek GO.
GO je také součástí většího úsilí o klasifikaci Open Biomedical Ontologies (OBO).
Gene Ontology byl původně zkonstruován v roce 1998 konsorciem výzkumníků studujících genom tří modelových organismů: Drosophila melanogaster (octomilka), Mus musculus (myš) a Saccharomyces cerevisiae (pivovarské nebo pekařské kvasnice). Ke konsorciu Gene Ontology se připojilo mnoho dalších databází modelových organismů, které přispěly jak anotacemi pro geny jednoho nebo více organismů, tak také přispěly k rozvoji ontologií. K lednu 2008 obsahovalo GO přes 24 500 termínů použitelných pro širokou škálu biologických organismů. O vývoji a použití GO existuje významné množství literatury a stala se standardním nástrojem v arzenálu bioinformatiky.
Každý termín GO se skládá z jedinečného alfanumerického identifikátoru, běžného názvu, synonym (je-li použitelné) a definice. Pokud má termín více významů v závislosti na druhu, GO mezi nimi rozlišuje pomocí značky „sensu“. Termíny jsou zařazeny pouze do jedné ze tří ontologií, z nichž každá je strukturována jako směrovaný acyklický graf.
Nové termíny a anotace navrhují členové výzkumných a anotačních komunit. Jakmile jsou předloženy, jsou přezkoumány členy konsorcia GO s cílem určit jejich použitelnost.
Pokud se rozhodne, že termín v ontologii není vhodný, je zastaralý, nebo je označen jako „zastaralý“. K tomu může dojít z mnoha důvodů, například proto, že je mimo rozsah ontologie nebo je klamavě pojmenován nebo definován.
Soubor ontologie je volně dostupný z webových stránek GO; termíny lze vyhledávat a prohlížet online pomocí GO prohlížeče AmiGO. Projekt Gene Ontology také poskytuje mapování svých termínů do jiných klasifikačních systémů pokrývajících stejné oblasti biologie.
Gene Ontology Associations
Řada organizací, včetně databází modelových organismů a rozsáhlých multidruhových proteinových databází, provádí analýzy proteinových sekvencí a vydává tabulky asociací mezi domnělými genovými produkty a GO termíny. Ty jsou volně dostupné na webových stránkách GO a lze je stáhnout jednotlivě nebo si je prohlédnout online pomocí AmiGO.
V mnoha starších databázích genetických sekvencí nesou anotace jen málo nebo vůbec žádný údaj o jejich původu, takže uživatel nemůže snadno zjistit
povahu a sílu důkazů, které za nimi stojí, což vede k tomu, co
je v terénu známo jako ‚problém s přechodnou anotací‘. Některé geny
jsou charakterizovány skutečnými laboratorními experimenty a jejich sekvence jsou uloženy
v hlavní veřejné databázi s anotacemi z těchto experimentů. Další
sekvence, které nebyly charakterizovány v laboratoři, jsou anotovány na základě
jejich sekvenční podobnosti s touto a tyto další sekvence zase
tvoří základ pro ještě další anotace a tak dále. Uživatel tak nemůže
vědět, kolik stupňů sekvenční podobnosti stojí mezi anotací pro některé
genetické sekvence a skutečnými daty z laboratoří.
Přidružení GO má metadata označující:
Jakýkoli automatický programový výstup, který nebyl kurátorován lidskou bytostí, dostane důkazní kód IEA znamenající Inferred from Electronic Annotation. Použití jiného kódu než IEA znamená, že tuto anotaci zkontroloval lidský kurátor. Například TAS pro Traceable Author Statement znamená, že kurátor přečetl publikovanou vědeckou práci a metadata pro tuto asociaci nesou citaci k této práci. Na druhou stranu ISS pro Inferred from Sequence Similarity znamená, že lidský kurátor zkontroloval výstup z hledání sekvenční podobnosti a ověřil, že je biologicky smysluplný.
GOCat – automatický GO kategorizátor/prohlížeč, který pomůže Funkční anotace z biomedicínských textů
GoPubMed – Prozkoumejte PubMed/MEDLINE s Gene Ontology
Protein Ontology Project – Poskytuje přístup k Protein Ontology (PO) a referenčním dokumentům popisujícím PO a jeho použití.
EAGLi – A Terminology-powered (Gene Ontology, Swiss-Prot klíčová slova…) MEDLINE vyhledávací a vizualizační engine
PAMGO, the Plant-Associated Microbe Gene Ontology