Projekt lidského genomu

Projekt lidského genomu (HGP) se snažil zmapovat lidský genom až na úroveň nukleotidů (párů bází) a identifikovat všechny geny, které se v něm nacházejí.

Projekt zahájil v roce 1986 Charles DeLisi, který byl v té době ředitelem výzkumných programů pro zdraví a životní prostředí amerického ministerstva energetiky. Cíle a obecná strategie projektu byly nastíněny ve dvoustránkovém memorandu náměstkovi ministra v dubnu 1986, které pomohlo získat podporu DOE, OMB a Kongresu, zejména senátora Peta Domeniciho. Výsledkem řady vědeckých porad a složitých jednání s vysokými federálními úředníky byla položka pro projekt v prezidentském rozpočtu předloženém Kongresu v roce 1987.

Zahájení projektu bylo vyvrcholením několikaleté práce podporované americkým ministerstvem energetiky, zejména semináře o proveditelnosti v roce 1986 a následného podrobného popisu iniciativy lidského genomu ve zprávě, která vedla k formálnímu schválení iniciativy ministerstvem energetiky. V této zprávě z roku 1987 se odvážně uvádí: „Konečným cílem této iniciativy je pochopení lidského genomu“ a „Znalost lidského genomu je pro další pokrok medicíny a dalších zdravotnických věd stejně nezbytná jako znalost lidské anatomie pro současný stav medicíny“. Kandidátské technologie byly pro navrhovaný podnik zvažovány již přinejmenším v roce 1985.

James Watson byl od roku 1988 vedoucím Národního centra pro výzkum lidského genomu při NIH. Především kvůli neshodám se svou šéfkou Bernradine Healyovou v otázce patentování genů byl v roce 1992 nucen odstoupit. V dubnu 1993 ho nahradil Francis Collins a v roce 1997 byl název centra změněn na Národní ústav pro výzkum lidského genomu (NHGRI).

Projekt v hodnotě 3 miliard dolarů byl oficiálně založen v roce 1990 Ministerstvem energetiky Spojených států a Národním institutem zdraví USA a měl trvat 15 let.

Mezinárodní konsorcium tvořili kromě Spojených států genetici z Číny, Francie, Německa, Japonska a Spojeného království.

Díky široké mezinárodní spolupráci a pokroku v oblasti genomiky (zejména v analýze sekvencí), jakož i obrovskému pokroku ve výpočetní technice, byl hrubý návrh genomu dokončen v roce 2000 (26. června 2000 to společně oznámili americký prezident Bill Clinton a britský premiér Tony Blair), tedy o dva roky dříve, než bylo plánováno.

Prezident Clinton udělil DeLisimu Občanskou medaili za jeho zásadní roli v projektu již v lednu 2000, tedy ještě před oznámením o dokončení projektu.

Úloha společnosti Celera Genomics

V roce 1998 zahájil výzkumný pracovník Craig Venter a jeho firma Celera Genomics stejný projekt financovaný ze soukromých zdrojů. Úsilí společnosti Celera v hodnotě 300 milionů dolarů mělo probíhat rychlejším tempem a za zlomek nákladů projektu financovaného daňovými poplatníky v hodnotě zhruba 3 miliard dolarů.

Společnost Celera použila novější a rizikovější techniku zvanou celogenomové sekvenování, která byla použita k sekvenování bakteriálních genomů.

Společnost Celera původně oznámila, že bude usilovat o patentovou ochranu „pouze 200-300“ genů, ale později to změnila na snahu o „ochranu duševního vlastnictví“ „plně charakterizovaných důležitých struktur“ v rozsahu 100-300 cílů. Firma nakonec podala patentové přihlášky na 6 500 celých nebo částečných genů.

Společnost Celera rovněž slíbila, že bude své výsledky zveřejňovat v souladu s podmínkami „Bermudského prohlášení“ z roku 1996, a to tak, že bude čtvrtletně zveřejňovat nová data (HGP zveřejňoval nová data denně), ačkoli na rozdíl od projektu financovaného z veřejných zdrojů nebude umožňovat volné šíření nebo komerční využití dat.

V březnu 2000 prezident Clinton oznámil, že sekvence genomu nesmí být patentována a měla by být volně k dispozici všem výzkumníkům. Toto prohlášení způsobilo propad akcií společnosti Celera a stáhlo dolů biotechnologický Nasdaq. Biotechnologický sektor ztratil během dvou dnů tržní kapitalizaci ve výši přibližně 50 miliard dolarů.

Ačkoli byl pracovní návrh oznámen v červnu 2000, teprve v únoru 2001 zveřejnili vědci společnosti Celera a HGP podrobnosti svých návrhů. Zvláštní čísla časopisů Nature (který publikoval vědecký článek projektu financovaného z veřejných zdrojů) a Science (který publikoval článek společnosti Celera) popisovala metody použité k vytvoření návrhu sekvence a nabízela analýzu sekvence. Předpokládá se, že tyto návrhy budou tvořit „lešení“ 90 % genomu, přičemž mezery budou doplněny později.

Soutěž se pro projekt ukázala jako velmi dobrá. Soupeři se dohodli na sdružování svých dat, ale dohoda se rozpadla, když Celera odmítla uložit svá data do neomezené veřejné databáze Genbank. Celera začlenila veřejná data do svého genomu, ale zakázala snahu veřejnosti využívat data Celery.

Dne 14. dubna 2003 bylo ve společném tiskovém prohlášení oznámeno, že obě skupiny projekt dokončily, přičemž 99 % genomu bylo sekvenováno s přesností 99,99 %.

Každý návrh sekvence byl zkontrolován nejméně čtyřikrát až pětkrát, aby se zvýšila „hloubka pokrytí“ nebo přesnost. Přibližně 47 % návrhů bylo vysoce kvalitních sekvencí. Konečná verze bude zkontrolována osmkrát až devětkrát, což znamená chybovost 1 z 10 000 bází.

HGP je jedním z několika mezinárodních genomových projektů zaměřených na sekvenování DNA určitého organismu. Ačkoli sekvence lidské DNA nabízí nejhmatatelnější přínos, předpokládá se, že díky sekvenování modelových organismů, včetně myší, ovocných mušek, zebřiček, kvasinek, hlístic a mnoha mikrobiálních organismů a parazitů, dojde k významnému rozvoji v biologii a medicíně.

V říjnu 2004 vědci z HGP oznámili nový odhad 20 000 až 25 000 genů v lidském genomu. Dříve se předpokládalo 30 000 až 40 000, přičemž odhady na začátku projektu dosahovaly až 100 000.

Cílem původního HGP bylo nejen určit všechny 3 miliardy párů bází v lidském genomu s minimální chybovostí, ale také identifikovat všechny geny v tomto obrovském množství dat. Tato část projektu stále probíhá, i když předběžné počty ukazují na přibližně 30 000 genů v lidském genomu, což je mnohem méně, než předpokládala většina vědců.

Dalším cílem HGP byl vývoj rychlejších a účinnějších metod sekvenování DNA a sekvenční analýzy a přenos těchto technologií do průmyslu. Sekvenování lidského genomu bylo umožněno částečně díky vývoji nové technologie, označované jako Rolling Circle Amplification Technology, která amplifikovala počet kopií DNA v sekvenovaných vzorcích, a tím usnadnila analýzu. Technologie Rolling Circle Amplification Technology byla vyvinuta nezávislým úsilím výzkumných skupin Paula Lizardiho (Yale University), Erica Koola (The University of Rochester), Jeffreyho Auerbacha (Replicon, Inc.) a Davida Zhanga (Mount Sinai Medical Center).

Sekvence lidské DNA je uložena v databázích dostupných komukoli na internetu. Národní centrum pro biotechnologické informace v USA (a sesterské organizace v Evropě a Japonsku) uchovávají sekvence genů v databázi známé jako Genbank spolu se sekvencemi známých a hypotetických genů a proteinů. Další organizace, jako je Kalifornská univerzita v Santa Cruz a ENSEMBL, poskytují další data a anotace a výkonné nástroje pro jejich vizualizaci a vyhledávání. K analýze dat byly vyvinuty počítačové programy, protože samotná data je bez nich obtížné interpretovat.

Proces identifikace hranic mezi geny a dalšími prvky v surové sekvenci DNA se nazývá anotace genomu a je doménou bioinformatiky. I když jsou nejlepšími anotátory odborní biologové, jejich práce postupuje pomalu a stále častěji se používají počítačové programy, které splňují vysoce výkonné požadavky projektů sekvenování genomu. Nejlepší současné technologie pro anotaci využívají statistické modely, které využívají paralely mezi sekvencemi DNA a lidským jazykem a využívají koncepty z informatiky, jako jsou formální gramatiky.

Všichni lidé mají jedinečné genové sekvence, proto údaje zveřejněné HGP nepředstavují přesnou sekvenci genomu každého jedince. Jedná se o kombinovaný genom malého počtu anonymních dárců. Genom HGP je lešením pro budoucí práci při identifikaci rozdílů mezi jednotlivci. Většina současného úsilí při identifikaci rozdílů mezi jedinci zahrnuje jednonukleotidové polymorfismy a mapu HapMap.

Jasné praktické výsledky projektu se objevily ještě před jeho dokončením. Například řada
společností, jako je Myriad Genetics, začala nabízet levné a snadné způsoby provádění genetických testů, které mohou prokázat predispozice k různým onemocněním, včetně rakoviny prsu, srážlivosti krve, cystické fibrózy, jaterních chorob a mnoha dalších.

Biologičtí vědci mají také mnoho hmatatelných výhod. Například výzkumník zkoumající určitou formu rakoviny může zúžit své pátrání na konkrétní gen. Navštíví-li databázi lidského genomu na celosvětové síti, může tento výzkumník prozkoumat, co o tomto genu napsali jiní vědci, včetně (potenciálně) jeho trojrozměrné struktury, jeho funkce (funkcí), jeho evolučních vztahů k jiným lidským genům nebo ke genům u myší, kvasinek či ovocných mušek, možných škodlivých mutací, interakcí s jinými geny, tělesných tkání, v nichž je tento gen aktivován, nemocí spojených s tímto genem… Seznam datových typů je dlouhý, což je jeden z důvodů, proč je bioinformatika tak náročná.

Práce na interpretaci genomových dat je stále v počátečních fázích. Poznatky získané díky porozumění genomu v budoucnu posílí medicínu a biotechnologie a potenciálně povedou k léčbě rakoviny, Alzheimerovy choroby a dalších nemocí.

V čistě vědecké rovině otevírá analýza podobností mezi sekvencemi DNA různých organismů nové cesty ve studiu evoluční teorie. V mnoha případech lze nyní evoluční otázky formulovat v termínech molekulární biologie; mnoho významných evolučních milníků (vznik ribozomu a organel, vývoj embryí s tělesnými plány, imunitní systém obratlovců) lze totiž vztáhnout k molekulární úrovni. Očekává se, že údaje z tohoto projektu osvětlí mnoho otázek týkajících se podobností a rozdílů mezi člověkem a našimi nejbližšími příbuznými (primáty a vlastně i ostatními savci).

Čí genom byl sekvenován?

Tuto odpověď zveřejnil Dr. Marvin Stodolsky z Úřadu biologického a environmentálního výzkumu Ministerstva energetiky USA, Úřad pro vědu. Předpokládá se, že toto vyjádření je veřejně dostupné, neboť se jedná o dílo vlády Spojených států amerických

Čí genom byl sekvenován ve veřejných (HGP) a soukromých projektech?

Referenční sekvence lidského genomu nepředstavují genom žádného člověka. Slouží spíše jako výchozí bod pro rozsáhlá srovnání napříč lidstvem. Získané poznatky jsou použitelné pro všechny, protože všichni lidé sdílejí stejný základní soubor genů a genomických regulačních oblastí, které řídí vývoj a udržování jejich biologických struktur a procesů.

Z technického hlediska je mnohem snazší připravit DNA čistě ze spermií než z jiných typů buněk, protože poměr DNA a bílkovin ve spermiích je mnohem vyšší a objem, v němž lze purifikaci provést, je mnohem menší. Použití spermií poskytuje ke studiu všechny chromozomy, včetně stejného počtu spermií s pohlavními chromozomy X (ženské) nebo Y (mužské). Vědci z HGP však použili také bílé krvinky z krve ženských dárkyň, aby zahrnuli i vzorky ženského původu.

Během HGP bylo také identifikováno mnoho malých oblastí DNA, které se liší mezi jednotlivci (tzv. polymorfismy), většinou se jedná o jednonukleotidové polymorfismy (SNP). Většina SNP je bez fyziologického účinku, ačkoli menšina z nich přispívá k rozkošatělé a prospěšné rozmanitosti lidstva. Mnohem menší menšina polymorfismů ovlivňuje náchylnost jedince k nemocem a reakci na léčbu.