Open Directory Project

Open Directory Project (ODP), také známý jako DMoz (z původního názvu domény Directory.Mozilla.org), je vícejazyčný adresář s otevřeným obsahem odkazů World Wide Web vlastněný společností Netscape, který je konstruován a udržován komunitou dobrovolných editorů.

ODP byl založen jako Gnuhoo Richem Skrentou a Bobem Truelem v roce 1998. V té době Skrenta a Truel pracovali jako inženýři pro Sun Microsystems. Chris Tolles, který pracoval v Sun Microsystems jako vedoucí marketingu produktů síťové bezpečnosti, se také v roce 1998 podepsal jako spoluzakladatel Gnuhoo spolu se spoluzakladateli Brynem Dolem a Jeremym Wenokurem. Skrenta byl již dobře známý pro svou roli při vývoji TASS, předka cínu, populárního vláknitého Usenet newsreaderu pro Unixové systémy. Shodou okolností byla původní struktura kategorií adresáře Gnuhoo založena volně na struktuře tehdejších diskusních skupin Usenet.

Adresář Gnuhoo byl uveden do provozu 5. června 1998 a byl přejmenován na Newhoo poté, co byl zveřejněn článek ve Slashdotu, ve kterém plakáty tvrdily, že Gnuhoo nemá nic společného s duchem svobodného softwaru, pro který byl projekt GNU známý a byl prostě komerčním podnikem, který se snažil zkonstruovat alternativu k Yahoo! Adresář využívající dobrovolnou práci. Newhoo se stal ODP poté, co byl v říjnu 1998 odkoupen Netscape Communications Corporation a obsah byl vydán pod otevřenou licencí obsahu. Netscape byl krátce poté odkoupen AOL a ODP byl jedním z aktiv zahrnutých do akvizice. AOL se později spojil s Time-Warner.

V době, kdy Netscape převzal správu, měl Open Directory Project asi 100 000 URL indexovaných příspěvky od asi 4500 editorů. 5. října 1999 dosáhl počet URL indexovaných ODP jednoho milionu. Podle neoficiálního odhadu počet URL v Open Directory překonal počet URL v Yahoo! Directory v dubnu 2000 s asi 1,6 milionu URL. ODP dosáhl milníků indexování dvou milionů URL 14. srpna 2000, tří milionů výpisů 18. listopadu 2001 a čtyř milionů 3. prosince 2003.

Od ledna 2006 začal Open Directory zveřejňovat on-line zprávy, aby informoval veřejnost o vývoji projektu. První zpráva se týkala roku 2005. Následně byly vydávány měsíční zprávy.

Tyto zprávy poskytují větší přehled o fungování adresáře než zjednodušené a potenciálně zavádějící statistiky uvedené na titulní straně adresáře. Počet výpisů a kategorií citovaných na titulní straně zahrnuje kategorie „Test“ a „Bookmarks“, ale ty nejsou zahrnuty v RDF dumpu nabízeném uživatelům. Počet editorů citovaných na titulní straně je celkový počet přihlášení do editoru, který byl kdy vytvořen, což zahrnuje mnoho již neaktivních. Počet aktivních editorů je mnohem nižší.

Konkurenční projekty a projekty osamostatnění

ODP inspiroval vznik dalších dvou velkých webových adresářů, které editovali dobrovolníci a sponzorovaly je veřejné společnosti, oba dnes již zaniklé: adresář Go.com (dříve vlastněný společností The Walt Disney Company) a Zeal (dříve vlastněný společností LookSmart). Ani jeden z těchto webových adresářů však neměl licenci na svůj obsah pro otevřenou distribuci obsahu, což byla strategie, která zajistila ODP úspěch na vysoce konkurenčním trhu. Koncept využití rozsáhlé komunity editorů pro kompilaci on-line obsahu byl úspěšně aplikován na jiné typy projektů, jako je Wikipedie.

Editačním modelem ODP se inspirovaly tři dobrovolnické projekty s otevřeným obsahem: adresář restaurací s otevřeným obsahem známý jako ChefMoz (spuštěn vedením ODP), adresář hudby s otevřeným obsahem známý jako MusicMoz a encyklopedie známá jako Open Site. Žádný z těchto tří projektů však zatím nedosáhl úspěchu na úrovni ODP.

Hlavní strana projektu Open Directory, leden 2006

ODP používá hierarchické ontologické schéma pro organizování výpisů webů. Výpisy na podobné téma jsou seskupeny do kategorií, které pak mohou zahrnovat i menší kategorie.

Gnuhoo si vypůjčila svou počáteční ontologii od Usenet. Například téma, kterým se zabývá diskusní skupina comp.ai.alife, bylo zastoupeno kategorií Počítače/AI/Artificial_Life. Původní divize byly pro Dospělé, Umění, Obchod, Počítače, Hry, Zdraví, Domov, Zprávy, Rekreace, Reference, Regionální, Věda, Nakupování, Společnost a Sport. Zatímco těchto patnáct kategorií nejvyšší úrovně zůstalo nedotčeno, ontologie kategorií druhé a nižší úrovně prošla postupným vývojem; významné změny jsou iniciovány diskusí mezi redaktory a poté realizovány, když bylo dosaženo shody.

V červenci 1998 se adresář stal vícejazyčným s přidáním kategorie World top-level. Zbytek adresáře uvádí pouze anglicky psané stránky. V květnu 2005 bylo zastoupeno sedmdesát pět jazyků. Tempo růstu neanglických složek adresáře je od roku 2002 větší než u anglické složky. Zatímco anglická složka adresáře v roce 2003 obsahovala téměř 75% stránek, úroveň World vzrostla k květnu 2005 na více než 1,5 milionu stránek, které tvořily zhruba jednu třetinu adresáře. Ontologie v neanglických kategoriích obecně odráží úroveň anglického adresáře, i když výjimky, které odrážejí jazykové rozdíly, jsou poměrně časté.

Doporučujeme:  Parciální regrese nejmenších čtverců

14. listopadu 2000 byl vytvořen speciální adresář v rámci Open Directory pro osoby mladší 18 let. Klíčové faktory, které odlišují tuto oblast „Kids and Teens“ od hlavního adresáře jsou:

Do května 2005 tato část Open Directory obsahovala přes 32 000 výpisů webů.

Výpisy adresářů spravují editoři. Zatímco někteří editoři se zaměřují na přidávání nových výpisů, jiní se zaměřují na udržování stávajících výpisů. To zahrnuje úkoly, jako je úprava jednotlivých výpisů na opravu pravopisných a/nebo gramatických chyb, a také sledování stavu propojených webů. Ještě jiní procházejí odevzdání webů, aby odstranili spam a duplicitní odevzdání.

Robozilla je webový crawler napsaný pro kontrolu stavu všech stránek uvedených v ODP. Pravidelně Robozilla označí stránky, které vypadají, že se přestěhovaly nebo zmizely, a editoři je sledují, aby stránky zkontrolovali a přijali opatření. Tento proces je rozhodující pro adresář ve snaze dosáhnout jednoho z jeho zakládajících cílů: snížit shnilost odkazů ve webových adresářích. Krátce po každém spuštění jsou stránky označené chybami automaticky přesunuty do fronty nezobrazených, kde je mohou editoři zkoumat, když jim to čas dovolí.

Vzhledem k popularitě Otevřeného adresáře a jeho výslednému vlivu na žebříčky vyhledávačů (Viz PageRank), domény s neplatnou registrací, které jsou uvedeny na ODP, přitahovaly únosy domén, což je problém, který se řeší pravidelným odstraňováním prošlých domén z adresáře.

Zatímco firemního financování a zaměstnanců pro ODP v posledních letech ubylo, dobrovolnictví vyústilo ve vytvoření nových a vylepšených editačních nástrojů, jako jsou linkcheckery pro doplnění Robozilly, prohledávače kategorií, kontroly pravopisu, vyhledávací nástroje, které přímo prosévají nedávný výpis RDF, záložky, které pomáhají automatizovat některé editační funkce, a nástroje, které pomáhají pracovat přes nezobrazené fronty několika způsoby.

Data ODP jsou zpřístupněna pro otevřenou distribuci obsahu za podmínek Open Directory License, která vyžaduje specifickou tabulku ODP atributů na každé webové stránce, která data využívá. Požadavek na atributy je však uživateli dat ODP často ignorován a vymahatelnost podmínek licence ODP byla některými uživateli dat ODP zpochybněna. Takové nedodržení podmínek licence vyvolává velkou nevoli mezi komunitou dobrovolných editorů ODP.

ODP data jsou zpřístupněna prostřednictvím RDF-like dumpu, který je publikován na dedikovaném stahovacím serveru . K dispozici je také archiv předchozích verzí . Nové verze jsou obvykle generovány týdně. Editor ODP katalogizoval řadu chyb, které jsou/byly zjištěny při implementaci ODP RDF dumpu, včetně chyb kódování UTF-8 (opraveno od srpna 2004) a formátu RDF, který neodpovídá konečné specifikaci RDF, protože ODP RDF generace byla implementována před dokončením specifikace RDF .

Takže zatímco dnes je tzv. RDF dump platným XML, není to striktně RDF, ale ODP-specifický formát. Software pro zpracování ODP RDF dumpu to musí brát v úvahu.

Od počátku roku 2004 je celá stránka v kódování UTF-8. Předtím bylo kódování ISO 8859-1 pro anglické jazykové kategorie a jazykově závislá znaková sada pro ostatní jazyky. Výpisy RDF jsou od počátku roku 2000 kódovány v UTF-8.

ODP data napájí základní adresářové služby pro mnoho největších webových vyhledávačů a portálů, včetně Netscape Search, AOL Search, Google a Alexa.

Další využití mají také ODP data. Například na jaře roku 2004 Overture oznámila vyhledávací službu pro třetí strany kombinující Yahoo! Výsledky vyhledávání adresářů s ODP tituly, popisy a metadaty kategorií. Vyhledávač Gigablast oznámil 12. května 2005 svou vyhledatelnou kopii Open Directory. Technologie umožňuje vyhledávání webových stránek uvedených v konkrétních kategoriích, „v podstatě okamžitě vytváří přes 500 000 vertikálních vyhledávačů“.

K 29. květnu 2005 ODP uvedla 341 anglicky psaných webových stránek, které používají data ODP, a také 175 stránek v jiných jazycích. Tyto údaje však neodrážejí úplný obraz o používání, protože ty stránky, které používají data ODP, aniž by se řídily podmínkami licence ODP, nejsou uvedeny.

Mnoho replik ODP používá zastaralá data. Některé menší weby přestaly používat RDF dumpy, protože se stále zvětšovaly, a rozhodly se dotazovat na živá data přímo z webových stránek ODP.

Doporučujeme:  Experimentální finance

Na to, kdo se může stát editorem ODP, jsou uvalena omezení. Primární gatekeeping mechanismus je proces aplikace editoru, kdy kandidáti editoru prokazují své editační schopnosti, zveřejňují příslušnost, která by mohla představovat střet zájmů, a jinak dávají představu o tom, jak by žadatel pravděpodobně zapadl do kultury a poslání ODP. Většina žádostí je zamítnuta, ale opakované podávání žádostí je povoleno a někdy podporováno.

Editační model ODP je hierarchický. Jakmile se jedinec stane editorem, bude mít zpravidla oprávnění k editaci pouze v malé kategorii. Jakmile prokáže základní editační dovednost v souladu s Editačními pokyny, může požádat o další editační oprávnění, a to buď v širší kategorii, nebo v kategorii jinde v adresáři. Mentorské vztahy mezi editory jsou podporovány a interní fóra poskytují novým editorům nástroj pro kladení otázek.

Časem mohou být starším editorům udělena dodatečná práva, která odrážejí jejich zkušenosti s editací a vedení v rámci editační komunity. Nejpřímočařejší jsou práva editallu, která umožňují editoru přístup ke všem kategoriím v adresáři. Meta práva navíc umožňují editorům provádět úkoly, jako je kontrola aplikací editoru, nastavení funkcí kategorií a zpracování externích a interních zpráv o zneužití. Cateditallova práva jsou podobná editallu, ale pouze pro jednu kategorii adresářů. Podobně jsou práva catmodu podobná meta, ale pouze pro jednu kategorii adresářů. Catmvova práva umožňují editorům provádět změny v ontologii adresářů přesunem nebo přejmenováním kategorií. Všechna tato práva uděluje personál, obvykle po diskusi s meta editory.

V srpnu 2004 byla zavedena nová úroveň privilegií nazvaná admin. Status administrátora byl udělen řadě dlouho sloužících metas personálem. Administrátoři mají možnost udělovat editall+ privilegia jiným editorům a schvalovat nové zásady pro celý adresář, autority, které byly dříve dostupné pouze pro root (staff) editory. Úplný seznam vedoucích editorů je veřejně dostupný.

Jednou z původních motivací pro založení Gnuhoo/Newhoo/ODP byla frustrace, kterou mnoho lidí zažilo při uvádění svých stránek na Yahoo! Adresář. Yahoo! však od té doby zavedlo placenou službu pro včasné zvážení přihlášených stránek. Tuto stopu následovalo mnoho dalších adresářů. Některé nepřijímají vůbec žádné bezplatné přihlášky. Oproti tomu ODP zachovala svou politiku bezplatného přihlášení stránek pro všechny typy stránek – jako jediná z hlavních obecných adresářů tak učinila.

Jedním z výsledků byla postupná divergence mezi ODP a ostatními adresáři v rovnováze obsahu. Model placené inkluze zvýhodňuje ty, kteří jsou schopni a ochotni platit, takže v adresářích, které jej používají, převažují komerční stránky. (Viz například počáteční dopad na Looksmart. ) Zatímco adresář obsazený dobrovolníky bude odrážet cíle a zájmy těchto dobrovolníků. ODP uvádí vysoký podíl informačních a neziskových stránek.

Dalším důsledkem politiky bezplatného předkládání návrhů je, že ODP má enormní množství návrhů. ODP má nyní přibližně dva miliony návrhů, z velké části kvůli spamu a nesprávně podaným stránkám. Průměrná doba zpracování návrhů na stránkách se tedy s každým rokem prodlužuje. Dobu však nelze předvídat, protože změna je tak velká: návrh může být zpracován během několika hodin nebo může trvat několik let.

Obvinění z nekalých editačních praktik

Dlouhodobě se objevují obvinění, že dobrovolní redaktoři ODP příznivě zacházejí se svými vlastními webovými stránkami a současně maří snahy jejich konkurence v dobré víře. Taková obvinění mají na svědomí zaměstnanci ODP a redaktoři metadat, kteří mají pravomoc zahájit disciplinární řízení proti dobrovolným redaktorům, kteří jsou podezřelí z účasti na nekalých redakčních praktikách. V roce 2003 zavedla ODP nový systém veřejných zpráv o zneužívání, který umožňuje široké veřejnosti hlásit a sledovat obvinění z nekalého chování redaktorů pomocí online formuláře.

Na počátku historie ODP její pracovníci poskytli zástupcům vybraných webových stránek, jako je například časopis Rolling Stone, editační přístup na ODP, aby mohli uvést mnoho jednotlivých stránek z těchto webových stránek. Použití takových profesionálních poskytovatelů obsahu zaniklo a experiment se již neopakoval.

V pozadí některých kontroverzí kolem ODP je její vlastnictví a řízení. Mnoho z původních dobrovolníků GnuHoo mělo pocit, že byli oklamáni, aby se připojili ke komerčnímu podniku.[Jak odkazovat a odkaz na shrnutí nebo text] Většina těchto kontroverzí utichla, když byl projekt přejmenován na NewHoo. Navíc, když Netscape projekt získal, přejmenoval jej na ODP a zveřejnil obsah ODP pod otevřenou licencí obsahu, kritika ODP téměř zmizela. Nicméně, jak se obsah ODP stal široce využívaný většinou velkých vyhledávačů a webových adresářů, otázka vlastnictví a řízení ODP se znovu vynořila.

Doporučujeme:  Binokulární nepoměr

V době vzniku ODP se příliš nepřemýšlelo o tom, jak by měla být ODP řízena, a neexistovala žádná oficiální fóra, směrnice nebo FAQs. ODP v podstatě začínala jako svobodná pro všechny. Dokonce i poté, co ODP založila svá interní redaktorská fóra, mnozí redaktoři si blaženě neuvědomovali, že tato fóra existují, dokud je na fóra nenavedl jeden z jejich kolegů redaktorů. Navíc vzhledem k tomu, že ODP zpočátku neměla žádné oficiální pokyny, redaktoři ODP si mezi sebou prostě vyříkali nějaký konsenzus a zveřejnili neoficiální FAQs.

Jak šel čas, redaktorská fóra ODP se stala de facto parlamentem ODP, a když některý ze zaměstnanců ODP vyvěsil na fórech své stanovisko, bylo to odloženo jako oficiální rozhodnutí. (Jinými slovy, „štáb promluvil“). Došlo také ke krátkému pokusu o zklidnění redaktorských fór ODP, ale bylo od něj upuštěno jako od protikladu rovnostářských principů, na kterých měla být komunita ODP založena. I přesto začali zaměstnanci ODP dávat důvěryhodným vedoucím redaktorům další redakční práva, včetně možnosti schvalovat nové redaktorské aplikace, což nakonec vedlo ke stratifikované hierarchii povinností a privilegií mezi redaktory ODP, přičemž placení zaměstnanci ODP měli poslední slovo ohledně politiky a postupů ODP.

Obvinění, že redaktoři jsou odvoláni za kritiku politik

Placení zaměstnanci ODP čas od času zavedli kontroverzní politiku a dobrovolní redaktoři, kteří nesouhlasí způsoby, jež zaměstnanci považují za nezdvořilé, mohou být zbaveni svých práv na editaci. Jeden údajný příklad toho byl zaznamenán na XODP Yahoo! eGroup v květnu 2000. Nejstarším známým odhalením byl Life After the Open Directory Project, sloupek hostů z 1. června 2000, který pro Traffick.com napsal David F. Prenatt, Jr. (bývalý redaktor ODP „netesq“) poté, co přišel o svá práva na editaci ODP. Dalším pozoruhodným příkladem byl dobrovolný redaktor známý pod přezdívkou The Cunctator, který byl z ODP vyloučen brzy poté, co 24. října 2000 zaslal Slashdotu článek, který kritizoval změny v politice ODP v oblasti autorských práv.

Nepotlačená diskuse o údajných nedostatcích ODP se stala běžnější na mainstreamových diskusních fórech Webmaster.[Jak odkazovat a odkaz na shrnutí nebo text]

Na postupy odstraňování redaktorů ODP dohlížejí zaměstnanci ODP a editoři meta. Podle oficiálních redakčních pokynů ODP jsou redaktoři odstraňováni kvůli hrubým redakčním praktikám nebo neslušnému chování. Diskuse, které mohou vyústit v disciplinární řízení proti dobrovolným redaktorům, probíhají na soukromém fóru, kam mají přístup pouze zaměstnanci ODP a editoři meta, a dobrovolní redaktoři, o kterých se diskutuje, nejsou informováni o tom, že taková řízení probíhají. Někteří lidé považují toto uspořádání za nechutné, chtějí místo toho diskusi modelovanou spíše jako soudní proces konaný v americkém soudním systému.

V článku Editor Removal Explained, ODP meta editor Arlarson uvádí, že „velký zmatek ohledně odstranění editorů z ODP vyplývá z falešných nebo zavádějících prohlášení bývalých editorů“.

ODP má zavedenou politiku, která zakazuje všem současným redaktorům ODP, kteří jsou schopni cokoliv vědět, diskutovat o důvodech pro odstranění konkrétního editoru. V minulosti to vedlo k tvrzením, že mnoha redaktorům ODP nezbývá než se divit, proč se nemohou přihlásit do ODP, aby mohli provádět svou editační práci. ODP je však nyní nastaven tak, že když se někdo pokusí přihlásit do ODP pomocí deaktivovaného přihlášení editoru, zobrazí se obecná webová stránka, která informuje odstraněného editora, že bylo učiněno konečné rozhodnutí ohledně deaktivace jeho přihlášení a poskytne seznam možných důvodů, proč takové rozhodnutí mohlo být učiněno.

Vedoucí redaktoři ODP mají možnost připojit poznámky „varování“ nebo „neuvádět“ k jednotlivým doménám, ale žádný editor nemá jednostrannou možnost blokovat určité stránky, aby byly uvedeny. Weby s těmito poznámkami mohou být stále uvedeny a občas jsou poznámky po nějaké diskusi odstraněny.

ODP má vlastní interní fóra, jejichž obsah je určen pouze pro redaktory, kteří spolu komunikují především o editačních tématech.

Fóra ODP Editor byla původně spuštěna na softwaru, který byl založen na proprietárním systému Ultimate Bulletin Board. V červnu 2003 přešli na systém phpBB.