Cyc

Projekt byl zahájen v roce 1984 jako součást Microelectronics and Computer Technology Corporation. Cílem bylo kodifikovat ve strojově použitelné formě miliony poznatků, které obsahují lidský selský rozum. CycL představila schéma proprietární reprezentace znalostí, které využívalo vztahů prvního řádu. V roce 1986 odhadl Doug Lenat úsilí o dokončení Cycu na 250 000 pravidel a 350 člověkoroků úsilí.
Projekt Cyc byl v roce 1994 odštěpen do Cycorp, Inc. v Austinu v Texasu.

Typické poznatky reprezentované v databázi jsou „Každý strom je rostlina“ a „Rostliny nakonec odumírají“. Na otázku, zda stromy odumírají, může inferenční engine vyvodit zřejmý závěr a správně odpovědět na otázku. Znalostní báze (KB) obsahuje více než milion lidmi definovaných tvrzení, pravidel nebo myšlenek zdravého rozumu. Ty jsou formulovány v jazyce CycL, který je založen na predikátovém počtu a má syntaxi podobnou syntaxi programovacího jazyka Lisp.

Velká část současné práce na projektu Cyc je nadále znalostním inženýrstvím, které představuje fakta o světě ručně a zavádí efektivní mechanismy vyvozování závěrů z těchto znalostí. Stále častěji však práce v Cycorpu zahrnuje poskytnutí schopnosti systému Cyc komunikovat s koncovými uživateli v přirozeném jazyce a pomáhat s procesem vytváření znalostí prostřednictvím strojového učení.

Stejně jako mnoho společností má i Cycorp ambice využít nástroje pro porozumění přirozenému jazyku Cyc k analýze celého internetu za účelem získání strukturovaných dat.

Názvy konceptů v Cycu jsou známé jako konstanty. Konstanty začínají nepovinným „#$“ a rozlišují malá a velká písmena. Existují konstanty pro:

„Bill Clinton patří do sbírky amerických prezidentů“ a

„Paříž je hlavním městem Francie.“

Věty mohou také obsahovat proměnné, řetězce začínající „?“. Tyto věty se nazývají „pravidla“. Jedno důležité pravidlo prosazované o predikátu #$isa zní

s interpretací „je-li OBJ instancí kolekce SUBSET a SUBSET je subllekcí SUPERSET, pak je OBJ instancí kolekce SUPERSET“. Dalším typickým příkladem je

Doporučujeme:  Fotoreceptory

což znamená, že pro každou instanci sbírky #$ChordataPhylum (tj. pro každou chordate) existuje samice zvířete (instance #$FemaleAnimal), která je jeho matkou (popsanou predikátem #$biologicalMother).

Znalostní báze je rozdělena do mikroteorií (Mt), sbírek pojmů a faktů typicky náležejících do jedné konkrétní sféry poznání. Na rozdíl od znalostní báze jako celku, každá mikroteorie musí být bez rozporů. Každá mikroteorie má název, který je pravidelnou konstantou; konstanty mikroteorie obsahují řetězec „Mt“ podle konvence. Příkladem je #$MathMt, mikroteorie obsahující matematické znalosti. Mikroteoteorie mohou dědit od sebe navzájem a jsou uspořádány v hierarchii:
jedna specializace #$MathMt je #$GeometryGMt, mikroteorie o geometrii.

inferenční engine je počítačový program, který se snaží odvodit odpovědi ze znalostní báze.
Cyc inferenční engine provádí obecnou logickou dedukci (včetně modu ponens, modu tollens, univerzální kvantifikace a existenční kvantifikace).

Poslední verze OpenCycu, 2.0, byla vydána v červenci 2009. OpenCyc 1.0 zahrnuje celou Cyc ontologii obsahující statisíce termínů, spolu s miliony tvrzení vztahujících se termíny k sobě navzájem, nicméně to jsou především taxonomická tvrzení, nikoliv komplexní pravidla dostupná v Cycu. Znalostní základna obsahuje 47 000 konceptů a 306 000 faktů a lze ji prohlížet na webových stránkách OpenCycu.

V červenci 2006 Cycorp zdarma uvolnil binárky ResearchCyc 1.0, verze Cycu zaměřená na výzkumnou komunitu. (ResearchCyc byl v beta fázi vývoje během celého roku 2004; beta verze byla vydána v únoru 2005.) Kromě taxonomických informací obsažených v OpenCycu obsahuje ResearchCyc výrazně více sémantických znalostí (tj. další fakta) o konceptech ve své znalostní základně a zahrnuje rozsáhlý lexikon, anglické parsing a generační nástroje a rozhraní založená na Javě pro editaci znalostí a dotazování.

Komplexní Databáze znalostí o terorismu je aplikace cyc ve vývoji, která se bude snažit v konečném důsledku obsahovat všechny relevantní poznatky o „teroristických“ skupinách, jejich členech, vůdcích, ideologii, zakladatelích, sponzorech, přidruženích, zařízeních, lokalitách, financích, schopnostech, záměrech, chování, taktice a úplných popisech konkrétních teroristických událostí. Poznatky jsou uloženy jako výroky v matematické logice, vhodné pro počítačové porozumění a uvažování.

Doporučujeme:  Stupeň (vzdělání)

Cyklopedie je vyvíjena tak, aby nahrazovala klíčová slova cyc na stránkách převzatých ze stránek Wikipedie.

Kritika projektu Cyc