Křížová validace

Křížová validace, někdy nazývaná odhad rotace , je statistická praxe rozdělení vzorku dat do podskupin tak, že analýza je zpočátku provedena na jedné podskupině, zatímco ostatní podskupiny jsou ponechány pro následné použití při potvrzení a validaci počáteční analýzy.

Počáteční podmnožina dat se nazývá tréninková sada, ostatní podmnožiny se nazývají validační nebo testovací sady.

Teorii křížové validace představil Seymour Geisser. Je důležitá pro ochranu před testováním hypotéz, které data naznačují („chyba typu III“), zejména tam, kde jsou další vzorky nebezpečné, nákladné nebo nemožné (nepohodlná věda) shromáždit.

Běžné typy křížové validace

Holdoutova validace není křížovou validací v běžném slova smyslu, protože data nejsou nikdy křížově převáděna. Pozorování se volí náhodně z počátečního vzorku, aby se vytvořily validační data, a zbývající pozorování se uchovávají jako tréninková data. Pro validační data se obvykle používá méně než třetina počátečního vzorku.

V K-násobné křížové validaci je původní vzorek rozdělen na K dílčí vzorky. Z K dílčích vzorků je jeden dílčí vzorek uchován jako validační data pro testování modelu a zbývající K − 1 dílčí vzorky jsou použity jako tréninková data. Proces křížové validace se pak opakuje K krát (přehyby), přičemž každý z K dílčích vzorků je použit přesně jednou jako validační data. Výsledky K ze záhybů pak lze zprůměrovat (nebo jinak kombinovat) a vytvořit tak jediný odhad.

Vynechat jednorázové křížové validace

Jak název napovídá, vynechaná křížová validace (LOOCV) zahrnuje použití jediného pozorování z původního vzorku jako validačních dat a zbývajících pozorování jako tréninkových dat. To se opakuje tak, že každé pozorování ve vzorku je použito jednou jako validační data. To je stejné jako křížová validace K-krát s K rovnajícím se počtu pozorování v původním vzorku, i když efektivní algoritmy existují v některých případech, například s regresí jádra a s Tichonovovou regularizací.

Doporučujeme:  Jak budovat smysluplná spojení

Chyba odhadu parametrů může být vypočtena. Běžné chybové metriky jsou střední kvadratická chyba (MSE) a základní střední kvadratická chyba (RMSE), respektive odhadovaná odchylka a směrodatná odchylka křížové validace.