Klasifikace více tříd

Ve strojovém učení je vícetřídní nebo multinomická klasifikace problémem klasifikace případů do více než dvou tříd.

Zatímco některé klasifikační algoritmy přirozeně umožňují použití více než dvou tříd, jiné jsou ze své podstaty binární algoritmy; ty však lze různými strategiemi změnit na multinomické klasifikátory.

Klasifikace více tříd by neměla být zaměňována s klasifikací s více značkami, kdy je třeba pro každou instanci problému předpovědět více tříd.

Mezi tyto strategie patří strategie jeden-všechny (nebo jeden-všechny, OvA nebo OvR), kdy je pro každou třídu natrénován jeden klasifikátor, který tuto třídu odlišuje od všech ostatních tříd. Predikce se pak provádí tak, že se předpovídá pomocí každého binárního klasifikátoru a vybere se předpověď s nejvyšším skóre důvěryhodnosti (např. nejvyšší pravděpodobnost klasifikátoru, jako je naivní Bayes).

V pseudokódu je algoritmus pro trénování učitele OvA vytvořeného z binárního klasifikačního učitele L následující:

Rozhodování probíhá tak, že se na neviděný vzorek x použijí všechny klasifikátory a předpoví se značka k, pro kterou příslušný klasifikátor vykáže nejvyšší skóre spolehlivosti:

Doporučujeme:  Falešné dilema