Seznamy kmitočtů slov

Ve výpočetní lingvistice je frekvenční seznam seřazený seznam slov (slovních typů) spolu s jejich frekvencí, kde frekvence zde obvykle znamená počet výskytů v daném korpusu. Krátký příklad by mohl být:

Zdá se, že Zipfův zákon platí pro frekvenční seznamy čerpané z delších textů jakéhokoli přirozeného jazyka. Frekvenční seznamy jsou nezbytným předpokladem pro vytvoření elektronického slovníku, který je sám o sobě předpokladem pro širokou škálu aplikací v počítačové lingvistice.

Němečtí lingvisté definují häufigkeitsklasse (frekvenční třída) položky v seznamu pomocí logaritmu základu 2 poměru mezi její frekvencí a frekvencí nejčastější položky. Nejběžnější položka patří do frekvenční třídy 0 (nula) a každá položka, která je přibližně o polovinu častější, patří do třídy 1. Ve výše uvedeném příkladovém seznamu má chybně napsané slovo outragious poměr 76/3789654 a patří do třídy 16.

kde je funkce podlahy.

Doporučujeme:  Systémová funkční lingvistika