percentil je hodnota proměnné, pod kterou spadá určité procento pozorování. Dvacátý percentil je tedy hodnota (nebo skóre), pod kterou lze nalézt 20 procent pozorování. Termín percentil a související termín percentil rank se často používají v popisné statistice i při vykazování skóre z testů s odkazem na normu.
Pětadvacátý percentil je také znám jako první kvartil, padesátý percentil jako medián.
95. percentil je matematický výpočet široce používaný k vyhodnocení pravidelného, trvalého využití vašeho internetového připojení. Důvodem, proč je tato statistika tak užitečná při měření datové propustnosti, je to, že poskytuje velmi přesný obraz nákladů na šířku pásma. 95. percentil říká, že v 95% případů je vaše využití pod touto hodnotou. Stejně tak ve zbývajících 5% případů je vaše využití nad touto hodnotou. 95. percentil je dobré číslo k posouzení, jak velkou šířku pásma skutečně využíváte a pomáhá odfiltrovat špičky využití.
Neexistuje žádná standardní definice percentilu
, nicméně všechny definice přinášejí podobné výsledky, když je počet pozorování velký. Jedna z definic, obvykle uvedená v nedokonalých textech, je, že -tý percentil uspořádaných hodnot se získá prvním výpočtem pořadí , zaokrouhlením na nejbližší celé číslo, a s hodnotou, která odpovídá tomuto pořadí.
Alternativní metoda, používaná v mnoha aplikacích, je místo zaokrouhlování použít lineární interpolaci mezi dvěma nejbližšími řadami. Konkrétně, pokud máme hodnoty , , ,…, , seřazené od nejmenší po největší, definujte percentil odpovídající -té hodnotě jako Tímto způsobem, například pokud percentil odpovídající třetí hodnotě je
Předpokládejme, že nyní chceme vypočítat hodnotu odpovídající percentilu . Pokud nebo , Bereme nebo resp. V opačném případě najdeme celé číslo takové, že , A brát
Kdy , Vzorec dává medián. Kdy je dokonce a , Vzorec dává medián prvních hodnot.
Ve spojení s percentilovou funkcí existuje také vážený percentil, kde se místo celkového počtu počítá procento v celkové hmotnosti. Ve většině tabulkových aplikací neexistuje žádná standardní funkce pro vážený percentil. Jedna metoda pro vážený percentil rozšiřuje výše popsanou metodu. Předpokládejme, že máme kladné váhy , , ,…, , spojené respektive s našimi hodnotami vzorku. Dovolit je -tý parciální součet těchto vah. Pak výše uvedené vzorce jsou zobecněny tím, že se a
Mnoho softwarových balíčků, například Excel, používají následující metodu k odhadu hodnoty, , z percentilu vzestupně uspořádané datové sady obsahující prvky s hodnotami ;
je pak rozdělen do své celočíselné složky, a desetinná složka, , taková, že
Pokud , Pak hodnota pro tento percentil, , je prvním členem objednané datové sady, .
Pokud , Pak hodnota pro tento percentil, , je členem objednané datové sady .
Jinak pak
Alternativní metoda, je jak je uvedeno výše, s vypočteným jako
Vztah mezi percentilem, decilem a kvartilem
Poznámka: Jeden kvartil se rovná 25 percentilům, zatímco 1 decil se rovná 10 percentilům.
Když poskytovatelé internetových služeb účtují „Burstable“ šířku internetového pásma, 95. nebo 98. percentil obvykle odstřihne horních 5% nebo 2% maximálních hodnot šířky pásma v každém měsíci a pak účtuje nejbližší sazbou. Tímto způsobem jsou málo časté špičky ignorovány a zákazník je účtováno spravedlivějším způsobem.
Lékaři často používají jako měřítko relativního zdravotního stavu váhu a výškový percentil kojenců a dětí.
NORMÁLNÍ KURVA A PERCENTILY
Procenta jsou často graficky znázorněna pomocí „normální křivky“. Normální křivka je vždy rozdělena stejným způsobem. Na vrcholu, uprostřed, stojí bod průměru grafovaného rozdělení. Na pravé i levé straně každé z nich je graf rozdělen na 3 stejné části, 1, 2 a 3 napravo a -1, -2, -3 nalevo. Důležité je pamatovat si, že v každé z těchto směrodatných odchylek představuje pevný percentil. Jinými slovy, každá směrodatná odchylka jednotky na ose, včetně směrodatných odchylek jednotek -3 až +3, má specifické percentily, které jsou s nimi vždy spárovány, bez ohledu na data nebo hodnoty v rozdělení. Jaké jsou tedy dvojice percentilů/jednotek směrodatné odchylky? -2 = 2,5 percentil; -1 = 16. percentil; 0 = 50. percentil (také průměr rozdělení, jak bylo uvedeno výše); +1 = 84. percentil; +2 = 97,5. percentil; +3 = 99,8. percentil.
Procento se také stává faktorem při grafickém měření rozdělení. Na každé normální křivce leží 99,7% dat mezi hodnotami -3 a +3, 95% mezi -2 a +2, 68% mezi -1 a +1, 34% mezi 0 a -1 nebo 0 a +1, 16% mezi -1 a -2 nebo +1 a +2 a 2,5% mezi -2 a -3 nebo +2 a +3. Zbývajících 0,3% dat je mezi -3 a záporným nekonečnem nebo +3 a kladným nekonečnem.