Ve statistice je vzorek podmnožinou populace. Populace je obvykle velmi rozsáhlá, takže sčítání lidu nebo úplný výčet všech hodnot v populaci je nepraktický nebo nemožný. Vzorek představuje podmnožinu zvládnutelné velikosti. Vzorky se shromažďují a ze vzorků se počítají statistiky, aby bylo možné ze vzorku vyvozovat závěry nebo extrapolace na populaci. Tento proces shromažďování informací ze vzorku se označuje jako výběr vzorků.
Očekává se, že vzorky budou vybrány tak, aby nepředstavovaly zkreslený pohled na populaci. Vzorek nebude reprezentativní pro populaci, pokud budou z případného vzorku vyloučeni někteří členové populace. Například pokud se výzkumník zajímá o vzorce užívání drog mezi dospívajícími, ale vzorek shromažďuje v místních školách, je vzorek zkreslený, protože vylučuje osoby, které zanechaly studia, a dospívající, kteří se vzdělávají doma. Ke zkreslení může dojít také v případě, že někteří členové populace mají větší nebo menší pravděpodobnost, že budou do vzorku zařazeni, než jiní členové populace. Vzorek získaný ze škol je tedy také zkreslený, protože studenti, kteří zameškají mnoho školních dnů kvůli chronickému onemocnění, budou do vzorku vybráni s menší pravděpodobností než studenti, kteří chodí do školy velmi pravidelně.
Nejlepším způsobem, jak se vyhnout zkreslenému nebo nereprezentativnímu vzorku, je vybrat náhodný vzorek, známý také jako pravděpodobnostní vzorek. Náhodný vzorek je definován jako vzorek, u něhož je pravděpodobnost, že kterýkoli jednotlivý člen populace vybraný jako součást vzorku je přesně stejný jako kterýkoli jiný jednotlivý člen populace. Existuje několik typů náhodných vzorků: prosté náhodné vzorky, systematické vzorky, stratifikované náhodné vzorky a shlukové náhodné vzorky.
Vzorek, který není náhodný, se nazývá nenáhodný vzorek nebo nepravděpodobnostní vzorek. Příkladem nenáhodných vzorků jsou výběry na míru, výběry na základě úsudku, účelové výběry, výběry na základě kvót a výběry na základě sněhové koule.
Z matematického hlediska je při dané náhodné veličině X s rozdělením F vzorek délky souborem nezávislých, identicky rozdělených (iid) náhodných veličin s rozdělením F. Konkrétně představuje n experimentů, ve kterých měříme stejnou veličinu. Například pokud X představuje výšku jedince a měříme jedince, bude výška i-tého jedince. Všimněte si, že vzorek náhodných veličin (tj. soubor měřitelných funkcí) nesmíme zaměňovat s realizacemi těchto veličin (což jsou hodnoty, kterých tyto náhodné veličiny nabývají). Jinými slovy, je funkce reprezentující míru při i-tém pokusu a je hodnota, kterou skutečně dostaneme při provádění měření.