Skóre testu je informace, obvykle číslo, která vyjadřuje výkon zkoušejícího v testu. Jednou z formálních definic je, že je to „souhrn důkazů obsažených v odpovědích zkoušejícího na položky testu, které se vztahují k měřenému konstruktu nebo konstruktům“.
Skóre testů se interpretuje pomocí interpretace s odkazem na normu nebo kritérium, popřípadě obojí. Interpretace s odkazem na normu znamená, že skóre vyjadřuje význam o zkoušené osobě s ohledem na její postavení mezi ostatními zkoušenými osobami. Interpretace s odkazem na kritérium znamená, že skóre vyjadřuje informace o zkoušené osobě s ohledem na konkrétní předmět bez ohledu na skóre ostatních zkoušených osob.
Účelem škálovaného skóre je vykázat skóre u všech zkoušejících na shodné stupnici. Předpokládejme, že test má dvě formy a jedna je obtížnější než druhá. Bylo zjištěno rovnicí, že skóre 65% u formuláře 1 se rovná skóre 68% u formuláře 2. Skóre u obou forem lze převést na stupnici tak, aby tato dvě rovnocenná skóre měla stejné vykázané skóre. Například obě mohou mít skóre 350 na stupnici od 100 do 500.
Dva známé testy ve Spojených státech, které mají škálované skóre, jsou ACT a SAT. Stupnice ACT se pohybuje od 0 do 36 a SAT od 200 do 800 (na sekci). Zdánlivě byly tyto dvě stupnice vybrány tak, aby reprezentovaly průměr a směrodatnou odchylku 18 a 6 (ACT) a 500 a 100. Horní a dolní hranice byly vybrány proto, že interval plus minus tři směrodatné odchylky obsahuje více než 99% populace. Skóre mimo tento rozsah je obtížné změřit a vracejí malou praktickou hodnotu.
Všimněte si, že škálování neovlivňuje psychometrické vlastnosti testu, je to něco, k čemu dochází po dokončení hodnotícího procesu (a vyrovnání, pokud je přítomno). Proto se nejedná o psychometrickou otázku, ale o otázku public relations.