Jednou ze základních otázek ve vnímání řeči je, jak se kojenci učí kategorie zvuku řeči. Různé jazyky používají různé sady zvuků řeči. Například angličtina rozlišuje dvě vyslovovací kategorie zvuků, zatímco hindština má tři kategorie. Kojenci se musí naučit, které zvuky jejich rodný jazyk používá a které ne. Zůstává nejasné, jak jsou toho schopni. Někteří výzkumníci naznačili, že určité kategorie zvuku jsou vrozené, to znamená, že jsou geneticky specifikované. Jiní naznačili, že kojenci mohou být schopni naučit se kategorie zvuku jejich rodného jazyka prostřednictvím pasivního poslechu, pomocí procesu zvaného statistické učení.
Studie vnímání řeči u kojenců ukázaly, že kojenci jsou obecně schopni rozlišit více kategorií zvuků řeči než dospělí. Novorozenci jsou schopni rozlišit mnoho zvuků lidských jazyků, ale ve věku kolem 12 měsíců jsou schopni rozlišit pouze ty zvuky, které jsou použity v jejich rodném jazyce.