Kritická šířka pásma

Pojem kritické pásmo, který zavedl Harvey Fletcher ve 40. letech 20. století, označoval šířku frekvenčního pásma tehdy volně definovaného zvukového filtru. Od studií Georga von Békésyho (1960) se tento pojem také doslova vztahuje na specifickou oblast bazilární membrány (podlouhlý tenký plát vláken umístěný ve vnitřním uchu, uvnitř hlemýždě), která se v reakci na přicházející sinusovou vlnu dostává do vibrací. Její délka závisí na elastických vlastnostech membrány a na aktivních mechanismech zpětné vazby působících uvnitř sluchového orgánu. Konvergující psychofyzikální a psychofyziologické experimenty ukazují, že průměrná délka kritického pásma je ~1mm. Psychofyziologicky mohou být vjemy bití a sluchové drsnosti spojeny s neschopností mechanismu analýzy zvukové frekvence vyřešit vstupy, jejichž frekvenční rozdíl je menší než kritická šířka pásma, a s výslednou nestabilitou nebo periodickým „lechtáním“ mechanického systému (bazilární membrány), které rezonují v reakci na tyto vstupy. Kritická pásma také úzce souvisejí s jevy maskování sluchu (tj. snížená slyšitelnost zvukového signálu, když je v přítomnosti druhého signálu vyšší intenzity a ve stejném kritickém pásmu). Maskovací jevy mají široké důsledky, od komplexního vztahu mezi hlasitostí (percepční referenční rámec) a intenzitou (fyzikální referenční rámec) až po algoritmy komprese zvuku.

Filtry se používají v mnoha aspektech audiologie a psychoakustiky včetně periferního sluchového systému. Filtr je zařízení, které zesiluje určité frekvence, zatímco jiné zeslabuje. Pásmový filtr zejména umožňuje, aby řada frekvencí v rámci šířky pásma prošla a zároveň zastavila ty, které jsou mimo mezní frekvence .

Obrázek 1: Pásmový filtr znázorňující střední kmitočet (Fc), dolní (Fl) a horní (Fu) mezní kmitočet a šířku pásma. Horní a dolní mezní kmitočet jsou definovány jako bod, ve kterém amplituda klesne na 3 dB pod vrcholovou amplitudu. Šířka pásma je oblast mezi horní a dolní mezní kmitočtem a je rozsah kmitočtů, kterými prochází filtr.

Tvar a uspořádání bazilární membrány (BM) znamená, že různé frekvence rezonují zvlášť silně v různých bodech podél BM. To vede k tonotopické organizaci citlivosti na frekvenční rozsahy podél BM, které mohou být modelovány jako soubor překrývajících se pásmových průchodových filtrů známých jako „sluchové filtry“ . Sluchové filtry se vyskytují podél bazilární membrány (BM) a zvyšují frekvenční selektivitu hlemýždě (anatomie a fyziologie viz později) a tím i diskriminaci posluchače mezi různými zvuky . Jsou nelineární, na hladině závislé a šířka pásma se zvyšuje od vrcholu k základně hlemýždě, jak se ladění na BM mění z nízké na vysokou frekvenci . Šířka pásma sluchového filtru se nazývá kritická šířka pásma. To poprvé navrhl Fletcher (1940) a je to pásmo frekvencí, které procházejí filtrem. Pokud jsou signál a masker prezentovány současně, pak pouze frekvence maskeru spadající do kritické šířky pásma přispívají k maskování signálu. Čím větší je kritická šířka pásma, tím nižší je poměr signálu a šumu (SNR) a tím více je signál maskován.

Další koncepcí spojenou se sluchovým filtrem je ekvivalentní obdélníkové pásmo (ERB). ERB ukazuje vztah mezi sluchovým filtrem, frekvencí a kritickou šířkou pásma. ERB předává stejné množství energie jako sluchový filtr, kterému odpovídá, a ukazuje, jak se mění se vstupní frekvencí. ERB se vypočítá pomocí následující rovnice:

Doporučujeme:  Flindersova univerzita

Obrázek 2: ERB vztažená ke středové frekvenci. Diagram ukazuje ERB zprůměrovanou z mnoha studií a jak se zvyšuje se zvyšující se středovou frekvencí.

Kde ERB je v Hz a F je středová frekvence v kHz.

ekvivalent cca 0,9 mm na BM. ERB lze převést na stupnici, která se vztahuje k frekvenci a ukazuje polohu sluchového filtru podél BM. Například ERB číslo 3,36 odpovídá frekvenci na apikálním konci BM, zatímco ERB číslo 38,9 odpovídá základně a hodnota 19,5 spadá do poloviny mezi obě.

Jedním z typů filtrů používaných k modelování sluchových filtrů je gammatonový filtr. Poskytuje jednoduchý lineární filtr, který je tedy snadno implementovatelný, ale nemůže sám o sobě zohlednit nelineární aspekty sluchového systému; nicméně se používá v různých modelech sluchového systému.

Psychoakustické ladicí křivky

Tvar sluchových filtrů se zjišťuje otáčením psychoakustických
ladicích křivek o 180 stupňů, změnou tvaru z tvaru ve tvaru
do obráceného tvaru v. Psykoakustické ladicí křivky jsou grafy, které ukazují
prahovou hodnotu předmětu pro tón, když se množství frekvencí přítomných
v maskéru liší.

Psychoakustické ladicí křivky lze měřit metodou vrubového šumu. Tato forma měření může trvat značné množství času a může trvat přibližně 30 minut, než se najde každý maskovaný práh . V metodě vrubového šumu je subjektu prezentován vrubový šum jako maskér a sinusoid (čistý tón) jako signál. Vrubový šum se používá jako maskér, aby se zabránilo subjektu slyšet tepy, které se vyskytují, pokud se použije sinusový maskér . Vrubový
šum je šum, který má vroubek kolem frekvence signálu, který se subjekt snaží detekovat, a obsahuje šum v určité šířce pásma. Mění se šířka pásma šumu a měří se maskované prahové hodnoty pro sinusoid. Maskované prahové hodnoty se vypočítávají současným maskováním, když se signál přehraje subjektu současně s maskérem a ne až po něm.

K získání pravdivého znázornění sluchových filtrů v jednom subjektu je třeba vypočítat mnoho psychoakustických ladicích křivek se signálem na různých frekvencích. Pro každou psychoakustickou ladicí křivku, která je měřena nejméně pět, ale nejlépe mezi třinácti a patnácti prahovými hodnotami, je třeba vypočítat různé šířky zářezů . Je také třeba vypočítat velký počet prahových hodnot, protože sluchové filtry jsou asymetrické, takže prahové hodnoty by měly být také měřeny se zářezem asymetrickým podle frekvence signálu . Vzhledem k mnoha měřením, která jsou potřebná, je doba potřebná k nalezení tvaru sluchových filtrů osoby velmi dlouhá. Pro snížení potřebné doby lze při hledání zamaskovaných prahových hodnot použít vzestupnou metodu. Pokud se pro výpočet prahové hodnoty použije vzestupná metoda, doba potřebná k výpočtu tvaru filtru se dramaticky zkrátí, protože
výpočet prahové hodnoty trvá přibližně dvě minuty . Je to proto, že prahová hodnota, která se zaznamenává, je okamžik, kdy subjekt poprvé uslyší tón, místo toho, kdy reaguje na určitou úroveň podnětu, určité procento času.

Anatomie a fyziologie bazilární membrány

Lidské ucho se skládá ze tří částí: vnějšího, středního a vnitřního ucha. Uvnitř vnitřního ucha sedí hlemýžď. hlemýžď lze popsat jako hlemýždí útvar, který umožňuje přenos zvuku senzorickou cestou, spíše než vodivou cestou. hlemýžď je komplexní struktura, skládající se ze tří vrstev tekutiny. Scala vestibuli a scala media jsou odděleny Reissnerovou membránou, zatímco scala media a scala tympani jsou rozděleny bazilární membránou (BM) . Níže uvedené schéma znázorňuje komplexní uspořádání oddílů a jejich dělení:

Doporučujeme:  Pyramidová vrstva

Obrázek 3: Průřez hlemýždí, znázorňující různé oddíly (jak je popsáno výše)

BM se rozšiřuje, jak postupuje od základny k vrcholu. Proto má základna (nejtenčí část) větší tuhost než vrchol . To znamená, že amplituda zvukové vlny putující bazilární membránou se mění, jak putuje hlemýždí . Když je vibrace přenášena hlemýždí, tekutina uvnitř tří oddílů způsobí, že BM reaguje vlnovitým způsobem. Tato vlna se označuje jako ‚putující vlna‘; tento termín znamená, že bazilární membrána prostě nevibruje jako jeden celek od základny směrem k vrcholu.

Když je zvuk prezentován lidskému uchu, čas potřebný k tomu, aby vlna putovala hlemýždí, je pouhých 5 milisekund.

Při průchodu nízkofrekvenčních vln hlemýžděm se vlna v amplitudě postupně maximalizuje a pak se téměř okamžitě rozpadá. Umístění vibrací na hlemýždi závisí na frekvenci prezentovaných podnětů. Např. nižší frekvence stimulují většinou vrchol, ve srovnání s vyššími frekvencemi, které stimulují bázi hlemýždě. Tento atribut fyziologie bazilární membrány lze ilustrovat ve formě „Place-Frequency Map“:.

Obrázek 4: Bazilární membrána znázorňující změnu frekvence od základny k vrcholu

Bazilikární membrána podporuje Cortiho varhany, které jsou umístěny v médiu scala. Cortiho varhany zahrnují vnější i vnitřní vlasové buňky. V jednom uchu je přibližně 15 000 až 16 000 těchto vlasových buněk. Vnější vlasové buňky mají stereocilii promítající se směrem k tektoriální membráně, která je umístěna nad Cortiho varhany. Stereocilie reagují na pohyb tektoriální membrány, když zvuk způsobuje vibrace prostřednictvím hlemýždě. Když k tomu dojde, stereocilie se oddělí a vytvoří se kanál, který umožňuje chemické procesy; nakonec signál dosáhne osmého nervu, následovaný zpracováním v mozku

Sluchové filtry jsou úzce spjaty s maskováním ve způsobu, jakým jsou měřeny a také ve způsobu, jakým pracují ve sluchovém systému. Jak již bylo popsáno, kritická šířka pásma filtru se zvětšuje se zvyšující se frekvencí, spolu s tím se stává filtr s rostoucí úrovní více asymetrický.

Obrázek 5: Asymetrie sluchového filtru. Diagram znázorňuje rostoucí asymetrii sluchového filtru se zvyšující se vstupní úrovní. Zvýrazněné filtry znázorňují tvar pro vstupní úroveň 90dB (Pink) a vstupní úroveň 20dB (Green). Diagram převzat z Moore a Glasberg

Má se za to, že tyto dvě vlastnosti zvukového filtru přispívají k šíření maskování směrem nahoru, to znamená, že nízké frekvence maskují vysoké frekvence lépe než obráceně. Vzhledem k tomu, že zvýšení hladiny činí sklon nízkých frekvencí mělčím, zvýšením jeho amplitudy to znamená, že nízké frekvence maskují vysoké více než při nižší vstupní úrovni.

Sluchový filtr může snížit účinky masky při poslechu signálu v šumu v pozadí pomocí off-frekvenčního poslechu. To je možné, pokud je střední frekvence masky odlišná od frekvence signálu. Ve většině situací se posluchač rozhodne naslouchat „přes“ sluchový filtr, který je soustředěn na signál, nicméně pokud je přítomna maska, nemusí to být vhodné. Sluchový filtr soustředěný na signál může také obsahovat velké množství masky, která způsobuje, že SNR filtru je nízká a snižuje schopnost posluchačů signál detekovat. Pokud by však posluchač naslouchal přes trochu jiný filtr, který stále obsahuje značné množství signálu, ale méně masky, pak by se SNR zvýšila, což by posluchači umožnilo signál detekovat.

Doporučujeme:  Psychomotor vigilance task

Obrázek 6a a 6b: Off-frequency listening Obrázek 6a ukazuje sluchový filtr soustředěný na signál a jak část masky spadá do tohoto filtru, to bude mít za následek nízkou SNR. Obrázek 6b ukazuje další filtr podél BM, který není soustředěn na signál, ale obsahuje podstatné množství tohoto signálu a méně masky. To snižuje účinek masky zvýšením SNR. Obrázek upraven z Gelfand (2004)

První diagram nahoře ukazuje sluchový filtr soustředěný na signál a jak část masky spadá do tohoto filtru, to bude mít za následek nízkou SNR. Druhý diagram ukazuje další filtr podél BM, který není soustředěn na signál, ale obsahuje podstatné množství tohoto signálu a méně masky. To snižuje účinek masky zvýšením SNR.

Výše uvedené platí pro model výkonového spektra maskování. Obecně tento model spoléhá na sluchový systém obsahující pole sluchových filtrů a volbu filtru se signálem v jeho středu nebo s nejlepším SNR. K maskování přispívá pouze maskér, který spadá do sluchového filtru a práh osoby pro naslouchání signálu je určen touto maskou.

Normální a poškozené sluchové filtry

V „normálním“ uchu má sluchový filtr tvar podobný tomu, který je znázorněn níže. Tento graf odráží frekvenční selektivitu a ladění bazilární membrány .

Obrázek 7: Sluchový filtr ‚normálního‘ hlemýždě

Ladění bazilární membrány je dáno její mechanickou strukturou. Na základně bazilární membrány je úzká a tuhá a nejvíce reaguje na vysoké frekvence. Na vrcholu je však bazilární membrána široká a pružná a nejvíce reaguje na nízké frekvence. Proto různé části bazilární membrány vibrují v závislosti na frekvenci zvuku a dávají maximální odezvu na této konkrétní frekvenci.

U poškozeného ucha má však sluchový filtr v porovnání s „normálním“ uchem jiný tvar.

Obrázek 8: Sluchový filtr poškozeného hlemýždě

Sluchový filtr poškozeného ucha je ve srovnání s normálním uchem plošší a širší. Je to proto, že se snižuje frekvenční selektivita a ladění bazilární membrány při poškození vnějších vlasových buněk. Při poškození pouze vnějších vlasových buněk je filtr na straně s nízkou frekvencí širší. Při poškození vnějších i vnitřních vlasových buněk je filtr na obou stranách širší. To je méně časté. Rozšíření sluchového filtru je hlavně na straně s nízkou frekvencí filtru. To zvyšuje náchylnost k maskování s nízkou frekvencí, tj. k šíření maskování směrem nahoru, jak je popsáno výše.