Obsah
Psychoakustika
Psychoakustika je věda o vnímání zvuku. Zkoumá subjektivní odezvu lidského sluchového systému na fyzikální zvukové podněty. Zatímco fyzika měří frekvenci (Hz) a intenzitu (dB), psychoakustika řeší výšku a hlasitost tak, jak je slyší člověk.
Tento obor je klíčový pro vývoj audio kodeků, protože umožňuje identifikovat části zvukového signálu, které mozek ignoruje, a ty následně z datového toku odstranit.
Klíčové jevy psychoakustiky
Lidské ucho není dokonalý mikrofon; má svá omezení, která digitální technologie využívají:
1. Absolutní práh slyšitelnosti
Lidské ucho není stejně citlivé na všechny frekvence. Nejlépe slyšíme v pásmu 2 kHz až 5 kHz (klíčové pro srozumitelnost lidské řeči). Zvuky pod tímto prahem (velmi tiché nebo na extrémních frekvencích) mozek neregistruje a kodeky je mohou vypustit.
2. Sluchové maskování (Auditory Masking)
Jde o nejdůležitější jev pro ztrátovou kompresi. Silný zvuk dokáže „přebít“ a učinit neslyšitelným jiný, slabší zvuk, který se vyskytuje v jeho blízkosti.
- Frekvenční maskování: Silný tón na frekvenci 1000 Hz způsobí, že neslyšíme tichý zvuk na frekvenci 1100 Hz.
- Časové maskování: Silný zvuk maskuje slabší zvuky, které zazní těsně před ním (pre-masking) nebo po něm (post-masking).
3. Kritická pásma (Critical Bands)
Vnitřní ucho (hlemýžď) funguje jako sada filtrů. Pokud do jednoho „filtru“ (kritického pásma) vstoupí více zvuků najednou, mozek je vnímá jako jeden celek nebo šum. Kodeky v těchto pásmech kvantují data méně přesně, čímž šetří místo.
Aplikace v digitálním audiu
Využití psychoakustických modelů v kodecích (MP3, AAC, Ogg Vorbis) probíhá následovně:
- Analýza signálu: Kodér rozdělí zvuk na krátké časové úseky a provede jejich spektrální analýzu.
- Výpočet maskovacího prahu: Pro každý úsek se určí, které tóny jsou maskovány silnějšími složkami.
- Kvantování: Maskované (neslyšitelné) složky se buď zcela odstraní, nebo se uloží s velmi nízkou přesností. Tím se drasticky sníží velikost souboru.
Vliv na kvalitu a únavu z poslechu
Špatně nastavený psychoakustický model (např. MP3 s nízkým bitrate 64 kbps) může vést k:
- Artefaktům: „Kovový“ zvuk činelů nebo rozmazané výšky.
- Únavě z poslechu: Mozek se podvědomě snaží „dopočítat“ chybějící data, která model odstranil chybně, což po delší době způsobuje únavu.
Zajímavost: Psychoakustika se využívá i v architektuře při navrhování koncertních sálů nebo v automobilovém průmyslu, kde se zvuk motoru ladí tak, aby zněl pro řidiče „sportovně“ nebo naopak „kultivovaně“.
— Viz také: Audio Kodeky, MP3, Vzorkovací frekvence, Bitová hloubka
