Obsah

Psychoakustika

Psychoakustika je věda o vnímání zvuku. Zkoumá subjektivní odezvu lidského sluchového systému na fyzikální zvukové podněty. Zatímco fyzika měří frekvenci (Hz) a intenzitu (dB), psychoakustika řeší výšku a hlasitost tak, jak je slyší člověk.

Tento obor je klíčový pro vývoj audio kodeků, protože umožňuje identifikovat části zvukového signálu, které mozek ignoruje, a ty následně z datového toku odstranit.

Klíčové jevy psychoakustiky

Lidské ucho není dokonalý mikrofon; má svá omezení, která digitální technologie využívají:

1. Absolutní práh slyšitelnosti

Lidské ucho není stejně citlivé na všechny frekvence. Nejlépe slyšíme v pásmu 2 kHz až 5 kHz (klíčové pro srozumitelnost lidské řeči). Zvuky pod tímto prahem (velmi tiché nebo na extrémních frekvencích) mozek neregistruje a kodeky je mohou vypustit.

2. Sluchové maskování (Auditory Masking)

Jde o nejdůležitější jev pro ztrátovou kompresi. Silný zvuk dokáže „přebít“ a učinit neslyšitelným jiný, slabší zvuk, který se vyskytuje v jeho blízkosti.

3. Kritická pásma (Critical Bands)

Vnitřní ucho (hlemýžď) funguje jako sada filtrů. Pokud do jednoho „filtru“ (kritického pásma) vstoupí více zvuků najednou, mozek je vnímá jako jeden celek nebo šum. Kodeky v těchto pásmech kvantují data méně přesně, čímž šetří místo.

Aplikace v digitálním audiu

Využití psychoakustických modelů v kodecích (MP3, AAC, Ogg Vorbis) probíhá následovně:

  1. Analýza signálu: Kodér rozdělí zvuk na krátké časové úseky a provede jejich spektrální analýzu.
  2. Výpočet maskovacího prahu: Pro každý úsek se určí, které tóny jsou maskovány silnějšími složkami.
  3. Kvantování: Maskované (neslyšitelné) složky se buď zcela odstraní, nebo se uloží s velmi nízkou přesností. Tím se drasticky sníží velikost souboru.

Vliv na kvalitu a únavu z poslechu

Špatně nastavený psychoakustický model (např. MP3 s nízkým bitrate 64 kbps) může vést k:

Zajímavost: Psychoakustika se využívá i v architektuře při navrhování koncertních sálů nebo v automobilovém průmyslu, kde se zvuk motoru ladí tak, aby zněl pro řidiče „sportovně“ nebo naopak „kultivovaně“.

Viz také: Audio Kodeky, MP3, Vzorkovací frekvence, Bitová hloubka