Uživatelské nástroje

Nástroje pro tento web


id3-tagy

Psychoakustika

Psychoakustika je věda o vnímání zvuku. Zkoumá subjektivní odezvu lidského sluchového systému na fyzikální zvukové podněty. Zatímco fyzika měří frekvenci (Hz) a intenzitu (dB), psychoakustika řeší výšku a hlasitost tak, jak je slyší člověk.

Tento obor je klíčový pro vývoj audio kodeků, protože umožňuje identifikovat části zvukového signálu, které mozek ignoruje, a ty následně z datového toku odstranit.

Klíčové jevy psychoakustiky

Lidské ucho není dokonalý mikrofon; má svá omezení, která digitální technologie využívají:

1. Absolutní práh slyšitelnosti

Lidské ucho není stejně citlivé na všechny frekvence. Nejlépe slyšíme v pásmu 2 kHz až 5 kHz (klíčové pro srozumitelnost lidské řeči). Zvuky pod tímto prahem (velmi tiché nebo na extrémních frekvencích) mozek neregistruje a kodeky je mohou vypustit.

2. Sluchové maskování (Auditory Masking)

Jde o nejdůležitější jev pro ztrátovou kompresi. Silný zvuk dokáže „přebít“ a učinit neslyšitelným jiný, slabší zvuk, který se vyskytuje v jeho blízkosti.

  • Frekvenční maskování: Silný tón na frekvenci 1000 Hz způsobí, že neslyšíme tichý zvuk na frekvenci 1100 Hz.
  • Časové maskování: Silný zvuk maskuje slabší zvuky, které zazní těsně před ním (pre-masking) nebo po něm (post-masking).

3. Kritická pásma (Critical Bands)

Vnitřní ucho (hlemýžď) funguje jako sada filtrů. Pokud do jednoho „filtru“ (kritického pásma) vstoupí více zvuků najednou, mozek je vnímá jako jeden celek nebo šum. Kodeky v těchto pásmech kvantují data méně přesně, čímž šetří místo.

Aplikace v digitálním audiu

Využití psychoakustických modelů v kodecích (MP3, AAC, Ogg Vorbis) probíhá následovně:

  1. Analýza signálu: Kodér rozdělí zvuk na krátké časové úseky a provede jejich spektrální analýzu.
  2. Výpočet maskovacího prahu: Pro každý úsek se určí, které tóny jsou maskovány silnějšími složkami.
  3. Kvantování: Maskované (neslyšitelné) složky se buď zcela odstraní, nebo se uloží s velmi nízkou přesností. Tím se drasticky sníží velikost souboru.

Vliv na kvalitu a únavu z poslechu

Špatně nastavený psychoakustický model (např. MP3 s nízkým bitrate 64 kbps) může vést k:

  • Artefaktům: „Kovový“ zvuk činelů nebo rozmazané výšky.
  • Únavě z poslechu: Mozek se podvědomě snaží „dopočítat“ chybějící data, která model odstranil chybně, což po delší době způsobuje únavu.
Zajímavost: Psychoakustika se využívá i v architektuře při navrhování koncertních sálů nebo v automobilovém průmyslu, kde se zvuk motoru ladí tak, aby zněl pro řidiče „sportovně“ nebo naopak „kultivovaně“.

Viz také: Audio Kodeky, MP3, Vzorkovací frekvence, Bitová hloubka

id3-tagy.txt · Poslední úprava: autor: admin