Uživatelské nástroje

Nástroje pro tento web


it:gpu:architektura

Architektura GPU: Od hrubého výkonu k ray tracingu

Moderní grafické karty již nejsou jen „zobrazovadla“. Staly se z nich masivně paralelní superpočítače, které obsahují různé typy specializovaných jader pro specifické matematické úlohy.


1. CUDA jádra a Stream procesory: Základní dělníci

I když mají odlišné názvy, plní v podstatě stejnou roli. Jsou to základní výpočetní jednotky (ALU), které provádějí matematické operace (sčítání, násobení) v obrovském měřítku.

* CUDA jádra (NVIDIA): Marketingový název pro procesory v architektuře CUDA. Jsou seskupeny do bloků zvaných SM (Streaming Multiprocessor). * Stream procesory (AMD): Ekvivalent u AMD (architektury RDNA). Jsou součástí jednotek CU (Compute Units).

Hlavní úkol: Výpočet geometrie, fyziky ve hrách a obecných matematických operací (GPGPU).


2. Ray Tracing (RT) jednotky: Simulace světla

Výpočet odrazů a stínů pomocí sledování paprsků (Ray Tracing) je pro běžná CUDA jádra extrémně náročný. Proto vznikla specializovaná RT jádra.

* Jak fungují: Hardwarově urychlují výpočty průsečíků paprsků s geometrií (tzv. BVH traversal a Ray-Triangle intersection). * Výsledek: Umožňují počítat realistické osvětlení v reálném čase, což by bez nich srazilo FPS na nehratelnou úroveň.


3. Tensor jádra: Specialisté na AI

Tensor jádra jsou unikátní jednotky navržené pro maticové operace, které jsou základem hlubokého učení (Deep Learning) a umělé inteligence.

* Využití v praxi:

  • DLSS (NVIDIA): AI dopočítává chybějící pixely a zvyšuje tak plynulost obrazu.
  • Denoising: Odstraňování šumu z obrazu při ray tracingu.
  • Trénování neuronových sítí: Zásadně zrychlují vědecké výpočty.

Srovnání jednotek v tabulce

Typ jednotky Primární funkce Příklad využití
————–—————–—————–
CUDA / Stream Obecné výpočty (FP32) Geometrie, shadery, fyzika
RT jádra Sledování paprsků Realistické stíny, odrazy
Tensor jádra Maticová matematika AI, DLSS, Upscaling

Hierarchie v čipu (Příklad NVIDIA)

Aby byl čip efektivní, nejsou jádra rozhozena náhodně, ale organizována do struktury:

  1. GPC (Graphics Processing Cluster): Největší bloky čipu.
    1. SM (Streaming Multiprocessor): Obsahuje skupinu CUDA jader, RT jádro a Tensor jádra.
      1. L1 Cache: Velmi rychlá paměť přímo u jader.

Závěr

Výkon moderní GPU už není jen o „počtu jader“, ale o jejich mixu. Pro hráče jsou klíčová RT jádra, pro vědce a grafiky Tensor jádra a pro všeobecný výkon hrubá síla CUDA/Stream procesorů.

Klíčová slova: CUDA, Stream Processors, Ray Tracing, Tensor Cores, Architektura GPU

it/gpu/architektura.txt · Poslední úprava: autor: admin