Obsah
Architektura GPU: Od hrubého výkonu k ray tracingu
Moderní grafické karty již nejsou jen „zobrazovadla“. Staly se z nich masivně paralelní superpočítače, které obsahují různé typy specializovaných jader pro specifické matematické úlohy.
1. CUDA jádra a Stream procesory: Základní dělníci
I když mají odlišné názvy, plní v podstatě stejnou roli. Jsou to základní výpočetní jednotky (ALU), které provádějí matematické operace (sčítání, násobení) v obrovském měřítku.
* CUDA jádra (NVIDIA): Marketingový název pro procesory v architektuře CUDA. Jsou seskupeny do bloků zvaných SM (Streaming Multiprocessor). * Stream procesory (AMD): Ekvivalent u AMD (architektury RDNA). Jsou součástí jednotek CU (Compute Units).
Hlavní úkol: Výpočet geometrie, fyziky ve hrách a obecných matematických operací (GPGPU).
2. Ray Tracing (RT) jednotky: Simulace světla
Výpočet odrazů a stínů pomocí sledování paprsků (Ray Tracing) je pro běžná CUDA jádra extrémně náročný. Proto vznikla specializovaná RT jádra.
* Jak fungují: Hardwarově urychlují výpočty průsečíků paprsků s geometrií (tzv. BVH traversal a Ray-Triangle intersection). * Výsledek: Umožňují počítat realistické osvětlení v reálném čase, což by bez nich srazilo FPS na nehratelnou úroveň.
3. Tensor jádra: Specialisté na AI
Tensor jádra jsou unikátní jednotky navržené pro maticové operace, které jsou základem hlubokého učení (Deep Learning) a umělé inteligence.
* Využití v praxi:
- DLSS (NVIDIA): AI dopočítává chybějící pixely a zvyšuje tak plynulost obrazu.
- Denoising: Odstraňování šumu z obrazu při ray tracingu.
- Trénování neuronových sítí: Zásadně zrychlují vědecké výpočty.
Srovnání jednotek v tabulce
| Typ jednotky | Primární funkce | Příklad využití |
| ————– | —————– | —————– |
| CUDA / Stream | Obecné výpočty (FP32) | Geometrie, shadery, fyzika |
| RT jádra | Sledování paprsků | Realistické stíny, odrazy |
| Tensor jádra | Maticová matematika | AI, DLSS, Upscaling |
Hierarchie v čipu (Příklad NVIDIA)
Aby byl čip efektivní, nejsou jádra rozhozena náhodně, ale organizována do struktury:
- GPC (Graphics Processing Cluster): Největší bloky čipu.
- SM (Streaming Multiprocessor): Obsahuje skupinu CUDA jader, RT jádro a Tensor jádra.
- L1 Cache: Velmi rychlá paměť přímo u jader.
Závěr
Výkon moderní GPU už není jen o „počtu jader“, ale o jejich mixu. Pro hráče jsou klíčová RT jádra, pro vědce a grafiky Tensor jádra a pro všeobecný výkon hrubá síla CUDA/Stream procesorů.
Klíčová slova: CUDA, Stream Processors, Ray Tracing, Tensor Cores, Architektura GPU
