Obsah

Auto Scaling

Auto Scaling je metoda správy IT prostředků v rámci cloudu, která automaticky upravuje kapacitu běžících služeb (výpočetní výkon, paměť, počet instancí) na základě aktuální poptávky. Cílem je zajistit vysokou dostupnost aplikace při zachování minimálních nákladů.


Vertikální vs. Horizontální škálování

V encyklopedii je důležité rozlišovat dva základní přístupy k růstu výkonu:

1. Vertikální (Scaling Up)

Znamená navýšení výkonu stávajícího stroje (přidání CPU, RAM).

2. Horizontální (Scaling Out)

Znamená přidání dalších identických strojů (instancí) do sítě.


Jak Auto Scaling funguje?

Proces automatického škálování se obvykle opírá o tři základní komponenty:

1. Metriky (Monitoring)

Systém neustále sleduje vytížení zdrojů. Mezi nejčastější metriky patří:

2. Pravidla a politiky (Policies)

Definují hranice (prahové hodnoty), kdy má systém zasáhnout:

3. Skupina automatického škálování (ASG)

Kolekce instancí, se kterými systém pracuje jako s jedním celkem. Správce nastavuje:


Výhody Auto Scalingu


Typy škálovacích politik


Propojení s Load Balancerem

Auto Scaling úzce spolupracuje s Load Balancerem (rozptylovačem zátěže). Když Auto Scaling přidá nový server, Load Balancer jej automaticky zaregistruje a začne na něj posílat část uživatelského provozu.


Související pojmy: Cloud Computing, Load Balancing, AWS, Azure, Microservices, High Availability.