HPA (Horizontal Pod Autoscaler)

DevOps 🔴 Senior

Definition

Ressource qui ajuste automatiquement le nombre de réplicas d'un Deployment selon des métriques (CPU, mémoire, custom metrics).

Analogie

Un manager qui embauche des intérimaires quand l'affluence augmente et les libère quand ça se calme.

Exemple de code

apiVersion: autoscaling/v2
kind: HorizontalPodAutoscaler
spec:
  scaleTargetRef:
    kind: Deployment
    name: api
  minReplicas: 2
  maxReplicas: 10
  metrics:
    - type: Resource
      resource: { name: cpu, target: { averageUtilization: 70 } }

Cas d'usage

Adapter automatiquement la capacité aux pics de trafic sans surprovisionnement permanent.

Anti-pattern

Configurer le HPA sans resource requests sur les Pods : métriques faussées.

Termes lies

#devops#kubernetes#interview