HPA (Horizontal Pod Autoscaler)
DevOps 🔴 SeniorDefinition
Ressource qui ajuste automatiquement le nombre de réplicas d'un Deployment selon des métriques (CPU, mémoire, custom metrics).
Analogie
Un manager qui embauche des intérimaires quand l'affluence augmente et les libère quand ça se calme.
Exemple de code
apiVersion: autoscaling/v2
kind: HorizontalPodAutoscaler
spec:
scaleTargetRef:
kind: Deployment
name: api
minReplicas: 2
maxReplicas: 10
metrics:
- type: Resource
resource: { name: cpu, target: { averageUtilization: 70 } }
Cas d'usage
Adapter automatiquement la capacité aux pics de trafic sans surprovisionnement permanent.
Anti-pattern
Configurer le HPA sans resource requests sur les Pods : métriques faussées.