Procédure : Mettre à Jour le Système Proxmox
1. Objectif du Document
Ce document décrit la procédure sûre et contrôlée pour mettre à jour les serveurs (nœuds) de notre cluster Proxmox VE.
L’objectif est de maintenir notre hyperviseur à jour avec les derniers correctifs de sécurité, les améliorations de performance et les nouvelles fonctionnalités, tout en minimisant l’impact sur les services en production.
2. Le “Pourquoi” : L’Entretien de la Fondation
Notre cluster Proxmox est la fondation sur laquelle repose toute notre infrastructure. Tout comme les fondations d’un bâtiment, nous devons nous assurer qu’elles sont solides et ne présentent aucune fissure.
Mettre à jour Proxmox permet de :
- 🛡️ Combler les Failles de Sécurité : C’est la raison la plus importante. Des vulnérabilités sont découvertes en permanence dans les composants du système (le noyau Linux, QEMU, etc.). Les mises à jour les corrigent.
- ⚙️ Améliorer la Stabilité : Les mises à jour corrigent des bugs qui pourraient provoquer des plantages ou des comportements inattendus.
- 🚀 Gagner en Performance : Les nouvelles versions apportent souvent des optimisations, par exemple dans la gestion du stockage ou du réseau.
Négliger ces mises à jour, c’est laisser les fondations de notre infrastructure se fragiliser avec le temps.
La Règle d'Or : Jamais tous en même temps !
On ne met JAMAIS à jour tous les nœuds d’un cluster en même temps. La procédure doit être séquentielle, nœud par nœud, en utilisant les mécanismes de haute disponibilité pour éviter toute interruption de service.
3. Prérequis
- Une fenêtre de maintenance a été planifiée. Bien que la procédure soit conçue pour n’avoir aucun impact, la prudence est de mise.
- Toutes les VMs et conteneurs critiques sont configurés pour la Haute Disponibilité.
- Avoir un accès à l’interface web de Proxmox ou un accès SSH à chaque nœud.
4. Procédure de Mise à Jour Séquentielle
Cette procédure doit être répétée pour chaque nœud, l’un après l’autre.
Étape 1 : Choisir un Nœud et le Mettre en Mode Maintenance
- Choisissez le premier nœud à mettre à jour (ex:
srv-bpr-proxmox-01). - Migration des Machines : Nous devons vider le nœud de toutes ses VMs et conteneurs.
- Pour les machines en HA :
- Dans l’interface Proxmox, sélectionnez le nœud
srv-bpr-proxmox-01. - Allez dans l’onglet
HAet cliquez sur le boutonEvacuate. - Proxmox va automatiquement migrer à chaud toutes les VMs HA vers les autres nœuds du cluster.
- Dans l’interface Proxmox, sélectionnez le nœud
- Pour les machines non-critiques (sans HA) :
- Migrez-les manuellement. Faites un clic droit sur chaque VM ou CT restant,
Migrate, et choisissez un autre nœud comme destination.
- Migrez-les manuellement. Faites un clic droit sur chaque VM ou CT restant,
- Pour les machines en HA :
- Vérifiez que le nœud n’exécute plus aucune machine virtuelle.
Étape 2 : Lancer les Mises à Jour
- Toujours sur le nœud
srv-bpr-proxmox-01, allez dans l’onglet>_ Shellpour ouvrir un terminal. - Mettre à jour la liste des paquets :
apt update - Lancer la mise à jour complète du système :
apt dist-upgrade -y - L’opération peut prendre plusieurs minutes. Lisez attentivement les messages. Si l’installeur vous pose une question sur un fichier de configuration, le choix par défaut (
keep the local version currently installed) est généralement le plus sûr.
Étape 3 : Redémarrer le Nœud
Une mise à jour, notamment celle du noyau Linux, nécessite un redémarrage pour être appliquée.
- Dans le shell, tapez la commande :
reboot - Surveillez le redémarrage du nœud depuis l’interface Proxmox. Il devrait redevenir vert et accessible après quelques minutes.
Étape 4 : Remettre le Nœud en Service
- Une fois le nœud redémarré et en ligne, vous pouvez y replacer des machines virtuelles. Proxmox le fera automatiquement au fur et à mesure des besoins.
- Si vous aviez utilisé la fonction
Evacuateet que vous voulez rééquilibrer la charge manuellement, vous pouvez migrer quelques VMs vers le nœud fraîchement mis à jour.
Étape 5 : Répéter pour les Autres Nœuds
Passez au nœud suivant (srv-bpr-proxmox-02) et répétez les étapes 1 à 4. Continuez ainsi jusqu’à ce que les 6 nœuds du cluster soient à jour.
5. Points de Validation
- Vérification de la version : Après le redémarrage, connectez-vous en SSH au nœud mis à jour et tapez
pveversion -v. Vérifiez que les versions des paquets (pve-manager,qemu-server,linux-kernel, etc.) ont bien été mises à jour. - Monitoring de l’impact : Pendant toute la procédure, gardez un œil sur le tableau de bord Zabbix/Grafana. Il ne devrait y avoir aucune alerte majeure (à part celles indiquant qu’un nœud est en train de redémarrer, ce qui est normal).
- Validation des services : Après la mise à jour de chaque nœud, vérifiez qu’une VM qui tourne dessus est toujours accessible et fonctionne normalement.