Outils pour utilisateurs

Outils du site


admin:procedures:redemarrer-persan

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentesRévision précédente
admin:procedures:redemarrer-persan [2025/11/20 23:12] – lister dynamiquement les VMs plutôt que de les hardcoder pilouadmin:procedures:redemarrer-persan [2026/03/03 10:14] (Version actuelle) – Correction typographique fhenry2
Ligne 3: Ligne 3:
 ===== Actions préalables ===== ===== Actions préalables =====
  
-==== Vérifier si un fsck va être déclencher ====+==== Vérifier si un fsck va être déclenché ====
  
 Une vérification de disque peut rallonger énormément la durée du redémarrage. Vérifier : Une vérification de disque peut rallonger énormément la durée du redémarrage. Vérifier :
-<code>+<code bash>
 df | awk '/^\/dev\/mapper/ {print $1}' | xargs -I {} sh -c 'echo {}; tune2fs -l {}' | awk '/^\/dev/ {print $1} /^Filesystem state/ {print $3, " ",$4}' df | awk '/^\/dev\/mapper/ {print $1}' | xargs -I {} sh -c 'echo {}; tune2fs -l {}' | awk '/^\/dev/ {print $1} /^Filesystem state/ {print $3, " ",$4}'
 </code> </code>
Ligne 13: Ligne 13:
  
 === Sur status.chapril.org === === Sur status.chapril.org ===
 +
 Ouvrir une action de maintenance sur https://status.chapril.org/ : Ouvrir une action de maintenance sur https://status.chapril.org/ :
-  * utiliser le modèle ''reboot cluster''+  * Utiliser le modèle ''reboot cluster''
-  * renseigner ''When is this maintenance scheduled for?''+  * Renseigner ''When is this maintenance scheduled for?''
-  * ne pas remplir ''When did this maintenance complete?''+  * Ne pas remplir ''When did this maintenance complete?''
-  * cocher ''Notifier les abonnés ?''.+  * Cocher ''Notifier les abonnés ?''.
  
 === Sur chapril@april.org puis sur admins@chapril.org === === Sur chapril@april.org puis sur admins@chapril.org ===
  
-Envoyer deux courriels séparés aux listes : chapril@april.org puis admins@chapril.org :+Envoyer deux courriels séparés aux listes : [[chapril@april.org]] puis [[admins@chapril.org]] :
 <code> <code>
 From: François Poulain <fpoulain@metrodore.fr> From: François Poulain <fpoulain@metrodore.fr>
Ligne 50: Ligne 51:
 === Sur les machines === === Sur les machines ===
  
-Vérifier qui est présent sur les vm +Vérifier qui est présent sur les VM 
-<code>+<code bash>
 cluster_guests=$(ssh root@persan.chapril.org "virsh list --name"; ssh root@korat.chapril.org "virsh list --name") cluster_guests=$(ssh root@persan.chapril.org "virsh list --name"; ssh root@korat.chapril.org "virsh list --name")
 for guest in $cluster_guests ; for guest in $cluster_guests ;
Ligne 62: Ligne 63:
 </code> </code>
  
-Pour le cas où un animateur travaillerait sur sa vm sans avoir vu ni le courriel ni status.chapril.org, envoyer un avertissement sur chaque machine. +Pour le cas où un animateur travaillerait sur sa VM sans avoir vu ni le courriel ni ''status.chapril.org'', envoyer un avertissement sur chaque machine. 
-<code>+<code bash>
 ./do.sh "wall 'Bonjour. Reboot SI Chapril à 13h15. Cpm.'" ./do.sh "wall 'Bonjour. Reboot SI Chapril à 13h15. Cpm.'"
 </code> </code>
Ligne 70: Ligne 71:
 === Sur IRC et XMPP === === Sur IRC et XMPP ===
  
-  * IRC : salon ''#chapril'' sur ''irc.libera.chat:6697'' ([[https://webchat.april.org/|webchat]]) +  * IRC : salon ''#chapril'' sur ''irc.libera.chat:6697'' ([[https://webchat.april.org/|webchat]]) ; 
-  * XMPP : ''chapril@muc.chapril.org''+  * XMPP : ''chapril@muc.chapril.org''
 ==== Couper le monitoring ==== ==== Couper le monitoring ====
  
-  * Mettre les hosts concernés en downtime +  * Mettre les //hosts// concernés en //downtime// ; 
-  * Propager les downtimes en questions sur les services des hosts.+  * Propager les //downtimes// en questions sur les services des //hosts//.
  
-Le script suivant peut être utilisé pour couper le monitoring sur les hôtes et propager les downtimes sur les services hébergés. Les identifiants sont définis dans le fichier ''/etc/icinga2/conf.d/api-users.conf'' sur la machine ''admin.cluster.chapril.org'', l'utilitaire ''[[https://github.com/jpmens/jo|jo]]'' ([[https://packages.debian.org/stable/jo|paquet Debian]]) est requis. +Le script suivant peut être utilisé pour couper le monitoring sur les hôtes et propager les //downtimes// sur les services hébergés. 
-<code>+Les identifiants sont définis dans le fichier ''/etc/icinga2/conf.d/api-users.conf'' sur la machine ''admin.cluster.chapril.org''
 +L'utilitaire ''[[https://github.com/jpmens/jo|jo]]'' ([[https://packages.debian.org/stable/jo|paquet Debian]]) est requis. 
 + 
 +<code bash>
 curl -k -s -S -i -u ${ICINGA_USER}:${ICINGA_PASSWORD} -H 'Accept: application/json' \ curl -k -s -S -i -u ${ICINGA_USER}:${ICINGA_PASSWORD} -H 'Accept: application/json' \
  -X POST 'https://icinga.chapril.org:5665/v1/actions/schedule-downtime' \  -X POST 'https://icinga.chapril.org:5665/v1/actions/schedule-downtime' \
Ligne 92: Ligne 97:
         end_time=$(date +%s -d "+1 hour"))"         end_time=$(date +%s -d "+1 hour"))"
 </code> </code>
 +
 ==== Lister les VM actives ==== ==== Lister les VM actives ====
 +
 Noter la liste des VM actives pour comparer avec après le redémarrage. Noter la liste des VM actives pour comparer avec après le redémarrage.
-<code> + 
-virsh list+<code bash
 +virsh list
 </code> </code>
  
 ===== Arrêt de Persan ===== ===== Arrêt de Persan =====
  
-Arrêter les VMs avant de redémarrer Persan:+Arrêter les VM avant de redémarrer Persan.
  
-====== Arrêter les VM ======= +==== Arrêter les VM ==== 
-<code>+ 
 +<code bash>
 cd /etc/libvirt/qemu cd /etc/libvirt/qemu
 virsh list --state-running --name | xargs -I{} virsh shutdown {}; watch virsh list virsh list --state-running --name | xargs -I{} virsh shutdown {}; watch virsh list
 </code> </code>
  
-======= redémarrage de Persan ======= +===== Redémarrage de Persan ===== 
-<code>+ 
 +<code bash>
 reboot reboot
 </code> </code>
  
- +==== Remise en marche de Persan ====
-===== Remise en marche de Persan =====+
  
 Attendre que le système ait fini de démarrer (état à //running//) : Attendre que le système ait fini de démarrer (état à //running//) :
-<code>+<code bash>
 watch "systemctl status | grep State | head -1" watch "systemctl status | grep State | head -1"
 </code> </code>
  
-Démarrer les VM (⚠️ne pas redémarrer la VM ''template''⚠️): +Démarrer les VM 
-<code>+<note warning>Ne pas redémarrer la VM ''template''.</note> 
 +<code bash>
 virsh list --state-shutoff --name  | grep -v template | xargs -I{} virsh start {}; watch virsh list virsh list --state-shutoff --name  | grep -v template | xargs -I{} virsh start {}; watch virsh list
 </code> </code>
 +
 ==== Lister les VM actives ==== ==== Lister les VM actives ====
  
-  virsh list+<code bash> 
 +virsh list 
 +</code>
  
-Et comparer à la liste avant reboot.+Et comparer à la liste avant ''reboot''.
  
-==== Vérifier le bon démarrage des vm ====+==== Vérifier le bon démarrage des VM ====
  
-Parfois les vm démarre mais en statut « degraded ». Il convient de vérifier par un +Parfois les VM démarre mais en statut //degraded//. 
-<code>+Il convient de vérifier par une commande 
 +<code bash>
 ./do.sh "systemctl status | head -2" ./do.sh "systemctl status | head -2"
 </code> </code>
  
-Et pour les vm n'ayant pas un statut « running », +Et pour les VM n'ayant pas un statut //running//, faire la commande suivante pour identifier le service en souffrance : 
-faire la commande suivante pour identifier le service en souffrance : +<code bash>
-<code>+
 systemctl list-units systemctl list-units
 </code> </code>
Ligne 152: Ligne 165:
  
 Éditer l'action de maintenance : Éditer l'action de maintenance :
-  * Status : sélectionner ''complete''+  * //Status// : sélectionner ''complete''
-  * When did this maintenance complete? : mettre la date et horaire de fin.+  * //When did this maintenance complete?// : mettre la date et l’horaire de fin.
admin/procedures/redemarrer-persan.txt · Dernière modification : 2026/03/03 10:14 de fhenry2