Outils pour utilisateurs

Outils du site


admin:procedures:redemarrer-maine

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
admin:procedures:redemarrer-maine [2020/02/02 19:27]
admin [Prévenir les usagers]
admin:procedures:redemarrer-maine [2021/04/13 00:01]
cpm [Envoyer un message sur XMPP Chapril]
Ligne 2: Ligne 2:
  
 ===== Actions préalables ===== ===== Actions préalables =====
 +
 +==== Vérifier si un fsck va être déclencher ====
 +
 +Une vérification de disque peut rallonger énormément la durée du redémarrage. Vérifier :
 +<​code>​
 +df | awk '/​^\/​dev/​ {print $1}' | xargs -I {} sh -c 'echo {}; tune2fs -l {}' | awk '/​^\/​dev/​ {print $1} /​^Filesystem state/ {print $3, " ",​$4}'​
 +</​code>​
 +
  
 ==== Prévenir les usagers ==== ==== Prévenir les usagers ====
Ligne 7: Ligne 15:
 === Sur status.chapril.org === === Sur status.chapril.org ===
  
-Ouvrir une action de maintenance sur https://​status.chapril.org/​.+Ouvrir une action de maintenance sur https://​status.chapril.org/ ​
 +  * utiliser le modèle ''​reboot cluster''​ ; 
 +  * renseigner ''​When is this maintenance scheduled for?''​ ; 
 +  * ne pas remplir ''​When did this maintenance complete?''​ ; 
 +  * cocher ''​Notifier les abonnés ?''​.
  
 === Sur chapril@april.org === === Sur chapril@april.org ===
Ligne 30: Ligne 42:
 --  -- 
 François Poulain <​fpoulain@metrodore.fr>​ François Poulain <​fpoulain@metrodore.fr>​
 +</​code>​
 +
 +=== Sur XMPP chapril.org (commande à lancer sur xmpp.cluster.chapril.org) (Brouillon)===
 +
 +Avertir les usagers du service XMPP de l'​interruption,​ en lançant une annonce par le biais d'​ejabberd,​ sur la machine xmpp. 
 +
 +<​code>​
 +xmpp_send_server_notice_all "​Bonjour. Le serveur Chapril va subir un redémarrage à 13h15 et de ce fait les services seront interrompus durant 30 minutes. Chaprilement."​
 </​code>​ </​code>​
  
Ligne 36: Ligne 56:
 Vérifier qui est présent sur les vm : Vérifier qui est présent sur les vm :
 <​code>​ <​code>​
-cluster_guests='​admin bastion dns drop lamp libreoffice mail pad pouet sympa valise xmpp'+cluster_guests='​admin bastion dns drop lamp libreoffice mail pad pouet sympa valise xmpp allo'
 for guest in $cluster_guests ; for guest in $cluster_guests ;
 do do
     echo "===== $guest ====="     echo "===== $guest ====="
     cmd='​for i in $(ps auxwww|grep "​\-bash"​ | awk '​\''​{ print $2 }'​\''​ ); do cat "/​proc/​$i/​environ"​ ; done 2>/​dev/​null |strings |grep GIT_AUTHOR_NAME | sort | uniq'     cmd='​for i in $(ps auxwww|grep "​\-bash"​ | awk '​\''​{ print $2 }'​\''​ ); do cat "/​proc/​$i/​environ"​ ; done 2>/​dev/​null |strings |grep GIT_AUTHOR_NAME | sort | uniq'
-    ssh root@$guest.cluster.chapril.org $cmd+    ssh root@$guest.cluster.chapril.org ​"$cmd"
 done done
  
Ligne 68: Ligne 88:
 <​code>​ <​code>​
 cd /​etc/​libvirt/​qemu cd /​etc/​libvirt/​qemu
-for host in $(ls *xml | sed -e '​s/​.xml//​g'​) ; do virsh shutdown $host ; done; sleep 20; +for host in $(ls *xml | sed -e '​s/​.xml//​g'​) ; do virsh shutdown $host ; done; watch virsh list 
-for host in $(ls *xml | sed -e 's/.xml//​g'​) ; do virsh destroy $host ; done+</code>
  
 ou bien : ou bien :
  
 +<​code>​
 cd /​etc/​libvirt/​qemu cd /​etc/​libvirt/​qemu
-for host in $(ls *xml | sed -e '​s/​.xml//​g'​) ; do virsh shutdown $host ; done; watch virsh list+for host in $(ls *xml | sed -e '​s/​.xml//​g'​) ; do virsh shutdown $host ; done; sleep 20; 
 +for host in $(ls *xml | sed -e '​s/​.xml//​g'​) ; do virsh destroy $host ; done
 </​code>​ </​code>​
  
Ligne 115: Ligne 137:
  
 Et comparer à la liste avant reboot. Et comparer à la liste avant reboot.
 +
 +==== Vérifier le bon démarrage des vm ====
 +
 +Parfois les vm démarre mais en statut « degraded ». Il convient de vérifier par un :
 +<​code>​
 +./do.sh "​systemctl status | head -2"
 +</​code>​
 +
 +Et pour les vm n'​ayant pas un statut « running »,
 +faire la commande suivante pour identifier le service en souffrance :
 +<​code>​
 +systemctl list-units
 +</​code>​
 +
 +==== Vérifier les sondes dans Icinga ====
 +
 +Si un problème subsiste alors les sondes devraient le faire apparaître dans Icinga.
 +Vérifier que les alertes actives sont acceptables.
 +
 +==== Clôturer l'​action de maintenance status.chapril.org ====
 +
 +Éditer l'​action de maintenance :
 +  * Status : sélectionner ''​complete''​ ;
 +  * When did this maintenance complete? : mettre la date et horaire de fin.
 +
 +==== Envoyer un message sur XMPP Chapril ====
 +
 +<​code>​
 +xmpp_send_server_notice_all "​Annonce du Serveur"​ "​L'​opération de maintenance est terminée. En vous souhaitant, au nom de toute l'​équipe du Chapril et de l'​April,​ un agréable usage de nos services libres, éthique et loyaux. Chaprilement."​
 +</​code>​
admin/procedures/redemarrer-maine.txt · Dernière modification: 2021/04/13 00:01 par cpm