Outils pour utilisateurs

Outils du site


admin:procedures:redemarrer-korat

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentesRévision précédente
Prochaine révision
Révision précédente
admin:procedures:redemarrer-korat [2024/03/10 02:18] – suppression de drbd pilouadmin:procedures:redemarrer-korat [2025/11/21 18:03] (Version actuelle) – the max conntrack issue is now solved \o/ pitchum
Ligne 7: Ligne 7:
 Une vérification de disque peut rallonger énormément la durée du redémarrage. Vérifier : Une vérification de disque peut rallonger énormément la durée du redémarrage. Vérifier :
 <code> <code>
-df | awk '/^\/dev/\/mapper/ {print $1}' | xargs -I {} sh -c 'echo {}; tune2fs -l {}' | awk '/^\/dev/ {print $1} /^Filesystem state/ {print $3, " ",$4}'+df | awk '/^\/dev\/mapper/ {print $1}' | xargs -I {} sh -c 'echo {}; tune2fs -l {}' | awk '/^\/dev/ {print $1} /^Filesystem state/ {print $3, " ",$4}'
 </code> </code>
  
Ligne 19: Ligne 19:
   * cocher ''Notifier les abonnés ?''.   * cocher ''Notifier les abonnés ?''.
  
-=== Sur chapril@april.org ===+=== Sur chapril@april.org puis sur admins@chapril.org === 
 + 
 +Envoyer deux courriels séparés aux listes : chapril@april.org puis admins@chapril.org
  
-Envoyer un courriel aux listes : 
 <code> <code>
 From: François Poulain <fpoulain@metrodore.fr> From: François Poulain <fpoulain@metrodore.fr>
 To: chapril@april.org To: chapril@april.org
-Subject: [Chapril] Reboot du cluster +Subject: [Chapril] Redémarrage du cluster
-Date: Sun, 4 Mar 2018 15:25:18 +0100 +
-Reply-To: chapril@april.org +
-Sender: chapril-request@april.org +
-X-Mailer: Claws Mail 3.11.1 (GTK+ 2.24.25; x86_64-pc-linux-gnu)+
  
 Coucou, Coucou,
Ligne 45: Ligne 42:
  
 À l'aide du compte https://pouet.chapril.org/@chapriladmin : À l'aide du compte https://pouet.chapril.org/@chapriladmin :
 +e
 <code> <code>
 Nous allons redémarrer les serveurs de notre Chapril https://chapril.org pour tenir compte des mises à jour. Nous allons redémarrer les serveurs de notre Chapril https://chapril.org pour tenir compte des mises à jour.
Ligne 56: Ligne 53:
 Vérifier qui est présent sur les vm : Vérifier qui est présent sur les vm :
 <code> <code>
-cluster_guests='admin allo bastion biliz dns drop grof lamp libreoffice ludo mail pad pouet sympa valise xmpp wiki'+cluster_guests=$(ssh root@persan.chapril.org "virsh list --name"; ssh root@korat.chapril.org "virsh list --name")
 for guest in $cluster_guests ; for guest in $cluster_guests ;
 do do
Ligne 70: Ligne 67:
 ./do.sh "wall 'Bonjour. Reboot SI Chapril à 13h15. Cpm.'" ./do.sh "wall 'Bonjour. Reboot SI Chapril à 13h15. Cpm.'"
 </code> </code>
 +
 +=== Sur IRC et XMPP ===
 +
 +  * IRC : salon ''#chapril'' sur ''irc.libera.chat:6697'' ([[https://webchat.april.org/|webchat]])
 +  * XMPP : ''chapril@muc.chapril.org''
 ==== Couper le monitoring ==== ==== Couper le monitoring ====
  
Ligne 75: Ligne 77:
   * Propager les downtimes en questions sur les services des hosts.   * Propager les downtimes en questions sur les services des hosts.
  
-Le script suivant peut être utilisé pour couper le monitoring sur les hôtes et propager les downtimes sur les services hébergés. Les identifiants sont définis dans le fichier ''/etc/icinga2/conf.d/api-users.conf'' sur la machine ''admin.cluster.chapril.org'', l'utilitaire ''[[https://github.com/jpmens/jo|jo]]'' ([[https://packages.debian.org/bullseye/jo|paquet Debian]]) est requis.+Le script suivant peut être utilisé pour couper le monitoring sur les hôtes et propager les downtimes sur les services hébergés. Les identifiants sont définis dans le fichier ''/etc/icinga2/conf.d/api-users.conf'' sur la machine ''admin.cluster.chapril.org'', l'utilitaire ''[[https://github.com/jpmens/jo|jo]]'' ([[https://packages.debian.org/stable/jo|paquet Debian]]) est requis.
 <code> <code>
 curl -k -s -S -i -u ${ICINGA_USER}:${ICINGA_PASSWORD} -H 'Accept: application/json' \ curl -k -s -S -i -u ${ICINGA_USER}:${ICINGA_PASSWORD} -H 'Accept: application/json' \
Ligne 119: Ligne 121:
 </code> </code>
  
-Démarrer DRBD :+Démarrer les VM (⚠️ne pas redémarrer la VM ''template''⚠️):
 <code> <code>
-drbdadm primary korat +virsh list --state-shutoff --name  | grep -v template | xargs -I{} virsh start {}; watch virsh list
-mount /var/lib/libvirt/korat+
 </code> </code>
- 
-Démarrer les VM : 
-<code> 
-cd /etc/libvirt/qemu 
-for host in $(ls *xml | sed -e 's/.xml//g'| grep -v modele) ; do virsh start $host ; done 
-</code> 
- 
-Ne pas s'inquiéter : seuls les machines de korat vont démarrer ; sauf si /var/lib/libvirt/persan est monté, mais ce ne serait pas normal.  
 ==== Lister les VM actives ==== ==== Lister les VM actives ====
  
Ligne 155: Ligne 148:
 Si un problème subsiste alors les sondes devraient le faire apparaître dans Icinga. Si un problème subsiste alors les sondes devraient le faire apparaître dans Icinga.
 Vérifier que les alertes actives sont acceptables. Vérifier que les alertes actives sont acceptables.
 +
 +
  
 ==== Clôturer l'action de maintenance status.chapril.org ==== ==== Clôturer l'action de maintenance status.chapril.org ====
admin/procedures/redemarrer-korat.1710037108.txt.gz · Dernière modification : 2024/03/10 02:18 de pilou