Outils pour utilisateurs

Outils du site


admin:travail_termine

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentesRévision précédente
Prochaine révision
Révision précédente
admin:travail_termine [2017/07/13 16:30] – [Nouvelle machine] fpoulainadmin:travail_termine [2017/07/13 16:47] (Version actuelle) – [Réparation d'une panne] fpoulain
Ligne 1: Ligne 1:
 ===== Définition d'un travail terminé ===== ===== Définition d'un travail terminé =====
  
-De manière générales, les exigences énoncées ci-dessous visent à maximiser la continuité des services :+Rappel : [[http://wiki.april.org/w/Charte_Groupe_Administration_Systeme#D.C3.A9finition_d.27un_travail_termin.C3.A9|Charte du Groupe Administration Système]] 
 + 
 +De manière générale, les demandes énoncées ci-dessous visent à maximiser la continuité des services :
   * par la minimisation du coût de maintenance ultérieure ;   * par la minimisation du coût de maintenance ultérieure ;
   * par la minimisation de l'impact de chaque élément sur l'ensemble de l'infra ;   * par la minimisation de l'impact de chaque élément sur l'ensemble de l'infra ;
Ligne 16: Ligne 18:
 ===== Nouveau service ===== ===== Nouveau service =====
  
-  * Documenté dans http://127.0.0.1:8080/dokuwiki/doku.php +  * Documenté ; 
-  * Un service est associé à une alerte nagios +  * Monitoré ; 
-  * Au moins deux admins savent intervenir sur une technologie donnée +  * Backupé (en particulier, écrire un hook si nécessaire) ; 
-  * Une procédure de test automatique permet de valider un service ou une fonctionnalité (depuis la réunion admin sys du 11 octobre 2013 ce point est facultatif même si recommandé)+  * Au moins deux admins savent intervenir dessus ;
  
 +Par ailleurs :
 +  * Dans l'hypothèse ou le service est installable via apt, il faut motiver dans la doc le choix éventuel de ne pas passer par cette procédure.
 +  * Dans l'hypothèse où le service est installé sur plusieurs machines, il faut motiver le choix de ne pas passer par un paquet déployé par apt depuis l'infrastructure chapril.
 +
 +Enfin, il faut veiller aux [[services:recommandations-avant-mises-prod|recommandations de mise en production des services]].
 ===== Réparation d'une panne ===== ===== Réparation d'une panne =====
  
-  * Une panne est réparée lorsqu'elle est +Dans l'idéal, une panne est réparée lorsqu'elle est : 
-    * diagnostiquée + 
-    * associée a un [[http://agir.april.org/projects/admins|ticket dans redmine]] +  * diagnostiquée 
-    * assignée a quelqu'un +  * associée a un [[http://agir.april.org/projects/chaton|ticket dans redmine]] 
-    * un correctif est décrit dans le ticket +  * assignée a quelqu'un 
-    * une [[https://agir.april.org/projects/admins/repository/revisions/master/entry/puppetmaster/modules/april_nagios/README.md|alerte de monitoring]] (nouvelle si besoin) correspond au probleme +  * un correctif est décrit dans le ticket 
-    * le correctif est appliqué +  * une alerte de monitoring (nouvelle si besoin) correspond au problème 
-    * l'alerte de monitoring valide que le problème est corrigé+  * le correctif est appliqué 
 +  * l'alerte de monitoring valide que le problème est corrigé 
 + 
 +Lorsque c'est pertinent, il faut encourager la remontée upstream du correctif.
  
admin/travail_termine.1499963414.txt.gz · Dernière modification : 2017/07/13 16:30 de fpoulain