Outils pour utilisateurs

Outils du site


admin:travail_termine

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
admin:travail_termine [2017/07/13 18:30]
fpoulain [Nouvelle machine]
admin:travail_termine [2017/07/13 18:47] (Version actuelle)
fpoulain [Réparation d'une panne]
Ligne 1: Ligne 1:
 ===== Définition d'un travail terminé ===== ===== Définition d'un travail terminé =====
  
-De manière ​générales, les exigences ​énoncées ci-dessous visent à maximiser la continuité des services :+Rappel : [[http://​wiki.april.org/​w/​Charte_Groupe_Administration_Systeme#​D.C3.A9finition_d.27un_travail_termin.C3.A9|Charte du Groupe Administration Système]] 
 + 
 +De manière ​générale, les demandes ​énoncées ci-dessous visent à maximiser la continuité des services :
   * par la minimisation du coût de maintenance ultérieure ;   * par la minimisation du coût de maintenance ultérieure ;
   * par la minimisation de l'​impact de chaque élément sur l'​ensemble de l'​infra ;   * par la minimisation de l'​impact de chaque élément sur l'​ensemble de l'​infra ;
Ligne 16: Ligne 18:
 ===== Nouveau service ===== ===== Nouveau service =====
  
-  * Documenté ​dans http://​127.0.0.1:​8080/​dokuwiki/​doku.php +  * Documenté ​; 
-  * Un service est associé à une alerte nagios +  * Monitoré ; 
-  * Au moins deux admins savent intervenir ​sur une technologie donnée +  * Backupé (en particulier,​ écrire un hook si nécessaire) ; 
-  * Une procédure de test automatique permet de valider un service ou une fonctionnalité (depuis la réunion admin sys du 11 octobre 2013 ce point est facultatif même si recommandé)+  * Au moins deux admins savent intervenir ​dessus ;
  
 +Par ailleurs :
 +  * Dans l'​hypothèse ou le service est installable via apt, il faut motiver dans la doc le choix éventuel de ne pas passer par cette procédure.
 +  * Dans l'​hypothèse où le service est installé sur plusieurs machines, il faut motiver le choix de ne pas passer par un paquet déployé par apt depuis l'​infrastructure chapril.
 +
 +Enfin, il faut veiller aux [[services:​recommandations-avant-mises-prod|recommandations de mise en production des services]].
 ===== Réparation d'une panne ===== ===== Réparation d'une panne =====
  
-  * Une panne est réparée lorsqu'​elle est +Dans l'​idéal,​ une panne est réparée lorsqu'​elle est : 
-    * diagnostiquée + 
-    * associée a un [[http://​agir.april.org/​projects/​admins|ticket dans redmine]] +  ​* diagnostiquée 
-    * assignée a quelqu'​un +  * associée a un [[http://​agir.april.org/​projects/​chaton|ticket dans redmine]] 
-    * un correctif est décrit dans le ticket +  * assignée a quelqu'​un 
-    * une [[https://​agir.april.org/​projects/​admins/​repository/​revisions/​master/​entry/​puppetmaster/​modules/​april_nagios/​README.md|alerte de monitoring]] (nouvelle si besoin) correspond au probleme +  * un correctif est décrit dans le ticket 
-    * le correctif est appliqué +  * une alerte de monitoring (nouvelle si besoin) correspond au problème 
-    * l'​alerte de monitoring valide que le problème est corrigé+  * le correctif est appliqué 
 +  * l'​alerte de monitoring valide que le problème est corrigé 
 + 
 +Lorsque c'est pertinent, il faut encourager la remontée upstream du correctif.
  
admin/travail_termine.1499963414.txt.gz · Dernière modification: 2017/07/13 18:30 par fpoulain