L'administration système n'est pas une tâche facile, mais elle est gérable avec les bons outils, les bonnes personnes et le bon ensemble de règles à respecter. L’apprentissage de quelques règles met de l’ordre dans le monde souvent chaotique de l’administration système.
Qui de mieux à utiliser comme référence que les personnes qui pratiquent elles-mêmes l’art de l’administration système ? Le groupe SAGE-IE a effectivement publié dix règles pour les administrateurs système dans cette présentation, mais nous avons décidé de prendre leurs cinq principales et d'approfondir un peu chacune d'entre elles pour vous.
La première règle est souvent négligée et quelque peu obscure pour une list de meilleures pratiques. Cependant, son inclusion inhabituelle le rend d’autant plus convaincant. Être un bon citoyen passe par le service à la clientèle. Nous ne considérons pas les utilisateurs du réseau comme nos clients, mais c'est exactement cela.
Par exemple, vos utilisateurs considèrent-ils les administrateurs système comme des facilitateurs et des atouts commerciaux ou les considèrent-ils comme des sources d'obstacles ou de retards de production ? Votre travail consiste à servir vos utilisateurs en maintenant les systèmes, en assurant la sécurité, en effectuant des tâches conformément aux directives spécifiées et en répondant rapidement aux demandes. De plus, vous êtes censé faire toutes ces choses tout en conservant une attitude professionnelle avec vos utilisateurs et votre direction.
La surveillance est plus que de simples tests ping UP/DOWN ; il s'agit d'un aperçu complet de votre environnement qui comprend le processeur, l'utilisation de la mémoire, le trafic réseau, la capacité et les mesures environnementales. Lorsque vous commencez la surveillance, vous devez collecter des statistiques sur vos systèmes qui établissent une base de comportement de fonctionnement normal à laquelle vous pourrez vous référer à l'avenir. Vous devez collecter des statistiques d'utilisation pour le processeur, la mémoire, le disque et le réseau. Vous devez également calculer des statistiques de croissance sur les fichiers journaux, les bases de données et les données utilisateur afin de pouvoir prédire les besoins futurs en capacité.
Toutefois, la collecte de mesures ne constitue qu’un aspect de la surveillance. L'autre alerte lorsque ces mesures ne correspondent pas aux paramètres de fonctionnement normaux. Que se passe-t-il lorsqu'un système de fichiers se remplit ? Recevez-vous une alerte à 85 % de sa capacité ou votre système tombe-t-il en panne ou subit-il une panne de service en raison d'un processus arrêté ? Alertes proactives sur le système et le comportement des services est un élément essentiel de l'image globale de votre centre de données.
La troisième règle ou meilleure pratique consiste à « effectuer une planification de reprise après sinistre ». Contrairement à certaines idées reçues, la reprise après sinistre ne signifie pas nécessairement la reprise après un sinistre majeur affectant l'ensemble du centre de données. Cela signifie une récupération après n’importe quel sinistre, même celui d’un seul système. Une question que vous pourriez vous poser lorsque vous réfléchissez à la reprise après sinistre est la suivante: « Comment allez-vous résoudre le problème une fois qu'il survient ? Il se peut que vous ne disposiez pas d'un accès physique direct à un système défaillant pour faciliter sa récupération. Vous devrez compter sur du personnel distant travaillant au centre de données pour récupérer un système ayant rencontré une panne matérielle.
L'autre question à laquelle il faut réfléchir est « où serez-vous en cas de catastrophe ? ». Les catastrophes ne surviennent pas souvent à des moments opportuns pendant les heures de travail. Ils se produisent lorsque vous êtes loin du bureau et de votre ordinateur. Comment respecterez-vous le délai moyen de restauration (MTTR) et le SLA pour le ou les systèmes défaillants lorsque vous n'y avez pas accès ?
Il ne suffit pas de se préparer aux catastrophes; vous devez planifier leur apparition. Aucune redondance, équilibrage de charge ou sauvegardes régulières n’empêchera les catastrophes de se produire. Comment se remettre d'un sinistre, d'un système unique à un environnement informatique complet, est ce à quoi vous devez penser et planifier. La manière dont vous allez vous connecter à ces systèmes défaillants et les récupérer doit faire partie du plan.
Aussi difficile que cela puisse être, vous devez documenter les procédures standard, les informations de connectivité, les tâches de maintenance régulières et les plans d'urgence de reprise après sinistre.
La documentation est difficile car elle nécessite que l'administrateur système s'arrête et avance étape par étape dans chaque tâche, tout en documentant soigneusement chaque procédure. Il faut du temps et du travail pour documenter minutieusement, prendre des captures d'écran, décrire les procédures et expliquer les résultats possibles. Si vous ne disposez pas de procédures bien documentées, vous feriez mieux d'avoir un plan d'urgence consistant à toujours être à proximité d'un ordinateur et d'un réseau.
Comme vous pouvez le deviner, les règles quatre et cinq sont étroitement liées les unes aux autres. Établir des procédures standards et les documenter. Les procédures standard vous aident à maintenir la cohérence et la reproductibilité de votre environnement informatique. La création et le respect d'un ensemble de procédures standard ont pour effet supplémentaire de stabiliser vos systèmes et services, ce qui, à son tour, stabilise la productivité globale de votre entreprise.
Les administrateurs système ont créé ces cinq bonnes pratiques qu'ils peuvent utiliser comme lignes directrices conduisant à des environnements de travail plus stables et à une productivité plus élevée. Ils vous aideront à rationaliser votre travail, à assister les autres administrateurs système de votre groupe et à maintenir votre santé mentale en cas de problème.
Découvrez comment vous pouvez surveiller et gérer vos systèmes à distance à l'aide de votre appareil mobile, où que vous soyez quand les choses tournent mal.
Partager sur
Découvrez nos dernières histoires de notre blog que nos éditeurs ont sélectionnées pour vous