Incident Manager - Freelance H/F
collectivework
Paris
Temps plein
2 364 autres offres à Paris.
Importez votre CV et voyez lesquelles vous correspondent vraiment.
Description du poste
Taux journalier (TJM): 545
Notre client recherche un Incident Manager (H/F) dans le cadre d'une longue mission.
Au sein de l'équipe RUN de la Direction Technique, le consultant assurera la supervision opérationnelle, la gestion des incidents de niveau N3 et l'amélioration continue de la résilience d'une plateforme d'examens à forte criticité. Il contribuera également à l'exploitation d'outils de supervision avancés intégrant des mécanismes d'IA pour la détection proactive des incidents.
- Assurer la supervision quotidienne du système d'information (applications, interfaces, flux et infrastructures).
- Concevoir et maintenir les tableaux de bord de suivi opérationnel.
- Analyser les KPI RUN (disponibilité, MTTR, SLA).
- Détecter de manière proactive les signaux faibles et les dégradations de service.
- Prendre en charge les incidents escaladés des niveaux N1 et N2\.
- Qualifier, prioriser et coordonner les actions de résolution.
- Piloter les équipes contributrices (développement, infrastructure, partenaires).
- Garantir le respect des SLA et des engagements de service.
- Organiser et animer les cellules de crise.
- Utiliser des outils d'analyse de logs assistés par IA.
- Mettre en place des alertes prédictives et des mécanismes de détection d'anomalies.
- Suivre les incidents de leur détection jusqu'au rétablissement complet.
- Réaliser les analyses de causes racines (RCA).
- Maintenir et alimenter le backlog de problèmes.
- Accompagner les mises en production et organiser les surveillances renforcées post\-MEP.
- Identifier les causes structurelles des incidents récurrents et proposer des plans d'amélioration.
- Participer à l'optimisation des processus RUN et à l'amélioration de la résilience des architectures.
Profil recherché
- Incident Manager confirmé / senior.
- Expérience significative en environnement de production à forte disponibilité.
- Forte capacité de coordination transverse et de pilotage de crise.
- Capacité à évoluer dans des environnements critiques avec des contraintes fortes de disponibilité.
Compétences métier
- Gestion des incidents et respect des SLA.
- Production informatique et exploitation RUN.
- Problem Management.
- Analyse de performance et suivi des KPI.
- Gestion de crise.
- ITIL.
- Accompagnement des mises en production.
- Amélioration continue des processus opérationnels.
- Compétences techniques Obligatoires
- Analyse de logs applicatifs.
- SQL.
- Scripting.
- Python.
- Linux.
- Virtualisation.
- Outils de supervision IT (réseau, stockage, infrastructure).
- Environnements haute disponibilité.
Requises
- JIRA ou outils de ticketing.
- Tableaux de bord opérationnels.
- Outils de monitoring et d'observabilité.
Appréciées
- AIOps / Monitoring intelligent.
- Détection d'anomalies et Machine Learning.
- Analyse prédictive.
- Pandas, Scikit\-learn.
- Méthodes Agile / Kanban.
- Vue.js ou autre langage de développement.
- Enjeux de sécurité et qualité logicielle.
Cette annonce provient de indeed. Voir l'annonce originale ↗