Description du poste
Taux journalier (TJM): 500€/jour \- 650€/jour
Nous recherchons un(e) Site Reliability Engineer (SRE) expérimenté(e) pour renforcer nos équipes et garantir la fiabilité, la performance et la scalabilité de notre plateforme.
Vous serez responsable de la disponibilité et de la qualité de service de nos systèmes en production. À ce titre, vous interviendrez sur la gestion des incidents de bout en bout (analyse des causes racines, mise en place de correctifs et actions de prévention), ainsi que sur l’amélioration continue de l’observabilité. Vous contribuerez activement à l’automatisation des opérations et du support, notamment via des approches software et l’usage d’outils innovants (dont l’IA appliquée aux Ops).
Vous travaillerez en étroite collaboration avec les équipes de développement, DevOps et sécurité, en apportant votre expertise pour améliorer la fiabilité, la performance et la sécurité des systèmes, tout en influençant les bonnes pratiques techniques.
Vous évoluerez dans un environnement moderne basé sur GCP, Kubernetes et des infrastructures automatisées. Vous utiliserez notamment Linux, Python, Terraform et Datadog pour le monitoring et l’observabilité. L’écosystème de développement repose sur GitHub et GitHub Actions. Des connaissances solides en réseau et en sécurité (WAF, protection DDoS) sont attendues.
Profil recherché
Nous recherchons un profil disposant d’une solide expérience à la fois en développement logiciel et en infrastructure. Vous êtes à l’aise dans des environnements distribués, avez une forte culture de la production et savez prendre du recul pour améliorer les systèmes de manière durable. Votre capacité à collaborer, à influencer les équipes et à vulgariser des sujets complexes sera clé pour réussir dans ce rôle.
Cette annonce provient de indeed. Voir l'annonce originale ↗