Data Engineer expérimenté - CDI H/F
Description du poste
Contexte
Le département Data intervient en transverse de la DSI auprès de tous les métiers d’une grande entreprise du secteur industriel. Dans ce cadre, il porte les ambitions de la data au sein de cette entreprise avec comme principaux objectifs d’accompagner l’entreprise vers un modèle d’entreprise Data Driven et d’optimiser la performance du SI.
La Team Plateforme Data \& Analytics constituée de l’équipe Data Platform et l’équipe produit Analytics œuvre pour tous les métiers dans une organisation Datamesh afin de :
- Mettre à disposition la donnée aux utilisateurs
- Modéliser les solutions applicatives selon les besoins métiers de l’entreprise
- Développer avec les métiers des reporting et datasets à haute valeur ajoutée
- Déployer les modèles d’IA/IA Gen/ML développés par l’équipe Datascience
- Assurer le cycle de vie de ses produits Data depuis cadrage du besoin jusqu’au run
- Maintenir le cadre régalien Analytics et appuyer les métiers dans la conduite du changement
- Promouvoir l’usage des outils de reporting et accompagner les métiers dans l’appropriation de leurs données
Missions
- Gouvernance, coordination et documentation :
+ Rédaction, mise à jour et maintien de l’ensemble des spécifications fonctionnelles et techniques de la plateforme
+ Animation de la communauté développeurs : diffusion des bonnes pratiques, partage de connaissances, alignement sur les standards
- Analyse avancée et modélisation statistique :
+ Utilisation de méthodologies statistiques pour générer des insights exploitables
+ Compétences en modélisation de données pour créer des schémas et des structures
- Posture “Conseil” :
- Développement \& intégration :
+ Maîtrise des processus d’ingestion batch et streaming, quel que soit le type de source (API, fichiers structurés/semi\-structurés/non structurés, bases de données) ou le cloud provider en entrée (AWS / Azure)
+ Développement, optimisation et industrialisation des pipelines de donnéesCI/CD \& DevOps
+ Construction et maintenance des pipelines CI/CD, gestion des artefacts, des dépôts et des tasks automatisées
+ Création et administration d’applications, notebooks et environnements associés (Pandas, NumPy, etc.)Qualité, performance et bonnes pratiques
+ Optimisation de requêtes, performance applicative et factorisation du code
+ Analyse avancée d’incidents techniques ou fonctionnels, réalisation de tests unitaires et contrôle de la qualité du code
+ Revue et amélioration de code (SQL, C\#, PowerShell)Développement applicatif \& frameworks internes
+ Contribuer à l’évolution continue et l’optimisation du framework d’alimentation et de supervision de la plateforme PDA (.NET / PowerShell / JavaScript)
+ Développement de scripts d’administration, outils d’automatisation et alertes de sécurité
+ Développement de modèles tabulaires Power BI (langages M et DAX)
- Support \& Monitoring
+ Monitoring de l’infrastructure et supervision des flux de données
- Administration \& Performance des Bases de Données (DBA)
+ Revue de code, audit et validation des Pull Requests
+ Optimisation des requêtes, amélioration des performances généralisées, respect des bonnes pratiques
+ Ajustement et contrôle des performances des bases SQL Server, Snowflake et Azure SQLDBA Système
+ Conception et gestion des modèles de sécurité des bases de données
+ Monitoring, gestion de la performance et résolution d’incidents critiques
- Expertise Technique \& Référentiels
+ Expertise avancée sur Snowflake (\> 3 ans) : SQL, rôles, virtual warehouses, data modeling et optimisationRéférent métier \& gouvernance
+ Maîtrise approfondie des modèles de données et rôle de référent technico\-fonctionnel sur 2 à 3 domaines métiersStandards \& bonnes pratiques
+ Mise en place, maintien et contrôle du respect des bonnes pratiques techniques, fonctionnelles et documentaires
Outils \& Environnement
- Ingestions de données paramétrées en mode « delta\-lake » (tables de streaming)
- Transformations et règles de gestion réalisées via procédures stockées (SQL et JavaScript) et Python avec Snowpark (pour projets Datascience/IA/ML, Features Store, Model Registry)
- Orchestration des transformations principalement via Azure Automation (à terme Snow Tasks), supervision via Log Analytics et suivi dans Power BI
- Patterns de déploiement CI/CD basés sur un framework (.net) développé en interne
- Acquisition des données via scripts Powershell/C\# utilisant des services Azure managés (Blob storage, Key Vault, Log Analytics)
- Stockage des données dans une architecture en médaillon dans Snowflake (zones Bronze \> Argent \> Or) hébergée dans le Cloud Azure
- Zones de publication par domaine fonctionnel (ex : RH, Finance) en mode DataMesh
- Exploitation des données via modèles sémantiques Power BI, cubes multidimensionnels et apps Streamlit conteneurisées
- Déploiements gérés par la chaîne complète CI/CD d’Azure DevOps (repository GIT, méthode GITflow / GITHubflow pour Analytics) et GitLab pour applications conteneurisées et Datascience
Profil recherché
- Posture « Conseil » avec niveau d’expertise, force de proposition, capacité à challenger et autonomie
- Capacité à effectuer des analyses complexes sur les données
- Utilisation de méthodologies statistiques pour générer des insights exploitables
- Compétences en modélisation de données pour créer des schémas et des structures
- Compétences en communication et en pédagogie pour travailler avec des équipes techniques, interfonctionnelles et métier
- Maîtrise des processus d’ingestion batch et streaming pour différents types de sources et cloud providers (AWS / Azure)
- Développement, optimisation et industrialisation des pipelines de données
- Construction et maintenance des pipelines CI/CD, gestion des artefacts, dépôts et tâches automatisées
- Création et administration d’applications, notebooks et environnements associés (ex : Pandas, NumPy)
- Optimisation de requêtes, performance applicative et factorisation du code
- Analyse avancée d’incidents techniques ou fonctionnels, réalisation de tests unitaires et contrôle de la qualité du code
- Revue et amélioration de code (SQL, C\#, PowerShell)
- Contribution à l’évolution et optimisation du framework d’alimentation et de supervision (.NET / PowerShell / JavaScript)
- Développement de scripts d’administration, outils d’automatisation et alertes de sécurité
- Développement de modèles tabulaires Power BI (langages M et DAX)
- Support technique Niveau 3 sur socles applicatifs et reporting associés
- Monitoring de l’infrastructure et supervision des flux de données
- Revue de code, audit et validation des Pull Requests
- Optimisation des requêtes et amélioration des performances sur bases SQL Server, Snowflake et Azure SQL
- Conception et gestion des modèles de sécurité des bases de données
- Monitoring, gestion de la performance et résolution d’incidents critiques
- Expertise avancée Snowflake (\> 3 ans) : SQL, rôles, virtual warehouses, data modeling et optimisation
- Maîtrise approfondie des modèles de données et rôle de référent technico\-fonctionnel sur 2 à 3 domaines métiers
- Mise en place, maintien et contrôle du respect des bonnes pratiques techniques, fonctionnelles et documentaires
Cette annonce provient de indeed. Voir l'annonce originale ↗