Data Engineer Confirmé - GCP/BigQuery - Freelance H/F
collectivework
Lille
Temps plein
315 autres offres à Lille.
Importez votre CV et voyez lesquelles vous correspondent vraiment.
Description du poste
Taux journalier (TJM): 420
Contexte
Dans le cadre de l'accélération de la mise à disposition des data, des KPI Performance et de leur qualité dans la plateforme digitale Supply Chain, la mission consiste à construire des pipelines de produits digitaux sources et/ou agrégés Supply dans la GCP (BigQuery). Le projet s'inscrit dans un contexte international, multi\-BU, avec des couches sémantiques et dashboards en LookML et/ou PowerBI. En complément, l'intégration d'IA génératives et agents (CoPilot, Gemini, ChatGPT) est désormais intégrée dans les process Data.
Missions
- Construire des pipelines de données, de la source à la visualisation
- Modéliser plusieurs types de Data products (Source Aligned, Agrégated, Couches Sémantiques)
- Déployer les couches sémantiques en priorité sur les KPI Performance Supply
- Participer à la qualité des données (Data Quality metrics) et aux objectifs FinOps (optimisation)
- Remettre en cible technique certaines pipelines existantes à enjeu (Pipeline interne avec DBT, Terraform) et assurer optimisation, run, monitoring, alerting
- Garantir l'accès qualitatif aux sources de données
- Assurer la maîtrise de la donnée et garantir la qualité de son utilisation (référencement, normalisation, qualification)
- Contribuer à la définition de la politique de la donnée et à la structuration de son cycle de vie en collaboration avec le Chief Data Officer
- Superviser et intégrer des données de diverses natures provenant de sources multiples
- Vérifier la qualité des données entrant dans le Data Lake (recette, suppression des doublons)
- Capturer les données (structurées et non structurées) produites dans les différentes applications ou à l'extérieur de l'entité
- Intégrer, structurer (sémantique, etc.), cartographier, nettoyer, valider les données
- Éventuellement créer le référentiel de données
Livrables
- Modèle physique de données
- Couche sémantique
- Data Lake approprié, partagé et dimensionné
- Cartographie des données
- Éléments garantissant la qualité de la donnée
Outils \& Environnement
- GCP / BigQuery (confirmé \- impératif)
- Modélisation de données (confirmé \- impératif)
- PowerBI (confirmé \- important)
- Looker (confirmé \- important)
- Pipelines internes avec DBT, Terraform
- LookML pour couches sémantiques
- IA génératives et agents (CoPilot, Gemini, ChatGPT)
Conditions de travail
- Date de démarrage : 01/06/2026
- Déplacement à prévoir : non
- Astreintes : non
- Présence souhaitée sur site : 3 jours par semaine
- Langues : Français courant (impératif), Anglais professionnel (secondaire)
Profil recherché
- GCP/BigQuery \- Confirmé \- Impératif
- Modélisation de données \- Confirmé \- Impératif
- PowerBI \- Confirmé \- Important
- Looker \- Confirmé \- Important
- Français courant (Impératif)
- Anglais professionnel (Secondaire)
Cette annonce provient de indeed. Voir l'annonce originale ↗