Consultant Data Engineer and MLOps
Description
Description du besoin :
Nous recherchons un(e) Data Engineer pour concevoir, développer et maintenir les pipelines de données artificielle . le poste couvre également le run et la maintenance des solutions de data science et d’intelligence artificielle dans des environnements on-premise et cloud.
En tant que référent technique, le/la titulaire du poste interviendra sur des projets à forte valeur ajoutée, en collaboration étroite avec les équipes métiers et les membres de l’équipe Data.
Missions principales :
• Concevoir, développer et maintenir des pipelines de données fiables et performants pour collecter, transformer et stocker les données dans des datalakes, datawarehouses et datamarts.
• Assurer potentiellement l’orchestration et l’automatisation des flux de données à l’aide d’outils comme Airflow.
• Participer à l’optimisation des performances des traitements batch et des requêtes SQL sur des environnements distribués (Spark, Hive).
• Collaborer avec les équipes métiers, data analysts et data scientists pour fournir des données de qualité et exploitables.
• Participer à la mise à disposition des données (modèles de données, extractions …)
• Participer à la documentation technique et au partage des bonnes pratiques pour assurer la maintenabilité et la robustesse des solutions.
• Contribuer à l’amélioration continue des processus et outils data.
• Gérer le run, la maintenance, le suivi de performance et les évolutions des modèles ML en production.
Profil recherché :
• Diplômé(e) d’une école d’ingénieur ou d’une formation Bac +5 en informatique, data engineering ou domaine connexe.
• Maîtrise des outils et technologies : Python, Spark, Airflow, SQL, Hive, PowerBI.
• Connaissances Tableau souhaitables
• Connaissance des principes de gestion et traitement de données distribuées.
• Solides compétences en Machine Learning.
• Bonne compréhension des enjeux liés au cycle de vie des modèles et aux pratiques MLOps.
• Expérience sur des environnements cloud et on-premise.
• Capacité à travailler de manière transverse avec des équipes pluridisciplinaires et à collaborer avec les métiers.
• Bonnes compétences en communication et en collaboration pour accompagner les équipes dans l’utilisation et la compréhension des données.
• Autonomie, rigueur et esprit d’initiative pour gérer des projets techniques complexes.