Description : INGÉNIEUR DATA Dans le cadre de l'appel à projet national pour la constitution d'entrepôts de données de santé (EDS), les 4 CHUs de la région AURA se sont associés pour co-construire la solution partagée interopérable EDS-D2H. MISSIONS Pour participer au développement et à la mise en oeuvre d'EDS-D2H, nous recherchons un ingénieur data passionné par les données et la santé pour rejoindre l'équipe EDS du CHUGA. En tant qu'Ingénieur Data, vous serez responsable de la conception, du développement et de la maintenance de nos pipelines de données. Votre rôle consistera à collecter, nettoyer, transformer et stocker les données provenant de diverses sources, en veillant à leur qualité et à leur intégrité. Vos missions seront les suivantes : * Analyser les sources de données métier (système d'information de laboratoire, d'imagerie, de réanimation et autres applicatifs du domaine de la santé) pour comprendre leurs spécificités et caractériser les contraintes d'intégration à l'EDS (utilisation de la donnée, format, volume, fréquence) * Collaborer avec les équipes d'accompagnement de projets de recherche pour comprendre les besoins métiers en jeux de données et apporter une expertise technique sur les sources de données et la chaîne de traitement * Concevoir, développer et documenter les chaînes de traitement de la donnée (collecte, modélisation, traitement, stockage) adaptées aux contraintes avec des outils de type ETL, ESB ou message queue * Maintenir les chaînes de traitement des données et optimiser leurs performances (optimisation des requêtes SQL, stratégies et orchestration des traitements) * Mettre en place des solutions de stockage et de gestion des données adaptées (bases de données, data lakes, etc.) * Assurer la sécurité et la confidentialité des données conformément aux réglementations en vigueur pour les données de santé Profil recherché : PROFIL * Diplômé d'une formation bac + 3/5 en informatique * Expérience de minimum 2 ans sur un poste d'ingénieur data SAVOIR-FAIRE REQUIS * Bonne connaissance d'une solution de manipulation des données ETL (dbt, Talend, Spark ou autres) et d'orchestration (Airflow, Dagster.) * Maîtrise d'un outil de gestion de flux (Kafka, Flink.) et son intégration dans une architecture data * Bonne connaissance des bases de données SQL (SQLServer, PostgreSQL, Oracle) et NoSQL document ou graphe (MongoDB, Neo4j, ArangoDB) * Maîtrise de Python et Shell * Maîtrise des systèmes d'exploitation (Unix, Windows.) * Maîtrise des méthodes de développement agile et de l'utilisation de solutions de gestion de version (gitlab, github) * Connaissance de la réglementation concernant les données personnelles et des principes de cybersécurité * Maîtrise de l'anglais technique SAVOIR-FAIRE APPRÉCIÉ * Autres langages de programmation (R, Java, Scala.) * Expérience en software engineering * Connaissance du DevOps et de l'intégration continue et de livraison continue (CI/CD) * Connaissance en administration de bases de données SAVOIR-ÊTRE * Qualités relationnelles et travail en équipe, au sein de la structure et en lien avec les industriels partenaires * Rigueur et organisation * Capacité d'anticipation et prise d'initiative * Adaptabilité
☕ java 🕥 Dernière mise à jour il y a 2 semainesExpérience souhaitée