À propos du poste

Youmanista

🎗 Le Projet : L'IA au service de la vie

Rejoignez une Startup de Médecine de Précision (10 personnes) en pleine accélération, née d'une alliance stratégique avec des instituts de recherche de premier plan.

Grâce à un financement de plus de 6 millions d'euros, cette structure développe des tests cliniques basés sur l'intelligence artificielle pour transformer le traitement du cancer. Leur technologie analyse des décennies de données pour prédire l'efficacité des thérapies et offrir un soin personnalisé à chaque patient(e), évitant ainsi le sur-traitement ou le sous-traitement.

Ils ont déjà eu d’excellents résultats sur plusieurs patientes atteintes de cancer du sein en pronostiquant avec précision le risque de rechute ou non…

💻 Contexte :

Dans une équipe composée de 5 Data Scientists, vous serez le / la premier(e) Data Engineer.
Le besoin est centré sur la structuration, l'organisation et la qualité des données.

Voici vos missions :

  • Pipeline & Cloud : Mettre en place et maintenir des flux de transferts critiques (AWS/S3), optimiser les coûts de stockage et la bande passante.
  • Imagerie Médicale (WSI) : Concevoir des pipelines de traitement pour les lames numériques (WSI) : ingestion, conversion de formats, pyramidalisation/tiling et extraction de métadonnées.
  • Data Management à l'échelle : Administrer le cycle de vie de données massives (plusieurs centaines de To) incluant données cliniques, images et annotations.
  • Qualité & Standardisation : Assurer le mapping et la traçabilité des données cliniques, et mettre en place des garde-fous (détection de valeurs aberrantes, distribution shifts).
  • Stratégie de Stockage : Développer une stratégie de stockage hiérarchisé (hot/warm/cold) et automatiser l'archivage.

Organisation de l’équipe Tech chez notre client : Le Data Manager “achète / récupère” les données > le Data Engineer collecte, structure, organise et contrôle la qualité des données > les Data Scientists récupèrent ces données (”clean”) pour entraîner leur algorithme > l'équipe produit / logicielle intègre l'algorithme sur une plateforme en ligne

Important : on précise que la source des données est multi-modale (il peut y avoir de l’imagerie, génomique, cliniques, etc…) et capable de prédire sur plus de 35 types de Cancer.

🛠️ La Stack Technique

  • Language : Python
  • Cloud : AWS (S3, etc.).
  • Engineering : Pipelines de données complexes, scripting avancé, gestion de bases de données à grande échelle.
  • Data Handling : Gestion de formats d'images haute résolution (WSI), outils de versioning et documentation (Runbooks).
  • Optionnel : Ouverture vers l'harmonisation multi-modalités (génomique, transcriptomique).

🎯 Votre Profil

  • Expérience : 2 à 5 ans en tant que Data Engineer.
  • Expertise : Vous maîtrisez parfaitement le traitement de volumes massifs et hétérogènes (base de données, images, etc…).
  • Culture Santé : Une expérience dans le secteur de la santé est fortement appréciée.
  • Un profil qui un vision “scientifique”, plutôt que “produit” : la data est un intermédiaire, ce n'est pas une finalité;
  • Soft Skills : Esprit pionnier, audace, empathie et capacité à travailler dans un environnement remote-first.

🚀 Pourquoi les rejoindre ?

  • Salaire : 50-60k€ selon profil.
  • Equity : Attribution de Stock Options (BSPCE)
  • Avantages : Mutuelle premium, horaires flexibles et congés avantageux.
  • Cadre : Bureaux à Paris (HQ) avec 1 à 2 jours de télétravail par semaine.

Poste géré en exclusivité par Youmanista. Prêt à coder pour une cause qui a du sens ? Contactez-nous pour en discuter !

Expérience Confirmé(e) : 3-5 ans
Secteur HealthTech
Type Early-stage