Data Engineer - pour une Startup HealthTech / IA qui lutte contre le Cancer
À propos du poste
Youmanista🎗 Le Projet : L'IA au service de la vie
Rejoignez une Startup de Médecine de Précision (10 personnes) en pleine accélération, née d'une alliance stratégique avec des instituts de recherche de premier plan.
Grâce à un financement de plus de 6 millions d'euros, cette structure développe des tests cliniques basés sur l'intelligence artificielle pour transformer le traitement du cancer. Leur technologie analyse des décennies de données pour prédire l'efficacité des thérapies et offrir un soin personnalisé à chaque patient(e), évitant ainsi le sur-traitement ou le sous-traitement.
Ils ont déjà eu d’excellents résultats sur plusieurs patientes atteintes de cancer du sein en pronostiquant avec précision le risque de rechute ou non…
💻 Contexte :
Dans une équipe composée de 5 Data Scientists, vous serez le / la premier(e) Data Engineer.
Le besoin est centré sur la structuration, l'organisation et la qualité des données.
Voici vos missions :
- Pipeline & Cloud : Mettre en place et maintenir des flux de transferts critiques (AWS/S3), optimiser les coûts de stockage et la bande passante.
- Imagerie Médicale (WSI) : Concevoir des pipelines de traitement pour les lames numériques (WSI) : ingestion, conversion de formats, pyramidalisation/tiling et extraction de métadonnées.
- Data Management à l'échelle : Administrer le cycle de vie de données massives (plusieurs centaines de To) incluant données cliniques, images et annotations.
- Qualité & Standardisation : Assurer le mapping et la traçabilité des données cliniques, et mettre en place des garde-fous (détection de valeurs aberrantes, distribution shifts).
- Stratégie de Stockage : Développer une stratégie de stockage hiérarchisé (hot/warm/cold) et automatiser l'archivage.
Organisation de l’équipe Tech chez notre client : Le Data Manager “achète / récupère” les données > le Data Engineer collecte, structure, organise et contrôle la qualité des données > les Data Scientists récupèrent ces données (”clean”) pour entraîner leur algorithme > l'équipe produit / logicielle intègre l'algorithme sur une plateforme en ligne
Important : on précise que la source des données est multi-modale (il peut y avoir de l’imagerie, génomique, cliniques, etc…) et capable de prédire sur plus de 35 types de Cancer.
🛠️ La Stack Technique
- Language : Python
- Cloud : AWS (S3, etc.).
- Engineering : Pipelines de données complexes, scripting avancé, gestion de bases de données à grande échelle.
- Data Handling : Gestion de formats d'images haute résolution (WSI), outils de versioning et documentation (Runbooks).
- Optionnel : Ouverture vers l'harmonisation multi-modalités (génomique, transcriptomique).
🎯 Votre Profil
- Expérience : 2 à 5 ans en tant que Data Engineer.
- Expertise : Vous maîtrisez parfaitement le traitement de volumes massifs et hétérogènes (base de données, images, etc…).
- Culture Santé : Une expérience dans le secteur de la santé est fortement appréciée.
- Un profil qui un vision “scientifique”, plutôt que “produit” : la data est un intermédiaire, ce n'est pas une finalité;
- Soft Skills : Esprit pionnier, audace, empathie et capacité à travailler dans un environnement remote-first.
🚀 Pourquoi les rejoindre ?
- Salaire : 50-60k€ selon profil.
- Equity : Attribution de Stock Options (BSPCE)
- Avantages : Mutuelle premium, horaires flexibles et congés avantageux.
- Cadre : Bureaux à Paris (HQ) avec 1 à 2 jours de télétravail par semaine.
Poste géré en exclusivité par Youmanista. Prêt à coder pour une cause qui a du sens ? Contactez-nous pour en discuter !
Autres jobs dispos
Lead AI Engineer - pour un SaaS “Deeptech” dans le monde du scolaire
🏫 Le client final : Startup de la DeepTech, spécialisée sur le marché de l’Education Plateforme pédagogique destinée aux professeurs et élèves qui permet de collaborer en “tout digital”, et par exemple digitaliser les manuels scolaires… 40 personnes basées à Paris (quartier Opéra) dans des superbes locaux Equipe Engineering 14...
Senior Fullstack Engineer (TypeScript/Node.js/React/LLM) – développe des Agents IA pour la logistique
🚀 Le pitch Pour un projet très ambitieux, notre client, early-stage, (12 personnes à Paris 2eme) développe des agents IA pour révolutionner la logistique et le transport routier. Objectif : aider transporteurs, brokers et affréteurs à gagner du temps, du flux et du business, grâce à des intégrations intelligentes avec...
Software Fullstack Developer (TypeScript, Nest.js, Vue.js) - Cybersécurité & IA
🚀 Le contexte La mission de notre client : hacker les entreprises pour mieux les protéger. Cette startup parisienne (12 personnes) développe une plateforme SaaS B2B innovante qui simule des attaques cyber réalistes (Phishing, Smishing, Vishing par IA) afin de former les collaborateurs en conditions réelles. 👉 En 2026, l’équipe...