TCIA Dataset (The Cancer Imaging Archive)
TCIA est l’une des plus grandes bases d’images médicales dédiée à la recherche sur le cancer. Elle regroupe des données issues de divers types d’imagerie (IRM, scanner, PET, radiographie), provenant de cohortes cliniques réelles, avec annotations expertes. C’est une ressource essentielle pour l’entraînement d’algorithmes d’intelligence artificielle en oncologie.
Plusieurs téraoctets d’images médicales (IRM, TDM, radiographies), format DICOM
Accès libre pour la recherche, sous conditions spécifiques de licence et d’utilisation selon les collections. Les données sont dé-identifiées et ouvertes à la communauté scientifique
Description
Le corpus TCIA comprend :
- Des dizaines de collections regroupant des milliers de patients
- Des examens d’imagerie : IRM, CT, TEP, radiographies
- Des annotations manuelles (segmentation, contours tumoraux, diagnostics)
- Des données associées (biomarqueurs, génomique, résultats cliniques dans certains cas)
- Des sous-ensembles spécialisés : poumon, cerveau, prostate, sein, etc.
Chaque collection est documentée avec des métadonnées cliniques et structurée selon les standards DICOM, facilitant son intégration dans les workflows de recherche.
À quoi sert ce dataset ?
TCIA est utilisé pour :
- L’entraînement de modèles IA pour la détection et la segmentation de tumeurs
- Le développement de systèmes d’aide au diagnostic en radiologie
- L’analyse d’imagerie multi-modale pour la recherche translationnelle
- La validation d’algorithmes de prédiction du cancer ou de réponse au traitement
- Le croisement avec des données omiques (radiogénomique)
Peut-on l’enrichir ou l’améliorer ?
Oui, par exemple :
- Ajouter des annotations cliniques personnalisées (grading, stades, scores)
- Fusionner avec des bases comme The Cancer Genome Atlas (TCGA) pour des analyses croisées
- Compléter les séries avec des modèles de synthèse (GAN, augmentation 3D)
- Utiliser des outils comme 3D Slicer, MONAI ou nnU-Net pour le pré-traitement et l’entraînement
🔗 Source : The Cancer Imaging Archive (TCIA)
Questions fréquemment posées
TCIA contient-il uniquement des images anonymisées ?
Oui, toutes les données sont strictement dé-identifiées selon les standards HIPAA avant publication.
Peut-on utiliser TCIA pour des études cliniques ?
Oui, à condition que l’étude reste dans le cadre de la recherche académique ou institutionnelle. Certaines collections nécessitent une demande d’accès spécifique.
Quelles sont les différences entre les collections disponibles ?
Chaque collection correspond à une étude clinique ou un type de cancer particulier. Elles varient en modalités d’imagerie, nombre de patients, type d’annotations ou présence de données associées (suivi, génomique…).