Class Distribution Influence and Evaluation in Deep Learning – Application to Cancer Detection on Histological Images

Le cancer est une maladie mortelle considérée comme la deuxième cause de décès. Toute avancée dans le diagnostic et la détection de cancer est donc cruciale pour sauver des vies. L’analyse d’images histologiques – Whole Slide Images (WSI) – est considérée comme la référence dans le diagnostic et l’étude du stade du cancer. L’analyse manuelle de ces images par les pathologistes reste le principal processus de diagnostic. Elle prend du temps et est difficile à évaluer de manière reproductible. Les techniques de diagnostic assisté par ordinateur peuvent aider les pathologistes dans leur travail.


Les techniques d’apprentissage automatique, en particulier les algorithmes d’apprentissage profond, tels que les réseaux de neurones convolutifs (CNN), sont largement utilisés dans divers domaines dont l’analyse d’images. Le succès des modèles CNN dépend cependant de plusieurs hyper-paramètres, tels que l’architecture du réseau, les données utilisées pour entraîner le modèle et la distribution des données d’entraînement.

La distribution des données d’entraînement n’est pas étudiée dans la littérature pour les données WSI bien qu’elle pourrait être l’un des critères les plus importants pour réguler les performances d’un modèle. L’un des objectifs de cette thèse est d’étudier en détail l’impact de la répartition des classes des données, tant dans la phase d’apprentissage que celles de la prévision elle-même.

Un autre objectif de cette thèse est lié à l’évaluation au sens large.

Nous avons étudié des moyens d’évaluer les résultats qui correspondent davantage aux objectifs des médecins. Nos solutions résolvent les problèmes des métriques actuelles qui souffrent de leur incapacité à distinguer les modèles dans de nombreux cas, manquent d’informations concernant les fausses prédictions et sont optimistes dans le cas de données déséquilibrées.

En savoir plus sur le sujet ICI.