Diagnostic de la démence basé sur l’IA

Le chercheur Antonio Javier Sutil Jiménez expose dans cet article les données les plus pertinentes sur l’étude « Diagnostic différentiel des étiologies de la démence basé sur l’IA sur des données multimodales ».

Pourquoi l’étude de la démence et de l’intelligence artificielle (IA) est-elle importante ?

La population mondiale vieillit et avec cela, nous faisons face à de multiples risques pour la santé liés à l’âge. L’un de ces risques est la démence, dont le diagnostic augmente d’environ 10 millions de nouveaux cas chaque année. Les démences sont un ensemble de maladies caractérisées par la détérioration des fonctions cognitives au point de rendre difficile ou impossible la réalisation des activités de la vie quotidienne de manière indépendante. Parmi elles, la maladie d’Alzheimer se distingue, mais il existe de nombreuses autres comme la démence vasculaire, la démence à corps de Lewy ou la démence frontotemporale.

Comment intervenir pour réduire les problèmes associés aux démences ?

La réponse serait liée à l’obtention de diagnostics précoces et précis qui permettraient de réaliser des thérapies efficaces et spécifiquement dirigées vers chaque maladie. En 2017, l’Organisation mondiale de la santé (OMS) a déjà déclaré la nécessité d’améliorer les diagnostics pour répondre à l’augmentation des cas de démence dans le monde. Cependant, les différents types de démence sont parfois difficilement différenciables à un stade précoce, car les symptômes associés à chaque démence sont complexes. À cela s’ajoute que parfois, les différentes démences peuvent coexister, ce qui entraîne un grand nombre d’erreurs diagnostiques.

Gold Standard

Ces diagnostics se sont principalement basés sur des évaluations neuropsychologiques. Cependant, ces diagnostics basés sur des tests cognitifs et comportementaux ont été tentés d’être liés à des tests évaluant des échantillons biologiques, comme des IRM, des échantillons de sang ou de liquide céphalorachidien, entre autres. Malgré de grands efforts, il manque encore un test de diagnostic de type « Gold Standard ». C’est le nom qui désigne un test de diagnostic ayant une haute fiabilité pour diagnostiquer une maladie spécifique. Ce Gold Standard a été recherché principalement à travers les données biologiques, sans succès jusqu’à présent.

Solution basée sur l’intelligence artificielle (IA)

Pour résoudre cette situation, un groupe de chercheurs de l’Université de Boston, ainsi que des chercheurs de tous les États-Unis, a proposé une solution basée sur l’intelligence artificielle qui permettrait de travailler avec un grand ensemble de données hétérogènes. Ces données sont hétérogènes car elles visent à imiter le monde réel; c’est-à-dire utiliser les mêmes outils qu’un professionnel clinique utiliserait pour apporter une solution au problème de diagnostic et de prévention lié aux démences. Les multiples types de données abordées sont : sociodémographiques, neurologiques, physiques, histoire médicale et IRM.

S’abonner à notre Newsletter

S’abonner

Que s’est-il passé ?

Pour pouvoir appliquer un modèle basé sur l’intelligence artificielle, une quantité massive de données était nécessaire, c’est pourquoi les chercheurs ont fait appel à neuf ensembles de données indépendants réunissant plus de 51 000 patients présentant différents types de démence.

Patients avec différents types de démence

L’inclusion d’un large éventail de démences et de causes multiples a été un pas fondamental pour obtenir une caractérisation riche et variée pouvant être représentative de la réalité. C’est pourquoi des patients ayant une démence due à de nombreuses causes différentes ont été inclus, comme la maladie d’Alzheimer, les accidents vasculaires cérébraux, la dégénérescence frontotemporale, la dégénérescence corticobasale, due à des infections, à l’abus de drogues, etc.

Problème de perte de données

Cependant, cette approche basée sur une quantité massive de données rend également probable l’existence de données manquantes. C’est l’opposé des environnements très contrôlés et avec un nombre plus réduit de patients, où la perte de données est minimisée. Dans ce cas, l’approche nécessite de grands ensembles de données très hétérogènes permettant d’apprendre au modèle et d’être le plus réaliste possible. Pour résoudre le problème lié à la perte de données, les chercheurs ont appliqué des techniques qui fourniront la plus grande robustesse durant les premières étapes. La mise en œuvre de ces méthodes et stratégies robustes évite que l’entraînement de l’intelligence artificielle soit biaisé et donc que les futures prédictions le soient également. De plus, des procédures standardisées d’inclusion et d’exclusion ont été suivies, garantissant la cohérence et la crédibilité des résultats.

Modèle de type « transformer »

À ce stade, un défi important se pose également, à savoir la création d’un modèle permettant d’agglomérer plusieurs types de données et paramètres de nature différente, ce qu’on appelle une architecture de type « transformer ». Dans ce type de modèle, toutes les caractéristiques différentes incluses sont transformées en ce que l’on appelle un « vecteur de longueur fixe », suivant une stratégie spécifique qui permet de créer une première couche du modèle sur laquelle le reste sera construit en décodant cela en une série de prédictions.

Pour mieux comprendre, nous pouvons penser à ce modèle comme à une recette de cuisine, sauf qu’au lieu de différents pas comme nous avons dans la recette, le modèle aura différentes couches. Mais tout comme pour obtenir un bon plat après la cuisson, nous avons besoin de bons ingrédients qui se combinent de manière adéquate. Les chercheurs voulaient un bon système de classification des patients et avaient besoin que leurs ingrédients ; c’est-à-dire, les données dont ils disposaient, soient bons et puissent se combiner de manière appropriée. Dans notre similitude avec ce modèle d’intelligence artificielle, il s’agirait de transformer les différentes données que nous avons en un format commun (vecteur de longueur fixe). Cela fait que le modèle créé sera très robuste face à la perte ou à l’incomplétude des données et pourra effectuer des prédictions fiables.

Apprentissage autosupervisé

Concrètement, ils utilisent un type de modèle appelé apprentissage autosupervisé. Dans cette approche d’apprentissage automatique, le modèle apprend à partir de données sans avoir besoin d’étiquettes explicites. Contrairement à l’apprentissage supervisé, qui nécessite un ensemble de données avec des étiquettes, l’apprentissage autosupervisé repose sur la recherche de structures et de motifs dans les données sans intervention humaine directe pour les étiqueter.

Phase d’entraînement, de validation et de comparaison avec des experts

Ce qui a suivi dans le développement du modèle a été la phase d’entraînement, de validation et de comparaison avec des experts. Les processus d’entraînement et de validation sont habituels dans ce type d’étude.

L’entraînement consistait à alimenter le modèle en utilisant des données provenant des différentes cohortes, en intégrant toutes les modalités pour apprendre les motifs associés à différents types de démence. Après l’entraînement du modèle, une validation a été réalisée, utilisant des données jamais vues auparavant, afin de garantir que le modèle peut généraliser ses prédictions à des données qu’il ne connaît pas.

Enfin, et de manière novatrice, les chercheurs ont testé les diagnostics réalisés par le modèle avec des médecins spécialisés dans le diagnostic des démences. Pour cela, ils ont invité un groupe de 12 neurologues et 7 neuroradiologues à participer à des tâches de diagnostic sur un sous-ensemble de 100 cas de différents types de démence. On leur a fourni les données disponibles pour chacun de ces 100 cas et on leur a demandé de fournir leurs impressions diagnostiques, ainsi qu’une note de confiance oscillant entre 0 et 100 pour le diagnostic de chacune des 13 étiquettes possibles. À ce stade, on voulait savoir si les jugements cliniques pouvaient être améliorés en utilisant le modèle créé.

Quelles sont les principales conclusions de cette étude sur la démence et l’intelligence artificielle (IA) ?

Les résultats principaux peuvent être divisés en trois parties : classification des individus en bonne santé vs détérioration, classification des pathologies et amélioration du jugement clinique en utilisant le modèle.

L’étude a évalué les performances d’un modèle d’intelligence artificielle (IA) pour classifier les individus en trois catégories cognitives :

sains ou cognitivement normaux,
détérioration cognitive légère,
et démence.

Les métriques utilisées pour évaluer les performances du modèle étaient les courbes ROC et PR. Les résultats obtenus peuvent être observés dans le tableau suivant (tableau 1).

Les métriques obtenues pour les modèles ROC reflètent une grande capacité du modèle à différencier les trois classes mentionnées, car ces métriques sont évaluées de 0 à 1, un chiffre proche de un étant un indicateur d’une excellente classification.

Pour les métriques AUAP, les valeurs continuent à indiquer un bon rendement du modèle, il est donc pertinent de considérer chaque classe.

	AUROC	AUAP
Micro	0.94	0.90
Macro	0.93	0.84
Weight	0.94	0.87

Tableau 1. Performance du modèle pour la classification sain vs détérioration.

Le deuxième résultat de l’étude est lié à la capacité du modèle à diagnostiquer dix types différents de démence, montrant des résultats très significatifs en termes de précision diagnostique.

Les résultats des métriques AUROC montrent à nouveau une grande efficacité du modèle, celui-ci étant capable de distinguer dans la plupart des cas les types de démence.

D’autre part, les modèles AUPR continuent à montrer que le modèle présente de bonnes performances, bien que non excellentes (voir tableau 2), ce qui indiquerait que le modèle est plus précis pour certaines maladies que pour d’autres.

	AUROC	AP
Micro	0.96	0.70
Macro	0.90	0.36
Weight	0.94	0.73

Tableau 2 : Performance moyenne du modèle pour la classification des démences.

Enfin, en ce qui concerne l’évaluation clinique assistée par IA, les résultats indiquent qu’elle pourrait augmenter la précision diagnostique par rapport à celle d’un professionnel clinique agissant seul. Cela se manifeste par l’amélioration significative de la classification des types de démence. Par exemple :

Les neurologues ont amélioré :

de 12 % dans la détection du déclin cognitif léger,
de 15 % pour la maladie d’Alzheimer,
de 26 % pour la démence fronto-temporale selon les valeurs AUROC,
particulièrement notable était l’amélioration pour la maladie à prions, qui a augmenté de 73 %.

Les radiologues ont :

amélioré de 9 % pour la démence de type Alzheimer,
de 6 % pour la démence fronto-temporale,
également notable est l’amélioration pour la maladie à prions avec 68 %.

En conclusion, nous pouvons en déduire que de futurs modèles basés sur l’intelligence artificielle pourraient être d’une grande aide pour la différenciation diagnostique lorsque celle-ci repose sur la nature multifactorielle des différents types de démence. Cela pourrait non seulement améliorer le diagnostic, mais aussi faciliter la personnalisation des traitements et des interventions aux premiers stades de la maladie.

NeuronUP, plateforme professionnelle de neurorééducation !

Sollicitez un essai gratuit et travailler avec l’intégralité de NeuronUP pendant 15 jours sans engagement !

Période d’essai gratuite

Où NeuronUP pourrait-il contribuer à une étude comme celle-ci ?

NeuronUP peut apporter de nombreuses contributions à une étude comme celle-ci.

NeuronUP peut contribuer à la mise en place de structures et de technologies qui permettraient de reproduire ou de répliquer une étude de ce type, étant donné que les ensembles de données utilisés sont libres d’accès.

L’étude pourrait être répliquée ou reproduite en utilisant une procédure différente qui serait plus précise ou moins coûteuse.

De plus, des techniques et des modèles pourraient être appliqués pour permettre une plus grande précision et différencier quels types de données apportent le plus au modèle ou si de bonnes métriques de classification peuvent être obtenues à partir d’un seul type de données. Un exemple de cela serait d’utiliser des données neuropsychologiques et sociodémographiques pour tenter d’obtenir des résultats similaires.

D’autre part, NeuronUP dispose d’une vaste base de données de nature neurocognitive, ce qui permettrait de réaliser des classifications similaires afin de déterminer quels aspects de la cognition pourraient faciliter une détection précoce et une prédiction du déclin. Cela est particulièrement pertinent étant donné que les démences présentent toujours un caractère neuropsychologique et un impact comportemental très significatif. Au cours des dernières années, des progrès considérables ont été réalisés dans la recherche de biomarqueurs, mais la qualité de vie du patient reste primordiale et constitue la principale préoccupation pour lui et ses proches. Ainsi, une plus grande précision dans ce domaine ou l’élaboration d’un profil cognitif basé sur des tests cognitifs pourrait être d’une grande utilité.

En continuant sur le plan neurocognitif, puisque ce sujet n’est pas largement abordé dans l’article, on pourrait exploiter les grandes bases de données dont dispose NeuronUP pour reproduire l’étude avec une nouvelle cohorte de patients. De plus, le type de données neuropsychologiques utilisées dans l’étude n’est pas décrit, il pourrait y avoir différents domaines cognitifs qui sont plus pertinents.

Chercheur principal : Dr. Vijaya B. Kolachalama est professeur associé à l’université de Boston et chercheur principal du Kolachalama Lab à l’université de Boston. Ses travaux portent principalement sur l’application de l’intelligence artificielle aux problèmes médicaux. Sa mission est de créer des outils qui aident les neurologues dans des scénarios réels, principalement dans les maladies neurodégénératives.

Bibliographie

Xue, C., Kowshik, S.S., Lteif, D. et al. « Diagnóstico diferencial de etiologías de demencia basado en IA sobre datos multimodales ». Nat Med (2024). https://doi.org/10.1038/s41591-024-03118-z