Bad enough! The old story again! When we have finished building our house, we s

Bad enough! The old story again! When we have finished building our house, we suddenly notice that we have learned something in the process, something we simply had to know before we started to build. The eternally tiresome "Too late!" - The melancholy of everything finished! . . . — Friedrich Nietzsche, Beyond Good and Evil, subsection 277 Remerciements REMERCIEMENTS C’est avec plaisir que je réserve cette page en signe de gratitude et de profonde reconnaissance à tous ceux qui m’ont aidé à réaliser ce travail. Je remercie mon encadrant à l’ISIMM Monsieur Kmimech Mourad, pour son encadrement, son assistance, son soutien et ses précieux conseils durant tout ce travail. Je tiens à remercier les membres de Jury pour l’honneur qu’ils m’ont fait pour avoir accepté de juger ce travail. Enfin, j’adresse mes sincères remerciements à toute personne m’ayant fourni de l’aide durant, avant et après ce stage. Je m’acquitte, enfin, volontiers d’un devoir de gratitude et de remerciements à tous les enseignants de l’ISIMM qui ont si bien mené leur noble quête d’enseigner les bases de l’informatique. ii Table des matières TABLE DES MATIÈRES INTRODUCTION GÉNÉRALE................................................................................................1 CHAPITRE 1 : CONTEXTE GÉNÉRAL ET ÉTUDE PRÉALABLE...............................4 1. INTRODUCTION....................................................................................................................5 2. PRÉSENTATION DU PROJET...................................................................................................5 2.1 Cadre du projet.............................................................................................................5 2.2 Motivation.....................................................................................................................5 2.3 Étude de l’existant.........................................................................................................6 2.4 Critique de l’existant...................................................................................................11 2.5 Solutions proposées.....................................................................................................12 2.6 Etude des méthodologies de développement...............................................................12 3. CONCEPTS DE BASE............................................................................................................17 3.1 La maladie d’Alzheimer ?...........................................................................................17 3.1.1 Qu’est-ce que la maladie d’Alzheimer ?...............................................................17 3.1.2 Les symptômes......................................................................................................17 3.1.2.1 Amnésie..........................................................................................................18 3.1.2.2 Aphasie...........................................................................................................18 3.1.2.3 Apraxie...........................................................................................................18 3.1.2.4 Agnosie...........................................................................................................18 3.1.3 Le cerveau et la MA..............................................................................................18 3.1.4. Altérations macroscopiques associées à la MA...................................................20 3.1.5 Facteurs de risque.................................................................................................21 3.1.6 Les différents stades de la MA..............................................................................21 3.2 Le diagnostic de la maladie d’Alzheimer....................................................................22 3.2.1 Bilan neuropsychologique....................................................................................22 3.2.2 Mini Mental State Examination............................................................................23 3.2.3 L’épreuve des 5 mots............................................................................................23 3.2.4 Imagerie cérébrale.................................................................................................23 iii Table des matières 3.3 L’apport de l’imagerie anatomique............................................................................23 4. CONCLUSION......................................................................................................................25 CHAPITRE 2 : TECHNIQUES UTILISÉES DANS NOTRE APPROCHE...................26 1. INTRODUCTION..................................................................................................................27 2. MACHINE LEARNING (APPRENTISSAGE AUTOMATIQUE)....................................................27 2.1 Définition.....................................................................................................................27 2.2 Apprentissage supervisé / non supervisé.....................................................................27 2.3 Algorithmes d’apprentissage supervisé......................................................................28 2.3.1 Decision tree (arbre de décision)..........................................................................28 2.3.2 Random forest (Forêt aléatoire)............................................................................28 2.3.3 SVM : Machines à Vecteurs de Support...............................................................29 2.3.3.1 Définition.......................................................................................................29 2.3.3.2 Principe de fonctionnement général...............................................................29 2.3.4 Logistic Regression (Régression Logistique).......................................................30 2.3.4.1 Définition.......................................................................................................30 3. DEEP LEARNING (L'APPRENTISSAGE PROFOND)................................................................32 3.1 Introduction.................................................................................................................32 3.2 Définition de Deep Learning.......................................................................................32 3.3 Quelques algorithmes de Deep Learning....................................................................32 3.4 Principe d’architecture d’un modèle CNN.................................................................33 3.5 Les blocs de construction d’un CNN...........................................................................34 3.5.1 La couche de convolution (CONV)......................................................................34 3.5.2 Couche de pooling (POOL)..................................................................................35 3.5.3 Couche de correction (ReLU)...............................................................................36 3.5.4 Couche entièrement connectée (FC).....................................................................36 3.5.5 Couche de perte (LOSS).......................................................................................37 4. CONCLUSION......................................................................................................................37 CHAPITRE 3 : ANALYSE, SPÉCIFICATIONS DES BESOINS ET CONCEPTION. 38 1. INTRODUCTION..................................................................................................................39 2. ANALYSE ET IDENTIFICATION DES BESOINS......................................................................39 2.1 Définition.....................................................................................................................39 2.2 Identification des acteurs............................................................................................39 3. BESOINS FONCTIONNELS....................................................................................................40 iv Table des matières 4. BESOINS NON FONCTIONNELS............................................................................................41 5. SPÉCIFICATION DES BESOINS FONCTIONNELS....................................................................41 5.1Diagramme de cas d’utilisation...................................................................................42 6. LES FRAMEWORKS DE DÉVELOPPEMENT...........................................................................42 7. PERSISTANCE DES DONNÉES..............................................................................................43 7.1 Choix de la base de données.......................................................................................43 7.2 Conception de la base de données..............................................................................44 8. ARCHITECTURE DE L’APPLICATION...................................................................................45 8.1 Modèle Architectural...................................................................................................45 8.1.1 Architecture 3-tiers...............................................................................................45 8.1.2 Modèle MVC........................................................................................................46 8.1.3 Spécificité de Flask...............................................................................................47 8.1.4 Architecture physique...........................................................................................48 9. VUE STATIQUE : DIAGRAMME DE CLASSE.........................................................................49 9.1. Description des classes..............................................................................................49 9.2 Diagrammes de classes...............................................................................................49 10. DIAGRAMME DE SÉQUENCES...........................................................................................51 10.1. Description de diagramme de séquences.................................................................51 10.2. Diagramme de séquences.........................................................................................51 10.2.1 Diagramme de séquence du cas d’utilisation « authentification »......................51 10.2.2 Diagramme de séquence du cas d’utilisation « Classification à travers ML»....52 10.2.3 Diagramme de séquence du cas d’utilisation « Classification à travers l’IRM » ........................................................................................................................................53 11. CONCLUSION....................................................................................................................54 CHAPITRE 4 : IMPLÉMENTATION DES ALGORITHMES ML ET DU MODÈLE CNN..........................................................................................................................................56 1. INTRODUCTION..................................................................................................................57 2. ENVIRONNEMENT DE DÉVELOPPEMENT.............................................................................57 2.1 Environnement matériel..............................................................................................57 2.2 Environnement logiciel...............................................................................................57 2.2.1 Présentation de milieu de travail kaggle...............................................................57 2.2.2 Organisation de travail avec “ Notebooks”...........................................................58 3. LANGAGES DE PROGRAMMATION ET BIBLIOTHÈQUES.......................................................59 v Table des matières 3.1 Langages de programmation......................................................................................59 3.2 Bibliothèques et frameworks utilisés...........................................................................60 4. PRÉREQUIS.........................................................................................................................62 4.1 Prérequis fonctionnels.................................................................................................63 4.2 Prérequis non fonctionnels..........................................................................................63 5. MÉTHODOLOGIE DE TRAVAIL............................................................................................65 5.1 Représentation de la méthodologie CRISP-DM pour la partie IA..............................65 6. DÉTECTION PRÉCOCE DE LA MA EN UTILISANT LA MACHINE LEARNING.........................67 6.1. La compréhension du problème métier......................................................................67 6.2. La compréhension des données..................................................................................67 6.2.1 Description de la base de données........................................................................67 6.2.2 Description des colonnes de la base de données...................................................68 6.3 La construction du Data Hub......................................................................................69 6.3.1 Analyse exploratoire.............................................................................................69 6.4. Data Preprocessing....................................................................................................73 6.4.1 Traitement des variables manquantes...................................................................73 6.4.2 Techniques de Feature Scaling.............................................................................74 6.5. Modélisation...............................................................................................................74 6.5.1 Data splitting.........................................................................................................74 6.5.2 Les mesures de performance.................................................................................75 6.5.3 L’évaluation des performances de nos algorithmes..............................................75 6.5.3.1 Performances de l’algorithme Logistic Regression avec imputation.............75 6.5.3.2 Performances de l’algorithme Logistic Regression sans imputation.............76 6.5.3.3 Performances de l’algorithme SVM...............................................................77 6.5.3.4 Performances de l’algorithme Decision Tree.................................................77 6.5.3.5 Performances de l’algorithme Random Forest Classifier..............................78 6.5.3.6 Importance des attributs selon l’algorithme Decision Tree...........................79 6.5.3.7 Importance des attributs selon l’algorithme Random Forest.........................79 6.5.4 Conclusion............................................................................................................80 6.6. Le déploiement...........................................................................................................81 7. CLASSIFICATION DES IRM’S À TRAVERS LE MODÈLE CNN..............................................81 7.1. La compréhension du problème métier......................................................................81 7.2. La compréhension des données..................................................................................81 7.2.1 Description de la base de données........................................................................82 vi Table des matières 7.3. La construction du Data Hub.....................................................................................82 7.3.1 Data splitting.........................................................................................................82 7.3.2 Réorganisation des images dans un nouveau dossier...........................................82 7.3.3 CORRECT CLASS LABEL IMBALANCES......................................................83 7.3.4 GENERATE TRAINING IMAGES.....................................................................84 7.4. La modélisation..........................................................................................................85 7.5 L’évaluation des performances de notre modèle........................................................88 7.5.1 Rappel de quelques notions de base......................................................................88 7.5.2 Évolution de la fonction de perte par epoch.........................................................90 7.5.3 Évolution de categorical accuracy par epoch........................................................90 7.5.4 Évolution de multiclass_AUC par epoch..............................................................91 7.6 Implémentation............................................................................................................94 8. CONCLUSION......................................................................................................................95 CHAPITRE 5 : RÉALISATION...........................................................................................96 1. INTRODUCTION..................................................................................................................97 2. INTERFACE D’ACCUEIL......................................................................................................97 3. INTERFACE D’INSCRIPTION................................................................................................99 4. INTERFACE D’AUTHENTIFICATION...................................................................................100 5. INTERFACE MACHINE LEARNING.....................................................................................101 6. INTERFACE DEEP LEARNING............................................................................................106 7. CONCLUSION....................................................................................................................107 CONCLUSION GÉNÉRALE..............................................................................................108 Bibliographie...........................................................................................................................109 vii Liste des tableaux LISTE DES TABLEAUX Tableau 1.1 : Performances des algorithmes ML existants......................................................10 Tableau 1.2 : Performances des algorithmes DL existants.......................................................11 Tableau 1.3 – Comparaison des méthodologies de développement.........................................16 Tableau 3.1 Bases de données Relationnelles vs NoSQL.........................................................43 Tableau 4.1 : Liste des exigences fonctionnelles des algorithmes ML/DL..............................63 Tableau 4.2 : Liste des exigences non fonctionnelles des algorithmes ML/DL.......................64 Tableau 4.3 liste des variables de la BDD................................................................................68 Tableau 4.4 indicateurs de dispersion de notre BDD...............................................................69 Tableau 4.5 performances de tous les algorithmes...................................................................80 Tableau 4.6 nombre d’images dans chaque répertoire..............................................................83 Tableau 4.7 tableau de contingence..........................................................................................94 viii Liste des figures LISTE DES FIGURES Figure 1.1 : Logo de l’application...............................................................................................7 Figure 1.2 Interface de site web hébergeant le test SAGE.........................................................8 Figure 1.3 Les 3 premières questions du Test CDR...................................................................9 Figure 1.4 – Processus de développement suivant la méthodologie Scrum.............................13 Figure 1.5 – Processus de développement suivant un Processus Unifié (UP)..........................14 Figure 1.6 Méthode de développement 2TUP..........................................................................15 Figure 1.7 Anatomie du cerveau...............................................................................................19 Figure 1.8 Le système limbique................................................................................................20 Figure 1.9 - Coupe coronale de cerveau (disparition massive de cellules)...............................20 Figure 1.10 - Différentes images acquises par IRM : image pondérée T1 (image a), T2 (Image b), Diffusion (image c) et Flair (image d).................................................................................24 Figure 1.11 - IRM à haute résolution spatiale pondérée en T 1 ; (a) : coupe coronale ; (b) : coupe sagittale ; (c) : coupe axiale............................................................................................24 Figure 2.1 SVM et hyperplan....................................................................................................30 Figure 2.2 Modélisation de la probabilité de maladie ..............................................................31 Figure 2.3 Application de la fonction sigmoïde sur la probabilité d’être malade ....................31 Figure 2.4 Les réseaux de neurones convolutifs ......................................................................33 Figure 2.5 Ensemble de neurones créant la profondeur d'une couche de convolution.............35 Figure 2.6 Pooling avec un filtre 2x2 et un pas de 2.................................................................36 Figure 3.1 diagramme de cas d’utilisation................................................................................42 ix Liste des figures Figure 3.1 Logo du Framework Flask.......................................................................................43 Figure 3.2 Diagramme de base de données..............................................................................45 Figure 3.3 – Architecture 3-tiers...............................................................................................46 Figure 3.4 – Modèle MVC........................................................................................................47 Figure 3.5 Architecture MVT...................................................................................................48 Figure 3.6 Architecture physique du système...........................................................................49 Figure 3.7 Diagramme MVC....................................................................................................51 Figure 3.8 Diagramme de séquence du cas d’utilisation « S’authentifier ».............................52 Figure 3.9 Diagramme de séquence du cas d’utilisation « Classifier à travers ML »..............53 Figure 3.10 Diagramme de séquence du cas d’utilisation « Classification des IRM’s »..........54 Figure 4.1 logo python..............................................................................................................60 Figure 4.2 bibliothèques utilisées pour l’implémentation des algorithmes ML.......................60 Figure 4.3 Logo keras et TensorFlow......................................................................................61 Figure 4.4 bibliothèques utilisées pour l’implémentation du modèle CNN.............................62 Figure 4.5 représentation de la méthodologie CRISP...............................................................65 Figure 4.6 Sexe et atteinte par MA...........................................................................................70 Figure 4.7 Score MMSE et atteinte par MA.............................................................................71 Figure 4.8 ASF/ eTIV/ nWBV et atteinte par MA....................................................................72 Figure 4.9 Relation entre âge et atteinte par MA......................................................................73 Figure 4.10 Visualisation des valeurs manquantes...................................................................74 Figure 4.11 Mesures de performance de l’algorithme régression logistique avec imputation. 76 Figure 4.12. Mesures de performance de l’algorithme régression logistique sans imputation.76 Figure 4.13 Mesures de performance de l’algorithme SVM....................................................77 Figure 4.14 Mesures de performance de l’algorithme Decision Tree......................................78 x Liste des figures Figure 4.15 Mesures de performance de l’algorithme Random Forest....................................78 Figure 4.16 Importance des attributs selon l’algorithme decision Tree....................................79 Figure 4.17 Importance des attributs selon l’algorithme Random Forest.................................80 Figure 4.18 Enregistrement du modèle RandomForest............................................................81 Figure 4.19 l’ensemble de données après la réorganisation.....................................................83 Figure 4.20 La composition des 3 répertoires de notre BDD...................................................85 Figure 4.21 Architecture de notre modèle CNN.......................................................................88 Figure 4.22 Évolution de la fonction de perte par epoch..........................................................90 Figure 4.23 Évolution de categorical accuracy.........................................................................91 Figure 4.24 Évolution de multiclass_AUC par epoch..............................................................92 Figure 4.25 Performance de classification des images du Test Set..........................................92 uploads/Sante/ dddd-final2-finis.pdf

  • 27
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager
  • Détails
  • Publié le Jul 01, 2022
  • Catégorie Health / Santé
  • Langue French
  • Taille du fichier 3.4719MB