Ludovic Lebart Alain Morineau Marie Piron Statistique exploratoire multidimensi

Ludovic Lebart Alain Morineau Marie Piron Statistique exploratoire multidimensionnelle DUNOD Ludovic Lebart C.N.R.S., École nationale supérieure des télécommunications Alain Morineau Centre international de statistique et d'informatique appliquées ClSIA Marie Piron Institut français de recherche scientifique pour le développement en coopération, ORSrOM Statistique exploratoire multidimensionnelle DLINOD Ce piclogramme mérile une explico- menh d'enseignemenl supérieur, provo tian. Son objel e,t d'olerler le leeleur quont une baisse brutale de, achat, de ,ur la menaCe que reprit,enle pour livre, el de revue" ou point que la po»i. l'avenir de l'écril, particuliére· ~---"""' bililé même pour le, auteurs de meni dan, le domaine de l'édi· DANGER créer de, œuvre' nouvelle, el lion technique el universiloire, ® de le, foire édiler coueelement le développement mo»if du e,t aujourd'hui menacée. photo<opillage. Nou, rappelons donc que le Code de la propriété inlel- Ioule reproduction, partielle ou lectuelle du 1er juillet 1992 !ft..:~ lolole, de la pré,enle publico- inlerdit en effet expressémenl la lion e,t interdile ,an, oulori,o· photocopie à u,oge colleclif ,on, outori· lion du Cenlre fronçai' d'exploilolion du ,ation de, oyonl' droil. Or, cene pra- drail de copie (CfC, 3 rue Houleleuille, tique ,e,tgénéroli'ée dan, le, établisse- 75006 Pori'). © Dunod, Paris, 1995 ISBN 2 10 002886 3 Toute représentation ou reproduction, intégrale ou partielle, faite sans le consentement de l'auteur, ou de ses ayanlS droit, ou ayants cause, est illicite (loi du 11 mars 1957, alinéa 1er de l'article 40). Celle représentation ou reproduction, par quelque procédé que ce soit, constituerait une conlrefaçon sanctionnée par les articles 425 et suivants du Code pénal. La loi du Il mars 1957 n'autorise, aux tennes des alinéas 2 et 3 de l'article 41, que les copies ou reproductions strictement réservées à l'usage privé du copiste et non destinées à une utilisation collective d'une part, et d'autre part, que les analyses et les courtes citations dans un but d'exemple el d'illustration. Cet ouvrage est dédié à la mémoire de Brigitte Escalier AVANT-PROPOS Cet ouvrage s'adresse aux praticiens, scientifiques et étudiants de toutes disciplines qui ont à analyser et traiter de grands ensembles de données multidimensionnelles, c'est-à-dire finalement des recueils de données statistiques se présentant, totalement ou partiellement, sous forme de tableaux rectangulaires. Le domaine d'application, limité au départ aux sciences de la vie (biométrie, agronomie, écologie) et aux sciences humaines (psychométrie, socio- économie), ne cesse de s'étendre car les possibilités offertes par les outils de traitement suscitent de nouveaux recueils de mesures. Les applications industrielles se développent rapidement et le contrôle de qualité, l'analyse des processus de production, la veille technologique, la recherche documentaire font de plus en plus appel à des ensembles de mesures multidimensionnelles. On a tenté de faire le point sur les développements récents de la statistique exploratoire multidimensionnelle en continuité avec un ouvrage précédent1 dont on reprend d'ailleurs, en les développant, certains chapitres. On s'est ainsi efforcé d'intégrer la substance de plusieurs centaines de publications (dont celles des auteurs) sur le thème de ce précédent travail. Comme toujours pour ce type d'ouvrage qui s'adresse simultanément à des praticiens et des chercheurs de disciplines diverses, plusieurs lectures devraient être possibles selon les connaissances du lecteur notamment en mathématique et statistique: une lecture pratique, d'utilisateur, pour les personnes spécialisées dans les divers domaines d'application actuels et potentiels; une lecture plus technique, complète, pour une personne ayant une formation en mathématiques appliquées et en statistique. 1 Tec/mique de la description statistique, (L.Lebart, A. Morineau, N. Tabard) Dunod, 1977. VI Statistique exploratoire multidimensionnelle La statistique exploratoire multidimensionnelle se prolonge naturellement et se diversifie en des outils et des modèles évidemment plus complexes que les méthodes de base. Mais l'essentiel des applications relèvent en fait de la partie la plus accessible. On a fait preuve d'une grande parcimonie dans l'utilisation de l'outil mathématique: le niveau d'abstraction choisi est toujours le niveau minimal compatible avec une présentation exacte, et la communication a été favorisée au détriment de la généralisation. Les lecteurs mathématiciens sauront sans difficulté introduire les notions qui permettent des formulations plus élégantes. L'ensemble doit beaucoup à des collaborations et des cadres de travail divers: au sein du département Economie et Management, de l'Ecole Nationale Supérieure des Télécommunications et de l'URA82ü du Centre National de la Recherche Scientifique (URA: Traitement et Communication de l'Information, dirigée par Jean-Pierre Tubach) ; au sein du Centre International de Statistique et d'Informatique Appliquées (CISIA), du Centre d'Etude de l'Emploi et de l'Institut français de recherche scientifique pour le développement en coopération (ORSTOM). Nous remercions également les autres collègues, chercheurs ou professeurs auprès desquels nous avons puisé collaboration et soutien, ou simplement eu d'intéressants débats ou discussions, ou encore accès à des documents. Citons, sans être exhaustif, Mireille Bardos, Laurent Benzoni, Abdelhalim Bouamaine, Bernard Burtschy, Pierre Cazes, Fréderic Chateau, Jean-Pierre Fénelon, Christian Mullon, Jérôme Pagès, André Salem, Michel Tenenhaus, Gilbert Saporta et Wenhua Zhu. Nous sommes heureux d'adresser ici nos remerciements à Gisèle Maïus et à Jean-Marc Quilbé, des éditions Dunod, pour l'accueil qu'ils ont réservé à cet ouvrage. L. L., A. M., M. P. Paris, Juillet 1995 Sommaire Introduction générale Chapitre 1 MÉTHODES FACTORIELLES Introduction Section 1.1 : Analyse générale, décomposition aux valeurs singulières 1.1.1 Notions élémentaires et principe d'ajustement 1.1.2 Ajustement du nuage des individus a- Droites d'ajustement b· Caractéristiques du sous-espace d'ajustement 1.1.3 Ajustement du nuage des variables 1.1.4 Relation entre les ajustements dans les deux espaces 1.1.5 Reconstitution des données de départ a· Reconstitution exacte b- Reconstitution approchée c- Qualité de l'approximation 1.1.6 Diversification de l'analyse générale a- Analyse générale avec des métriques et des critères quelconques b- Principe des éléments supplémentaires c- Autres approches 1.1.7 Annexe 1 - Démonstration sur les extrema de formes quadratiques sous contraintes quadratiques Section 1.2 : Analyse en Composantes Principales 1.2.1 Domaine d'application 1.2.2 Interprétations géométriques a- Pour les n individus b- Pour les p variables 1.2.3 Analyse du nuage des individus a- Principe d'ajustement b- Distance entre individus c- Matrice à diagonaliser d- Axes factoriels 1.2.4 Analyse du nuage des points-variables a- distances entre points-variables b- Distance à l'origine c- Axes factoriels ou composantes principales 1 13 15 15 17 17 19 19 20 22 22 23 24 24 24 27 28 29 32 32 33 33 34 34 34 36 37 37 38 38 39 41 VJll Statistique exploratoire multidimensionnelle 1.2.5 1.2.6 1.2.7 1.2.8 1.2.9 1.2.10 1.2.11 Individus et variables supplémentaires a- Individus supplémentaires b- Variables continues supplémentaires c- Variables nominales supplémentaires Représentation simultanée a- Représentation séparée des deux nuages b- Justification d'une représentation simultanée Analyse en composantes principales non normée a- Principe de l'analyse et nuage des individus b- Nuage des variables Analyses non-paramétriques a- Analyse des rangs b- Analyse en composantes robustes Aperçu sur les autres méthodes dérivées Eléments pour l'interprétation a- Inertie liée aux facteurs b- Aides à l'interprétation Exemple d'application 42 43 43 43 45 45 46 48 49 50 51 51 52 53 53 54 55 57 Section 1.3 : Analyse des correspondances 1.3.1 Domaine d'application 1.3.2 Démarche et principe; une introduction élémentaire a- Transformations du tableau de contingence b- Hypothèse d'indépendance c- Construction des nuages d- Critère d'ajustement e- Choix des distances f- Equivalence distribu tionnelle g- Relations de transition ou pseudo-barycentriques h- Justification de la représentation simultanée 1.3.3 Schéma général de l'analyse des correspondances a- Géométrie des nuages et éléments de base b- Critère à maximiser et matrice il diagonaliser c- Axes factoriels et facteurs d- Relation entre les deux espaces e- Relations de transition f- Représentation simultanée g- Autre présentation de J'analyse des correspondances h- Formule de reconstitution des données 1.3.4 Règles d'interprétation; inertie, formes de nuages a- Inertie et test d'indépendance b- Quelques formes caractéristiques de nuages de points 1.3.5 Règles d'interprétation: contributions et cosinus a- Contributions b- Cosinus carrés c- Exemple numérique 1.3.6 Eléments supplémentaires 67 67 68 69 70 71 72 73 74 75 78 79 79 82 84 84 85 86 87 89 89 89 92 94 94 95 97 99 Sommaire IX 1.3.7 Mise en œuvre des calculs a- Analyse par rapport à l'origine ou au centre de gravité du nuage b- Symétrisation de la matrice à diagonaliser 1.3.8 Exemple d'application 100 100 102 103 1.4.8 1.4.5 1.4.3 1.4.4 108 108 109 110 110 III 113 114 114 115 117 117 118 119 120 121 122 123 125 126 127 130 131 132 135 Section 1.4 : Analyse des correspondances multiples 1.4.1 Domaine d'application 1.4.2 Notations et définitions a- Hypercube de contingence b- Tableau disjonctif complet c- Tableau des faces de l'hypercube de contingence ou tableau de contingence de Burt Principes de l'analyse des correspondances multiples a- Critère d'ajustement et distance du X2 b- Axes factoriels et facteurs c- Facteurs et relations pseudo-barycentriques d- Sous-nuage des modalités d'une même variable e- Support du nuage des modalités f- Meilleure représentation simultanée g- Inertie du nuage des modalités et conséquences pratiques h- Règles d'interprétation i- Principes du découpage en classes Eléments supplémentaires a- Valeurs-test pour les modalités supplémentaires b- Variables continues supplémentaires Analyse du tableau de contingence de Burt: équivalence avec l'analyse du tableau disjonctif complet Cas de deux questions Cas particuliers a- uploads/Litterature/ statistique-exploratoire-multidimensionnelle-lebart-morineau-piron-pdf.pdf

  • 35
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager