Présentation théorique Etude d’un cas individuelle mini projet Etude d’un cas i

Présentation théorique Etude d’un cas individuelle mini projet Etude d’un cas individuelle mini projet Exemples d’application Exemples d’application Presentation intuitive Presentation intuitive Presentation deux Études AD Presentation deux Études AD Le Programme Analyse des données Analyse des données Méthode d’analyse factorielle Méth class Classification Ascendante Hiérarchique CAH Class Desc Hiéra C Analyse Factorielle Des Correspondance AFC Analyse discriminante (analyse discriminante Barycentrique) analyse canonique 1 - HISTORIQUE : Les méthodes d'analyse des données ont été élaborées depuis les années 30 : H. HOTELLING posait les fondements de l'analyse en composante principale et de l'analyse cononique. Jusqu'aux années 60, ces méthodes restaient inabordables pour les praticiens car elles nécessitent une masse considérable de calculs. Le développement des ordinateurs a permis la vulgarisation des techniques statistiques d'analyse des données. Une impulsion importante fut donnée par J.P. BENZECRI au laboratoire de statistique mathématique à l'université de Paris. - La statistique classique s'est axée sur l'étude d'un seul caractère ou variable mesurée. Les méthodes d'analyse des données ont été élaborées depuis les années 30 : H. HOTELLING posait les fondements de l'analyse en composante principale et de l'analyse cononique. Jusqu'aux années 60, ces méthodes restaient inabordables pour les praticiens car elles nécessitent une masse considérable de calculs. Le développement des ordinateurs a permis la vulgarisation des techniques statistiques d'analyse des données. Une impulsion importante fut donnée par J.P. BENZECRI au laboratoire de statistique mathématique à l'université de Paris. - La statistique classique s'est axée sur l'étude d'un seul caractère ou variable mesurée. 2 - CLASSIFICATION DES MÉTHODES D'ANALYSE DES DONNÉES : •On peut classer les techniques d'analyse des données suivant deux points de vue : • - Technique mathématique utilisée. • - But poursuivi. •a) Les techniques d'analyse factorielle (linéaire) qui se ramènent toujours à raisonner dans un espace euclidien et à diagonaliser une matrice carrée. Ces techniques reposent sur l'algèbre linéaire et la géométrie euclidienne. •b) Les techniques de classification qui font apparaître des structures telles que des arbres ou des partitions à partir de tableaux de distances. Ces techniques reposent sur la théorie des graphes et la combinatoire. • On peut classer les techniques d'analyse des données suivant deux points de vue : • - Technique mathématique utilisée. • - But poursuivi. • a) Les techniques d'analyse factorielle (linéaire) qui se ramènent toujours à raisonner dans un espace euclidien et à diagonaliser une matrice carrée. Ces techniques reposent sur l'algèbre linéaire et la géométrie euclidienne. • b) Les techniques de classification qui font apparaître des structures telles que des arbres ou des partitions à partir de tableaux de distances. Ces techniques reposent sur la théorie des graphes et la combinatoire. 3 - DOMAINE D'APPLICATION : •a) les tableaux de contingence croisant l'ensemble des modalités du caractère qualitatif X avec l'ensemble J des modalités du caractère qualitatif Y • a) les tableaux de contingence croisant l'ensemble des modalités du caractère qualitatif X avec l'ensemble J des modalités du caractère qualitatif Y Ou bien I ensemble de CSP catégories socioprofessionnelles J ensemble de causes de décès Taille en m Poids en kg Taille en m Poids en kg < 1,50 < 1,50 1,5-1,6 1,5-1,6 1,6-1,7 1,6-1,7 1,7-1,8 1,7-1,8 >1,8 >1,8 < 50 < 50 5 5 6 6 10 10 21 21 6 6 50-60 50-60 45 45 69 69 78 78 23 23 64 64 60-70 60-70 61 61 54 54 54 54 65 65 32 32 70-80 70-80 36 36 93 93 25 25 39 39 95 95 >80kgs >80kgs 0 0 5 5 6 6 8 8 7 7 Les tableaux homogènes de nombres positifs •b) Les tableaux homogènes de nombres positifs où l'addition de deux lignes ou de deux colonnes a un sens. •Exemple: I ensemble d'entreprises • J ensemble de secteurs •k(i,j) : chiffre d'affaire de l'entreprise i dans le secteur j. •Additionner deux lignes revient à regrouper deux entreprises •Additionner deux colonnes revient à regrouper deux secteurs. •Au lieu du chiffre d'affaire, on peut prendre le nombre de salariés de l'entreprise i dans le secteur j. • b) Les tableaux homogènes de nombres positifs où l'addition de deux lignes ou de deux colonnes a un sens. • Exemple: I ensemble d'entreprises • J ensemble de secteurs • k(i,j) : chiffre d'affaire de l'entreprise i dans le secteur j. • Additionner deux lignes revient à regrouper deux entreprises • Additionner deux colonnes revient à regrouper deux secteurs. • Au lieu du chiffre d'affaire, on peut prendre le nombre de salariés de l'entreprise i dans le secteur j. • c) tableaux de mensuration où I est un ensemble d'animaux et J un ensemble de mensurations • k(i,j) = mensuration j pour l'animal i • Éviter les redondances et les combinaisons linéaires (ex mesure totale et intermédiaires). • d) Les tableaux de teneur où I est par exemple un ensemble de roches et J un ensemble d'éléments majeurs et où k(i,j) désigne la teneur de l'élément j dans la roche i on a alors : • ∑{k(i,j) /jЄJ} = 100 (1) Les tableaux de courbe •e) Les tableaux de courbe ou encore de particules d'air) et J un ensemble de classes granulométriques et où k(i;j) représente la fraction du sédiment, appartenant à la classe granulométrique j. C'est un tableau qui vérifie aussi la relation (1) et rentre comme les tableaux de teneur dans la classe des tableaux de pourcentage. • e) Les tableaux de courbe ou encore de particules d'air) et J un ensemble de classes granulométriques et où k(i;j) représente la fraction du sédiment, appartenant à la classe granulométrique j. C'est un tableau qui vérifie aussi la relation (1) et rentre comme les tableaux de teneur dans la classe des tableaux de pourcentage. Les tableaux de courbes •Les tableaux de courbes, où I est un ensemble de courbes, J un ensemble d'abscisses (utilisées pour discrétiser les courbes, si on a affaire a des courbes continues). Si on a un découpage de l'axe des abscisses avec un pas constant, k(i,j) est égal à la coordonnée de la courbe i correspondant à l'abscisse j. •Sinon aj désignant l'abscisse associée à j, il faut prendre pour k(i,j) la surface délimitée par la courbe et l'axe des abscisses. • Les tableaux de courbes, où I est un ensemble de courbes, J un ensemble d'abscisses (utilisées pour discrétiser les courbes, si on a affaire a des courbes continues). Si on a un découpage de l'axe des abscisses avec un pas constant, k(i,j) est égal à la coordonnée de la courbe i correspondant à l'abscisse j. • Sinon aj désignant l'abscisse associée à j, il faut prendre pour k(i,j) la surface délimitée par la courbe et l'axe des abscisses. • exemples : • - courbes de thermoluminescence d'une série de quartz l'axe des x correspond à des énergies ou des températures. • L'axe des y correspond à des énergies ou températures. • - Étude de la courbe de charge de la consommation électrique • l’axe des x correspond au temps de 0 heure à 24 heures • l’axe des y correspond à la puissance consommée Les tableaux d'échange industriel • tableau d'échange interindustriels (TEI) ou tableau de Leontief ou tableau d'importation et d'exportation. •Ces tableaux sont des tableaux carrés (I = J) en général non symétriques car k(j,j') est différent de k(j',j). Car l’échange de j vers j’ est diffèrent de j’ vers j. •Pour étudier de tels tableaux, on fait l'AFC du tableau accolé à son transposé, de façon à ce que dans le cas des importations exportations entre pays par exemple chaque pays soit caractérisé par ses importations d'une part et ses exportations d'autre part. Chaque pays serait alors décrit par son côté importateur et son côté exportateur •k(j,j') désigne le montant des importations de j vers j' (égal au montant des exportations de j' vers j). •Dans le cas de tableaux d'échange interindustriel k(j,j') désigne le montant des échanges de j vers j'. Ce tableau est le meilleur indicateur du développement d'un pays, bien plus précis que le PIB • tableau d'échange interindustriels (TEI) ou tableau de Leontief ou tableau d'importation et d'exportation. • Ces tableaux sont des tableaux carrés (I = J) en général non symétriques car k(j,j') est différent de k(j',j). Car l’échange de j vers j’ est diffèrent de j’ vers j. • Pour étudier de tels tableaux, on fait l'AFC du tableau accolé à son transposé, de façon à ce que dans le cas des importations exportations entre pays par exemple chaque pays soit caractérisé par ses importations d'une part et ses exportations d'autre part. Chaque pays serait alors décrit par son côté importateur et son côté exportateur • k(j,j') désigne le montant des importations de j vers j' (égal au montant des exportations de j' vers j). • Dans le cas de tableaux d'échange interindustriel k(j,j') désigne le montant des échanges de j vers j'. Ce tableau est le meilleur indicateur du développement d'un pays, bien plus précis que le PIB Les tableaux de notes •Les tableaux de notes où I est par exemple un ensemble d'étudiants, J un uploads/Management/ cours-a-donnees 1 .pdf

  • 16
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager
  • Détails
  • Publié le Jul 25, 2021
  • Catégorie Management
  • Langue French
  • Taille du fichier 32.3871MB