Aide a l x27 utilisation de r analyse en composantes principales et autres reductions dimensionnelles
Aide à l'utilisation de R Analyse en composantes principales et autres réductions dimensionnelles en langage R L'essentiel de cette page L'analyse en composante principale ACP ou PCA en anglais permet de réduire le nombre de dimensions d'un jeu de données multidimensionnel Cette page explique comment réaliser une ACP avec R mais aussi comment visualiser les résultats Elle dirige vers d'autres pages pour la mise en forme Si en revanche l'ACP ne donne pas des résultats satisfaisants il existe d'autres solutions Les plus basiques sont expliquées dans cette page Si vous voulez être formé en Aquitaine aux autres solutions plus performantes n'hésitez- pas à demander un devis L'analyse en composantes principales permet d'après Wikipedia septembre de transformer des variables liées entre elles dites corrélées ? en statistique en nouvelles variables décorrélées les unes des autres Ces nouvelles variables sont nommées composantes principales ? ou axes principaux Elle permet à l'analyste de réduire le nombre de variables et de rendre l'information moins redondante Cette page s'intéresse ici non pas à l'ACP en elle-même présentation succincte rubrique mais à la représentation graphiques des composantes dans le cadre d'une étude ou d'une publication Réaliser une analyse en composantes principales L'analyse des données dans le cadre des statistiques multivariées se fait par plusieurs méthodes dont l'ACP Analyse en Composantes Principales Voici comment réaliser une telle étude Réaliser une ACP exemple d'ACP pas à pas avec R par défaut ou les librairies ade et FactoMineR Étape - Ouvrir des données Ouverture des données - données cancers txt data read table cancers txt sep t header T colnames data rownames data data On donne à chaque ligne le nom de son cancer Cancer Cancer x data - x On exclue la colonne qui contenait les noms des cancers Données téléchargeables ici Dans cet exemple on ouvre des données simulées présentant des résultats moyens de concentration de marqueurs sanguins M à M pour catégories de cancers Cancer à Chaque catégorie de cancer présente ainsi un taux moyen de marqueurs variable d'une catégorie à l'autre On cherche à voir s'il existe des cancers qui présenterait une signature sanguine caractéristique Pour cela on réalise une ACP Étape - Réaliser l'ACP Plusieurs librairies permettent de réaliser des ACP avec R La commande par défaut prcomp installé sur R par défaut renvoie une acp dont la description est délicate à obtenir ade dudi pca permet d'obtenir facilement une acp et sa description On peut facilement voir un diagramme de Pareto pour sélectionner les composantes qui ont du poids factomineR PCA est un package très performant qui permet d'aller bien au-delà de l'ACP Méthode par défaut de R prcomp acp - prcomp x scale F acp Avec la librairie ade install packages ade library ade acp - dudi pca x scannf F scale FALSE nf acp Avec la librairie FactoMineR install packages FactoMineR library FactoMineR acp PCA x scale unit F ncp graph T acp Paramétrage de la commande prcomp R par défaut center T permet de centrer les données soustraction de la
Documents similaires










-
24
-
0
-
0
Licence et utilisation
Gratuit pour un usage personnel Aucune attribution requise- Détails
- Publié le Aoû 04, 2022
- Catégorie Management
- Langue French
- Taille du fichier 119.3kB