MPRA Munich Personal RePEc Archive Data analysis: course summary with case stud

MPRA Munich Personal RePEc Archive Data analysis: course summary with case studies Mohamed Ali Trabelsi Faculty of Economics and Management of Tunis, University of Tunis El Manar 3 May 2016 Online at https://mpra.ub.uni-muenchen.de/82947/ MPRA Paper No. 82947, posted 27 November 2017 00:30 UTC Analyse des données : Résumé de cours avec exercices d’application Mohamed Ali Trabelsi Professeur en Méthodes Quantitatives Université Tunis El Manar, Tunisie 1 Sommaire Chapitre 1 : Rappel sur les notions de matrice et d’échantillonnage 1. Calcul matriciel 1.1. Définition d’une matrice 1.2. Déterminant d’une matrice 1.3. Valeurs propres et vecteurs propres 2. Echantillonnage 2.1. Collecte des informations 2.2. Les étapes d’une enquête par sondage 2.3. Choix de l’échantillon Chapitre 2 : Analyse univariée et tests non paramétriques 1. Analyse univariée 1.1. Description d’une série statistique 1.2. Organisation et représentation des données 1.3. Définition des indicateurs 2. Tests non paramétriques 2.1. Test de Khi-deux 2.2. Test de Mac Nemar 2.3. Test de Kolmogorov et Smirnov 2.4. Test de spearman 2.5. Test de Wilcoxon Exercices Chapitre 3 : Analyse bivariée 1. Cas de deux variables nominales 2. Cas de deux variables ordinales 3. Cas de deux variables quantitatives 4. Tests d’indépendance de deux variables Chapitre 4 : Analyse en composantes principales (ACP) 1. Nature des données étudiées 2. Adéquation des données 3. Présentation de la méthode 4. Interprétation des résultats Exercices 2 Chapitre 5 : Analyse factorielle des correspondances (AFC) 1. Présentation de la méthode 2. Technique de la méthode 3. Interprétation des résultats 4. Notion de contribution Exercices 3 Préface La plupart des décisions de l’entreprise reposent sur des données collectées sur le marché, les clients et les concurrents. Mais le plus souvent, les différentes analyses sont simplistes et limitées à des analyses descriptives et ne sont pas explicatives des phénomènes observés. Cet ouvrage destiné aux étudiants de Licence en Marketing, de Master ou Doctorat est une présentation accessible et concrète de la recherche par questionnaire et des principales techniques statistiques d’analyse des données. Il est un outil aidant les futurs gestionnaires dans leur activité. A travers ce livre, ils apprendront : - Comment rédiger un questionnaire efficace et améliorer la validité et la fiabilité de ce questionnaire - Que faire des données recueillies - Comment les analyser et quelle approche mobiliser pour décrire les résultats d’une enquête - Quels enseignements en tirer et comment expliquer l’influence d’une décision sur un marché Autant de questions auxquelles répond cet ouvrage dont l’objectif est d’amener à découvrir tout le potentiel de l’analyse des données à travers un résumé de cours et de nombreux exemples et exercices d’application. Mohamed Ali Trabelsi Professeur en Méthodes Quantitatives Université Tunis El Manar 4 Chapitre 1 : Rappel sur les notions de matrice et d’échantillonnage 1. Calcul matriciel 1.1. Définition d’une matrice On appelle une matrice à n lignes et p colonnes, tout tableau formé par des coefficients réels aij avec 1 ≤ i ≤ n et 1≤ j≤ p. Cette matrice sera notée par An,p An,p = 1.2. Déterminant d’une matrice Soit A une matrice d’ordre n (n= p) 1.2.1. Cas d’une matrice d’ordre 2 Soit A= . Le déterminant de A, noté par det(A)= = ad-bc. 1.2.2. Cas d’une matrice d’ordre n (n ≥ 3) Soit A= . Le déterminant de est défini par : Dét(A)= = a11∆11- a12∆12 + a13∆13 - ……..+(-1)1+n a1n∆1n = -a21∆11+ a22∆12 – a23∆13 + ……..+(-1)2+n a2n∆2n = (-1)n+1 an1∆n1+ (-1)n+2 an2∆n2 +(-1)n+3 an3∆n3 + ……..+ ann∆nn où ∆ij est le déterminant mineur obtenu en supprimant la ième ligne et la jème colonne. Exemple A= , dét(A)=0 Remarque : Dans la pratique, on choisit la ligne ou la colonne qui contient le maximum de zéros 1.2.3. Règle de SARRUS Cette règle est utilisée pour les déterminants d’ordre 3 1.3. Valeurs propres et vecteurs propres d’une matrice 1.3.1. Définition Soit A une matrice d’ordre n et soit V un vecteur non nul de . On dit que le réel α est une valeur propre associée au vecteur propre V si et seulement si AV= α V <=> AV- α V= 0 <=> (A- αI)V= 0. Pour déterminer les valeurs propres, il suffit de résoudre l’équation det(A- αI)= 0. 5 Le det(A- αI) est appelé polynôme caractéristique et sera noté par P(α). Exemples : Exemple 1 : Soit A= Exemple 2 : Soit A= 1.3.2. Diagonalisation d’une matrice Soit A une matrice d’ordre n, D la matrice diagonale formée par les valeurs propres de A et P la matrice de passage formée par les vecteurs propres associés. Dans ce cas, A=PDP-1. 2. Echantillonnage 2.1. Collecte des informations Dans la pratique, il existe plusieurs méthodes permettant la sélection d’un échantillon d’individus dans une population dont l’objectif est d’étudier le comportement ou les opinions de certains sous-ensembles d’individus. L’échantillonnage d’une population n’est pas le seul moyen d’acquérir une information. Il existe d’autres moyens qui feront l’objet de ce paragraphe. 2.1.1. Les principaux modes de collecte On peut classer les méthodes de collecte en trois catégories : l’observation, l’enquête et l’expérimentation. 2.1.1.1. L’observation : il s’agit de la collecte des informations observées par l’enquêteur. Celui-ci enregistre les activités (exemple : on peut observer le comportement des consommateurs au niveau de la caisse d’un magasin ou les individus au niveau d’une municipalité). 2.1.1.2. L’enquête par sondage : l’objectif de l’enquête par sondage est e décrire une partie de la population, ses comportements, ses opinions et ses attitudes. L’objectif du chercheur est la représentativité de l’échantillon. En effet, on doit arriver à extrapoler les résultats obtenus à toute la population. 2.1.1.3. L’expérimentation : elle consiste à étudier les relations de cause à effet entre une ou plusieurs variables indépendantes qui sont manipulées par le chercheur (exemple : les différents niveaux des prix, les types de promotions). 2.1.2. Les informations utilisées dans les entreprises : On distingue deux types d’informations utilisées dans les entreprises : les informations primaires et les informations secondaires. 2.1.2.1. Les informations primaires : L’entreprise peut collecter directement certaines données pour un besoin d’information (les études de marché, les tests de produits). 2.1.2.1. Les informations secondaires : Il s’agit d’informations qui ont été collectées et que l’entreprise peut utiliser. Ils sont de deux types : les informations internes (données comptables et financières, rapport des vendeurs) et les informations externes (information économique, banque de données). 2.1.3. Le recours à un échantillon : Il est généralement impossible de collecter les informations auprès de toute la population qui fait l’objet d’une certaine étude. On sera donc 6 amené à collecter l’information d’un échantillon. C’est à dire un sous-ensemble de la population. La constitution d’un échantillon est sensiblement différente selon le type d’étude réalisée. On distingue les études qualitatives et quantitatives. 2.1.3.1. Les études qualitatives : Leurs objectif est essentiellement exploratoire. Elles permettent de comprendre le comportement et les motivations d’explorer un secteur d’activité inconnu et d’identifier les grandes dimensions d’un problème. En général, dans ce type d’études, l’échantillon est de taille faible. 2.1.3.1. Les études quantitatives : Leurs objectif est de donner une description quantifiée de certaines caractéristiques de la population étudiée avec une précision qui sera jugée suffisante par les utilisateurs. Pour atteindre cet objectif, on constitue un échantillon représentatif de la population afin de pouvoir extrapoler les résultats de la population entière. 2.2. Les étapes d’une enquête par sondage : Les deux étapes essentielles sont la rédaction des questions et le traitement et l’analyse des données. 2.2.1. La rédaction des questions : Lorsque le recueil des données s’effectue au moyen d’un questionnaire, la rédaction consiste généralement en trois étapes : - Une première rédaction - Un pré-test du questionnaire - La rédaction définitive du questionnaire 2.2.2. Le traitement et l’analyse des données : Cette étape comprend les opérations de vérification, le codage et le traitement informatique. Les analyses statistiques effectuées sont le plus souvent des tris à plat (résultat des questions prises une à une). On peut aussi utiliser des tris croisés (croisement entre deux questions). D’une façon générale, lorsqu’on a un très grand nombre de données, on peut utiliser l’analyse en composantes principales (ACP) ou l’analyse factorielle des correspondances (AFC). 2.3. Le choix de l’échantillon : Faire un sondage c’est observer un sous-ensemble de la population avec comme objectif l’extrapolation des résultats de la population entière. Pour cela, trois étapes sont nécessaires : - Le choix de la population et des individus - Le choix de la méthode de sondage (méthode aléatoire ou méthode empirique) 2.3.1. Le choix de la population et des individus : Avant de réaliser la sélection des échantillons au moyen d’une méthode de sondage, il est indispensable de définir les individus qui sont l’objet de l’observation ainsi que la population représentant toutes les catégories d’individus. Le terme individu peut être une personne physique, un ménage ou une pharmacie. Les unités d’échantillonnage ne sont pas toujours les individus interrogés (exemple : dans le cas d’une consommation alimentaire des enfants moins de trois ans, les unités d’échantillonnage sont les enfants mais les personnes interrogées sont leurs mères). Dans la pratique, il existe plusieurs méthodes de sondage. Les plus connues sont uploads/Management/analyse-de-fonnees.pdf

  • 46
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager
  • Détails
  • Publié le Mai 23, 2022
  • Catégorie Management
  • Langue French
  • Taille du fichier 1.0037MB