Introduction et motivation du cours Statistiques appliquées à la gestion Ana Ka
Introduction et motivation du cours Statistiques appliquées à la gestion Ana Karina Fermin Université Paris-Ouest-Nanterre-La Défense http://fermin.perso.math.cnrs.fr/ Motivation Données Modélisation Quelques rappels La statistique dans les formations ! Fermin Analyse statistique Ch. 0: Introduction 2 / 40 Motivation Données Modélisation Quelques rappels La statistique dans la presse ! Chef économiste de Google : Hal Varian Fermin Analyse statistique Ch. 0: Introduction 3 / 40 Motivation Données Modélisation Quelques rappels La statistique dans la presse ! Fermin Analyse statistique Ch. 0: Introduction 4 / 40 Motivation Données Modélisation Quelques rappels La statistique dans la presse ! Fermin Analyse statistique Ch. 0: Introduction 5 / 40 Motivation Données Modélisation Quelques rappels Corrélation et causalité? Synonymes? NON! Exemple : La consommation moyenne de chocolat par habitant est corrélée au nombre de lauréats du prix Nobel, d’après une étude de l’Américain Franz Messerli publiée en 2012. Fermin Analyse statistique Ch. 0: Introduction 6 / 40 Motivation Données Modélisation Quelques rappels Fermin Analyse statistique Ch. 0: Introduction 7 / 40 Motivation Données Modélisation Quelques rappels Démarche à suivre En statistique, comme dans la vraie vie, on se pose des questions, et on essaie d’y répondre. Le statisticien cherche à modéliser... 1 Visualiser les données et comprendre le problème métier. 2 Traduire le problème métier en un problème statistique. Proposer une modélisation mathématique de l’expérience générant ses données. Utiliser une méthode statistique pour proposer une réponse (régression, anova...). Utiliser des outils statistiques pour donner des garanties sur les résultats (intervalles de confiance, tests...). 3 Utiliser les résultats pour répondre au problème métier en prenant en compte l’incertitude. Fermin Analyse statistique Ch. 0: Introduction 8 / 40 Motivation Données Modélisation Quelques rappels Thèmes abordés dans ce cours Rappels (menu du jour) Test de comparaison de deux distributions (chapitre 1) Test de comparaison de moyennes Test de proportions Liaison entre deux variables (chapitre 2) Régression (chapitre 3) ANOVA (chapitre 4) Fermin Analyse statistique Ch. 0: Introduction 9 / 40 Motivation Données Modélisation Quelques rappels Données Les données proviennent d’une ou plusieurs variables qui sont mesurés simultanément sur un individu. Cet individu appartient à une population de taille généralement inconnue. On dispose d’un ensemble d’observations de taille n Exemple Population : Étudiants de L3 Eco Gestion Variable, notée X : Note de Statistiques en L2 Données : Dn = {x1, x2, . . . , xn} Fermin Analyse statistique Ch. 0: Introduction 10 / 40 Motivation Données Modélisation Quelques rappels Exemple Population : Étudiants de L3 Eco Gestion Variables : Série du baccalauréat (X1), Age (X2), Sexe (X3), Type de licence (X4), Mention en L2 licence (X5), Durée du trajet domicile-université (X6). Données : Dn = {x1, x2, . . . , xn} avec xi = (xi1, . . . , xi6) le i-ème individu (i = 1, . . . , n). Fermin Analyse statistique Ch. 0: Introduction 11 / 40 Motivation Données Modélisation Quelques rappels Les données Individu X1 ... Xj ... Xp 1 x11 ... x1j ... x1p 2 x21 ... x2j ... x2p · · · ... ... ... ... ... i xi1 ... xij ... xip · · · ... ... ... ... ... n xn1 ... xnj ... xnp Fermin Analyse statistique Ch. 0: Introduction 12 / 40 Motivation Données Modélisation Quelques rappels Les données "histoire de vie" Extrait de l’enquête histoire de vie réalisée par l’INSEE en 2003. La base des donnée, disponibles dans le logiciel R, contient 2000 individus et 20 variables. Les 20 variables observées sont : [1] "id" "age" "sexe" "nivetud" [5] "poids" "occup" "qualif" "freres.soeurs" [9] "clso" "relig" "trav.imp" "trav.satisf" [13] "hard.rock" "lecture.bd" "peche.chasse" "cuisine" [17] "bricol" "cinema" "sport" "heures.tv" Remarque : Dans ce cours on apprendra à lire les graphiques et sorties produits à l’aide du logiciel R. Fermin Analyse statistique Ch. 0: Introduction 13 / 40 Motivation Données Modélisation Quelques rappels Variables: 20 $ id (int) 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14,... $ age (int) 28, 23, 59, 34, 71, 35, 60, 47, 20, 28, 65, 47... $ sexe (fctr) Femme, Femme, Homme, Homme, Femme, Femme, Fem... $ nivetud (fctr) Enseignement superieur y compris technique su... $ poids (dbl) 2634.3982, 9738.3958, 3994.1025, 5731.6615, 43... $ occup (fctr) Exerce une profession, Etudiant, eleve, Exerc... $ qualif (fctr) Employe, NA, Technicien, Technicien, Employe,... $ freres.soeurs (int) 8, 2, 2, 1, 0, 5, 1, 5, 4, 2, 3, 4, 1, 5, 2, 3... $ clso (fctr) Oui, Oui, Non, Non, Oui, Non, Oui, Non, Oui, ... $ relig (fctr) Ni croyance ni appartenance, Ni croyance ni a... $ trav.imp (fctr) Peu important, NA, Aussi important que le res... $ trav.satisf (fctr) Insatisfaction, NA, Equilibre, Satisfaction, ... $ hard.rock (fctr) Non, Non, Non, Non, Non, Non, Non, Non, Non, ... $ lecture.bd (fctr) Non, Non, Non, Non, Non, Non, Non, Non, Non, ... $ peche.chasse (fctr) Non, Non, Non, Non, Non, Non, Oui, Oui, Non, ... $ cuisine (fctr) Oui, Non, Non, Oui, Non, Non, Oui, Oui, Non, ... $ bricol (fctr) Non, Non, Non, Oui, Non, Non, Non, Oui, Non, ... $ cinema (fctr) Non, Oui, Non, Oui, Non, Oui, Non, Non, Oui, ... $ sport (fctr) Non, Oui, Oui, Oui, Non, Oui, Non, Non, Non, ... $ heures.tv (dbl) 0.0, 1.0, 0.0, 2.0, 3.0, 2.0, 2.9, 1.0, 2.0, 2... Fermin Analyse statistique Ch. 0: Introduction 14 / 40 Motivation Données Modélisation Quelques rappels Des données à une modélisation Exemple : Packaging A ou packaging B On demande à des consommateurs s’ils préfèrent, pour un produit de grande consommation qu’on veut relooker, le packaging A ou le packaging B. Fermin Analyse statistique Ch. 0: Introduction 15 / 40 Motivation Données Modélisation Quelques rappels Des données à une modélisation Exemple : Packaging A ou packaging B On demande à des consommateurs s’ils préfèrent, pour un produit de grande consommation qu’on veut relooker, le packaging A ou le packaging B. On interroge n personnes dans un panel de consommateurs et on inscrit les résultats dans un tableau. Consommateur n◦ 1 2 3 4 5 6 . . . Résultat A A B A B B . . . Problème métier : choisir entre deux packaging. Choisir le packaging qui se vend le mieux ! Idée : se baser sur des données pour prendre la décision Fermin Analyse statistique Ch. 0: Introduction 16 / 40 Motivation Données Modélisation Quelques rappels Quel est le travail du statisticien ? Donner un modèle probabiliste Proposer une méthodologie Répondre au problème métier à partir des résultats obtenus en prenant en compte l’incertitude (on ne pas sure à 100 %, il faut prendre des risques et accepter de ne pas avoir toujours raison) Fermin Analyse statistique Ch. 0: Introduction 17 / 40 Motivation Données Modélisation Quelques rappels Codage : on code la préférence pour A par 0 et celle pour B par 1. Consommateur numéro 1 2 3 4 5 6 . . . Résultat 0 0 1 0 1 1 . . . Contexte : Population : Consommateurs Variable : réponse du consommateur, codée par une variable X qui prends de valeurs 0 ou 1. On note x1, x2, x3, . . ., les résultats successifs. Par exemple, le troisième consommateur interrogé préfère le packaging B (x3 = 1). Le mathématicien se place aux instants avant les interrogations d’un consommateur donné et considère celles-ci comme des expériences aléatoires : il note X1, X2, X3, . . . les variables aléatoires correspondantes. Fermin Analyse statistique Ch. 0: Introduction 18 / 40 Motivation Données Modélisation Quelques rappels Précision mathématique du terme échantillon Dans un étude statistique, on choisit au hasard les individus sur lesquels on va effectuer la mesure d’une variable on considère que les mesures effectuées sont les réalisations d’une variable aléatoire. Remarque : Dans le contexte d’une étude statistique, les résultats xi sont alors les réalisations des variables aléatoires Xi, on les appelle les valeurs observées ou les données. Notez bien la différence entre l’utilisation des majuscules pour les variables aléatoires et les minuscules pour leurs réalisations (les données). Fermin Analyse statistique Ch. 0: Introduction 19 / 40 Motivation Données Modélisation Quelques rappels Imaginons qu’on tire un petit nombre de consommateurs dans un grand panel. Exemple : Packaging A ou B Cons. n◦ Résultat 1 0 2 0 3 1 . . . . . . La mesure n◦1 (x1) est la réalisation d’une variable aléatoire X1, la mesure n◦2 (x2) est la réalisation d’une variable aléatoire X2, la mesure n◦3 (x3) est la réalisation d’une variable aléatoire X3 etc. Pour cet exemple, quel est la loi de chaque variable ? Fermin Analyse statistique Ch. 0: Introduction 20 / 40 Motivation Données Modélisation Quelques rappels Échantillon d’une loi Les mesures sur les individus choisis au hasard sont considérées comme étant les réalisations d’une suite X1, X2, . . ., Xn de variables aléatoires. Definition On dit qu’une suite X1, X2, . . ., Xn de variables aléatoires est un échantillon d’une variable aléatoire X si : chaque variable aléatoire Xi a la même loi que X Les variables uploads/Management/ introduction-chap0-gestion.pdf
Documents similaires










-
27
-
0
-
0
Licence et utilisation
Gratuit pour un usage personnel Attribution requise- Détails
- Publié le Aoû 21, 2022
- Catégorie Management
- Langue French
- Taille du fichier 1.3858MB