Statistiques Descriptives (Analyse bivariée ) Animé par : Pr AIT BABRAM Mohamed
Statistiques Descriptives (Analyse bivariée ) Animé par : Pr AIT BABRAM Mohamed 2008/2009 Pr. AIT BABRAM Mohamed Analyse Bivariée FSTG Marrakech Plan du chapitre I. Introduction II. Formulation de la méthode III. Cas de deux variables qualitatives IV. Cas d’une variable qualitatives et d’une variable quantitative V. Cas de deux variables quantitatives Pr. AIT BABRAM Mohamed Analyse Bivariée FSTG Marrakech Introduction Dans le processus de décision ou comme support à l’aide à la décision ou dans le cadre d’une expérimentation technologique, il arrive fréquemment que les conclusions et les recommandations soient basées sur l’existence d’une liaison d’ordre fonctionnelle ou statistiques entre deux ou plusieurs variables. Exemple: Le responsable de la mise en marché d’une entreprise, après avoir établi une relation entre les dépenses en publicité et le volume des ventes, peut effectuer une prévision du volume des ventes selon un niveau de dépenses en publicité. Dans la suite de ce chapitre, on traitera du cas où l’on dispose de deux caractères X et Y observés sur les mêmes individus. Plusieurs cas de figures sont envisageables : Variable X explicative Quantitatif Qualitatif Quantitatif - Régression simple - Corrélation simple Analyse de la variance à un facteur Qualitatif Régression logistique Test du khi-deux d'indépendance Variable Y expliquée Pr. AIT BABRAM Mohamed Analyse Bivariée FSTG Marrakech Formulation de la méthode 1. Tableau de contingence 2. Distribution marginale. 3. Distribution conditionnelle. 4. Indépendance de deux caractères. 5. Exemples Tableau de contingence Nous prélevons d’une population un échantillon aléatoire de taille n et nous observons sur chaque unité statistique de l’échantillon deux caractères X et Y qui peuvent êtres quantitatifs, qualitatifs ou encore l’un est qualitatif et l’autre est quantitatif. ¾ X présente k modalités x1, x2, …….., xk. ¾ Y présente m modalités y1, y2, …….., yk. La répartition des n observations suivant les modalités croisées des deux caractères se présente sous la forme d’un tableau à double entrée appelé aussi tableau de contingence. La structure d’un tel tableau est comme suite : Désigne l’effectif des unités de la populations étudiée qui présentent à la fois la modalité xi de X et la modalité yj de Y. Désigne l’effectif des unités de la populations étudiée qui présentent la modalité xi de X. Désigne l’effectif des unités de la populations étudiée qui présentent la modalité yj de Y. ∑ = • = k i ij j n n 1 ∑ = • = m i ij i n n 1 Pr. AIT BABRAM Mohamed Analyse Bivariée FSTG Marrakech Tableau de contingence Remarque : Un tableau de contingence peut être aussi formulé avec des fréquences relatives ou bien des pourcentages. ∑ = • = m j ij i p p 1 ∑ = • = k i ij j p p 1 100 × = ij ij f p 100 1 1 = =∑ ∑ = • = • m j j k i i p p ∑ = • = k i ij j f f 1 ∑ = • = m j ij i f f 1 n n f ij ij = 1 1 1 = =∑ ∑ = • = • m j j k i i f f Pr. AIT BABRAM Mohamed Analyse Bivariée FSTG Marrakech Pr. AIT BABRAM Mohamed Analyse Bivariée FSTG Marrakech Tableau de contingence Exemple 1 : les caractères X et Y (Qualitatifs) A fin d’étudier le comportement des clients d’un magasin vis-à-vis des produits Haut Gamme et le e-commerce, on leurs a posé les questions suivantes : ¾ Est-ce que vous achetez les produits Haut Gamme ? Vrai □ Faux □ ¾ Est-ce que vous achetez vos produits via Internet ? Vrai □ Faux □ Les réponses collectées auprès des clients nous ont donné le tableau suivant : 126 214 clients achètent des produits Haut Gamme via Internet. 359 859 clients n’achètent pas de produits Haut Gamme. 207 334 clients n’achètent leurs produits via Internet. 33,1 % des clients achètent des produits Haut Gamme. 28,7 % des clients n’achètent pas des produits Haut Gamme et n’utilisent pas l’Internet pour faire leurs achats. 61,6 % des clients achètent leurs produits via Internet. Pr. AIT BABRAM Mohamed Analyse Bivariée FSTG Marrakech Tableau de contingence Exemple 2 : le caractères X (Qualitatifs) et le caractère Y (Quantitatif) Le responsable des ressources humaines de l’entreprise GISCOM à effectué un sondage auprès de 200 employés, choisis au hasard à partir du fichier de l’entreprise, pour connaître leur niveau de satisfaction vis-à-vis de leurs travail. Ce caractère X a été reparti selon trois modalités : élevé, moyen, faible. On a également noté la catégorie salariale Y à laquelle appartenait l’employé soit : 2 000 dhs et moins; plus de 2 000 dhs mais moins de 3 000 dhs; 3 000 dhs et plus. A partir des résultats de cette enquête, on a construit le tableau de contingence suivant : Catégorie salariale (Y) Y < 2000 2000≤Y<3000 3 000≤Y Élevé 13 19 25 57 Moyen 28 29 28 85 Faible 24 18 16 58 Total des colonnes 65 66 69 200 Niveau de satisfaction (X) Total des lignes Pr. AIT BABRAM Mohamed Analyse Bivariée FSTG Marrakech Tableau de contingence Exemple 3 : Les caractères X et Y (Quantitatifs) La distribution des ouvriers des usines d’un groupe financier selon l’âge et la rémunération mensuelle est donnée par le tableau de contingence suivant : Age (Y) Y<25 25-30 30-35 35-40 40-45 45-50 50-55 Y≥55 X<8 207 121 38 17 10 2 7 3 405 8-9 302 461 513 103 86 6 10 2 1 483 9-10 18 526 682 567 613 431 105 60 3 002 10-12 0 111 342 298 416 480 226 37 1 910 12-15 0 1 3 182 227 263 98 18 792 15-20 0 0 0 18 22 13 12 5 70 X≥20 0 0 0 1 14 6 7 5 33 Totaux 527 1 220 1 578 1 186 1 388 1 201 465 130 7 695 Rémunération mensuelle (X) (100 dh) Totaux Pr. AIT BABRAM Mohamed Analyse Bivariée FSTG Marrakech Distributions marginales Définition : On appelle distribution marginale de X (resp. de Y) la distribution effectif fréquence du caractère X (resp. Y) sur l’échantillon étudié indépendamment de Y (resp. X). Remarque : On note que la lecture de la distribution marginale de X (resp. de Y) se fait au niveau de la dernière ligne (resp. la dernière colonne) du tableau de contingence associé à la distribution du couple (X,Y) : Distribution marginale de X Distribution marginale de Y Distributions conditionnelles Définition : On appelle distribution conditionnelle de X sachant que Y=yj (resp. de Y sachant que X=xi) la distribution statistique des valeurs de X (resp. Y) obtenue en se limitant aux individus pour lesquels Y=yj (resp. X=xi). Notation : la distribution conditionnelle de X sachant que Y=yj (resp. de Y sachant que X=xi) est notée par [X/Y=yj] ou bien Xj (resp. [Y/X=xi] ou bien Yi). Remarque : La lecture de la distribution conditionnelle [X/Y=yj] (resp. de [Y/X=xi]) se fait au niveau de la j ème colonne (resp. la i ème ligne) du tableau de contingence. Distribution conditionnelle de X sachant que Y=yj Distribution conditionnelle de Y sachant que X=xi Pr. AIT BABRAM Mohamed Analyse Bivariée FSTG Marrakech Indépendance de deux caractères Définition : On dit que deux caractères X et Y sont indépendant si et seulement si l’une des assertions suivantes est vérifiée: 1) Les distributions en effectifs de [X/Y=yj ] pour j Є {1,…,m} sont proportionnelles. 2) Les distributions en fréquences de [X/Y=yj ] pour j Є {1,…,m} sont les mêmes. 3) Les distributions en effectifs de [Y/X=xi] pour i Є {1,…,k} sont proportionnelles. 4) Les distributions en fréquences de [Y/X=xi] pour i Є {1,…,k} sont les mêmes. Remarque : En pratique, les conditions de la définition précédente ne sont presque jamais vérifiées. Il faut alors vérifier que les lignes ou bien les colonnes du tableau de contingence sont presque proportionnelles. Remarque : D’après la définition précédente, l’hypothèse d’indépendance de X et Y peut être résumé par la relation mathématique suivante : ( )( ) { } { } m j et k i pour n n n n j i ij ,...., 1 ,...., 1 ∈ ∈ = • • X ( )( ) 36 120 60 72 2 3 32 = × = = • • n n n n Pr. AIT BABRAM Mohamed Analyse Bivariée FSTG Marrakech Pr. AIT BABRAM Mohamed Analyse Bivariée FSTG Marrakech Cas où X et Y (qualitatifs) 1. Exemple 2. Distribution marginale 3. Distribution conditionnelle Exemple 1 : On considère l’étude effectuée auprès des clients d’un magasin pour voir leur comportement vis-à-vis des produits Haut Gamme X et le e- commerce Y. Cas de deux caractères qualitatifs Distribution [Y/X=Vrai] Distribution [Y/X=Faux] Distribution [X/Y=Vrai] Distribution [X/Y=Faux] Distribution marginale de X Distribution marginale de Y Pr. AIT BABRAM Mohamed Analyse Bivariée FSTG Marrakech Pr. AIT BABRAM Mohamed Analyse Bivariée FSTG Marrakech Cas où X (qualitatif) et Y (quantitatif) 1. Moyenne et Variance marginale de Y 2. Moyenne et Variance conditionnelles de Y 3. uploads/Management/ bivariee.pdf
Documents similaires
-
20
-
0
-
0
Licence et utilisation
Gratuit pour un usage personnel Attribution requise- Détails
- Publié le Aoû 01, 2022
- Catégorie Management
- Langue French
- Taille du fichier 0.4716MB