Méthodes quantitatives M. Kachour 2019-2020 Table des matières 1 Séance 4 - Ill

Méthodes quantitatives M. Kachour 2019-2020 Table des matières 1 Séance 4 - Illustration 1 Introduction Le cas de deux variables quantitatives Les données sont à l'état brut Les données sont résumés dans un tableau de contingence 2 Séance 4 - Application 1 3 Séance 4 - Illustration 2 Le cas où au moins une variable est qualitative 4 Séance 4 - Application 2 Séance 4 - Illustration 1 Table des matières 1 Séance 4 - Illustration 1 Introduction Le cas de deux variables quantitatives Les données sont à l'état brut Les données sont résumés dans un tableau de contingence 2 Séance 4 - Application 1 3 Séance 4 - Illustration 2 Le cas où au moins une variable est qualitative 4 Séance 4 - Application 2 Séance 4 - Illustration 1 Introduction Objectif : On cherche à caractériser le lien, s'il existe, entre deux variables étudiées simultanément sur la même population (les individus). On distingue plusieurs cas (en fonction de la nature de ces deux variables) : Les deux variables sont quantitatives. Exemple : existe-t-il un lien entre le salaire des hommes et le salaire des femmes au sein d'un foyer ? Une variable quantitative et l'autre est qualitative. Exemple : l'acceptation du crédit est-elle associée au revenu global du foyer ? Les deux variables sont qualitatives. Exemple : existe-t-il un lien entre l'acceptation du crédit et le type de contrat de travail ? Séance 4 - Illustration 1 Introduction Remarque : Notre objectif est de rechercher la "corrélation" (relation en commun) entre les deux variables (ceci n'implique pas un lien de causalité (relation de cause à eet)). Trois indicateurs sont présentés : la covariance, le coe cient de corrélation linéaire et l'indice de Khi-deux. Le contexte et les outils du calcul de ces indicateurs dépendent de la nature et la présentation des données. Séance 4 - Illustration 1 Le cas de deux variables quantitatives Soient x et y deux variables quantitatives étudiées simultanément sur les mêmes n individus. On suppose, dans cette section, que les données sont organisées/présentées à l'état brut, i.e., en deux vecteurs/colonnes côte à côte (comme une feuille Excel avec deux colonnes). Soit xi (respectivement yi) la valeur prise/mesurée de x ( respectivement y) sur le ième individu. Séance 4 - Illustration 1 Le cas de deux variables quantitatives Représentation graphique des données : on appelle nuage de points l'ensemble des points de coordonnées (xi, yi). Le centre de gravité du nuage est alors le point (non observé) de coordonnées (¯ x, ¯ y) les moyennes respectives de x et y Remarque : Notez que le nuage de points est la première étape essentielle pour déterminer s'il existe ou non une relation entre les variables étudiées. En particulier, si l'allure du nuage ressemble à une droite, on peut imaginer qu'il existe une relation (dite linéaire) entre les deux variables. Séance 4 - Illustration 1 Le cas de deux variables quantitatives La covariance (la variance en commun) de x et y est un réel (positif, négatif ou nul) dé ni par : Cov (x, y) = Pn i=1(xi −¯ x)(yi −¯ y) n . Cette covariance peut être également calculée grâce à la formule suivante: Cov (x, y) = Pn i=1 xi × yi n −(¯ x × ¯ y) , où ¯ x = Pn i=1 xi n et ¯ y = Pn i=1 yi n La covariance est un indice du sens de variation des deux variables. Séance 4 - Illustration 1 Le cas de deux variables quantitatives Propriétés et interprétations : −Si Cov (x, y) > 0, on peut en déduire que les deux variables varient dans le même sens (l'une augmente quand l'autre augmente ou diminue quand l'autre diminue) −Si Cov (x, y) < 0, alors les deux variables varient dans le sens opposé (l'une augmente quand l'autre diminue et inversement) −Le fait d'avoir Cov (x, y) = 0 n'implique pas nécessairement l'absence de lien entre x et y . −Si x et y sont indépendantes (ne sont pas liées) alors Cov (x, y) = 0. −Si Cov (x, y) ̸= 0, alors x et y ne sont pas indépendantes (elles sont liées). Séance 4 - Illustration 1 Le cas de deux variables quantitatives Pour s'assurer de façon objective et non purement visuelle qu'une relation (linéaire) entre les deux variables est valide, on calcule le coe cient de corrélation linéaire : r(x, y) = Cov(x, y) sxsy où sx est l'écart-type de la variable x et sy celui de la variable y. En eet, r(x, y) est indice de l'intensité de la relation linéaire entre les deux variables. La valeur de r(x, y) varie entre −1 et 1. Séance 4 - Illustration 1 Le cas de deux variables quantitatives Propriétés et interprétations : Si r(x, y) = 1 ou r (x, y) = −1, alors x et y sont parfaitement corrélées et les points sont alignés sur une droite. Si r(x, y) appartient à ] −1, −0.9] ou [0.9, 1[ on dit que la relation linéaire est forte. Si r(x, y) appartient à ] −0.9, −0.7] ou [0.7, 0.9[ on dit que la relation linéaire est valide. Si r(x, y) appartient à ] −0.7, −0.5] ou [0.5, 0.7[ on dit que la relation linéaire est moyenne. Si r(x, y) = 0 (ou proche de 0) on peut constater l'absence d'une linéaire apparente (n'implique pas l'absence de relation entre x et y) Si r(x, y) ̸= 0 alors on peut dire qu'il existe un lien entre x et y. Séance 4 - Illustration 1 Le cas de deux variables quantitatives Exemple : Nous avons étudié la taille (notée x) en cm et le poids (noté y) en Kg de 100 enfants d'une école. Suite à cette étude, nous avons obtenu : 100 X i=1 xi = 11989, 100 X i=1 x2 i = 1459525, 100 X i=1 yi = 3801, 100 X i=1 y2 i = 146621, et 100 X i=1 (xi × yi) = 462387, où xi est la taille du ième participant et yi est le poids du ième participant à cette étude. Évaluer l'intensité de la relation linéaire entre les deux variables. Séance 4 - Illustration 1 Le cas de deux variables quantitatives Éléments de réponse : La taille moyenne est égale à : ¯ x = 11989 100 = 119.89 cm. Le poids moyen est égal à : ¯ y = 3801 100 = 38.01 Kg. L'écart-type associé à la taille vaut : sx = r 1459525 100 −119.892 = 14.88751. Séance 4 - Illustration 1 Le cas de deux variables quantitatives Éléments de réponse : L'écart-type associé au poids vaut : sy = r 146621 100 −38.012 = 4.631404. La covariance de x et y est égale à : Cov (x, y) = 462387 100 −(119.89 × 38.01) = 66.8511 > 0. Ceci implique que les deux variables varient dans le même sens. Le coe cient de corrélation linéaire entre la taille et le poids des enfants interrogés vaut : r (x, y) = 66.8511 14.88751 × 4.631404 = 0.9695583. Ainsi, on peut en déduire que l'intensité linéaire de la relation entre les deux variables est assez forte. Séance 4 - Illustration 1 Le cas de deux variables quantitatives Soient x et y deux caractéristiques quantitatives étudiées simultanément sur un échantillon de taille n de la population. x (respectivement y) peut être discrète ou continue. On suppose que x possède p modalités (A1, . . . , Ap) et y possède q modalités (B1, . . . , Bq) Notons qu'en fonction de la nature de la caractéristique, ces modalités sont des valeurs exactes (cas discret) ou des intervalles (cas continue) Séance 4 - Illustration 1 Le cas de deux variables quantitatives Les résultats de cette étude sont résumés dans le tableau suivant (appelé tableau de contingence). x \ y B1 B2 . . . Bj . . . Bq Total A1 n1,1 n1,2 . . . n1,j . . . n1,q n1,· A2 n2,1 n2,2 . . . n2,j . . . n2,q n2,· . . . . . . . . . . . . . . . . . . . . . . . . Ai ni,1 ni,2 . . . ni,j . . . ni,q ni,· . . . . . . . . . . . . . . . . . . . . . . . . Ap np,1 np,2 . . . np,j . . . np,q np,· Total n·,1 n·,2 . . . n·,j . . . n·,q n Séance 4 - Illustration 1 Le cas de deux variables quantitatives Notations et interprétations : ni,j représente l'eectif des participants qui ont répondu simultanément Ai à la caractéristique x et Bj à la caractéristique y. ni,· l'eectif des participants ayant répondu Ai à la caractéristique x. Les ni,· représentent la répartition (dite marginale) des eectifs associée à la caractéristique x. Grâce à cette répartition marginale, on peut calculer tous les résumés numériques associés à la caractéristique x. En particulier, nous uploads/Finance/ seance-4-env250.pdf

  • 18
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager
  • Détails
  • Publié le Jul 16, 2022
  • Catégorie Business / Finance
  • Langue French
  • Taille du fichier 0.3025MB