Cours de Statistiques Focus sur le Chapitre 1: Rappels Licence 3 – Parcours Ges

Cours de Statistiques Focus sur le Chapitre 1: Rappels Licence 3 – Parcours Gestion et Finance S. Robin L3 Gestion et Finance Stéphane ROBIN Université Paris 1 Panthéon-Sorbonne Département de Gestion – EM Sorbonne Licence 3 – Parcours Gestion et Finance Contenu du Chapitre 1 1. Vocabulaire fondamental 2. Types de variables statistiques 3. Paramètres de position et de forme 4. Mesures d’association (covariance et corrélation) S. Robin L3 Gestion et Finance 4. Mesures d’association (covariance et corrélation) 5. Introduction à l’inférence statistique et rappels sur les probabilités 1. Vocabulaire statistique fondamental VARIABLE STATISTIQUE (VS) ou CARACTERE Application qui à chaque individu de la population associe Outre les concepts fondamentaux de population et d'échantillon déjà rencontrés dans l'introduction, la statistique utilise la terminologie suivante: S. Robin L3 Gestion et Finance Application qui à chaque individu de la population associe une valeur. MODALITES Ce sont les différentes valeurs que peut prendre une variable statistique. Vocabulaire statistique fondamental TAILLE ou EFFECTIF TOTAL Nombre d’individus de la population ou de l'échantillon EFFECTIF D’UNE MODALITE Nombre d’individus qui présentent cette modalité particulière S. Robin L3 Gestion et Finance Nombre d’individus qui présentent cette modalité particulière d’une VS. FREQUENCE D’UNE MODALITE (souvent notée fi) Effectif de cette modalité divisé par l’effectif total. C’est la proportion d’individus qui présentent cette modalité. Vocabulaire statistique fondamental DEFINITION OPERATIONNELLE Les modalités d’une variable n’ont de sens que si la variable a une définition opérationnelle, c’est-à-dire une signification claire et acceptée universellement. S. Robin L3 Gestion et Finance Dans le cadre d'un problème ou d'une étude statistique, il importe donc de toujours bien préciser la nature de chacune des variables rencontrées. 2. Types de VS (ou caractères) Le type d’une VS est défini à partir de ses modalités Une VS est quantitative si ses modalités représentent des quantités (souvent exprimées en unités de mesure, comme le gramme, le mètre ou l’euro). S. Robin M2 GGRC - Statistiques Elle est qualitative si ses modalités peuvent seulement être classées dans des catégories. Exemples: “oui” et “non” “souvent”, “parfois” et “jamais” Types de Variables Données Quantitatives Qualitatives S. Robin L3 Gestion et Finance Continues Discrètes Ordinales Nominales Caract. mesurées :  Poids  Voltage Objets comptés :  Nombre d’enfants  Nombre de défauts/heure Catégories définies:  Statut marital  Situation prof.  Couleur des yeux Catég. ordonnées:  Degré de satisfaction  Niv. hiérarchique Echelle des variables qualitatives Pour les variables qualitatives, il existe deux niveaux (ou échelles) de mesure : 1. L’échelle ordinale S. Robin L3 Gestion et Finance 1. L’échelle ordinale 2. L’échelle nominale Attention à leur utilisation ! Echelle ordinale Une échelle ordinale classe les données dans des catégories distinctes pour lesquelles un ordre existe. Variables qualitatives Catégories ordonnées S. Robin L3 Gestion et Finance Classe d’âge Junior / Moyen / Senior Satisfaction produit Insatisfait / Neutre / Satisfait Notes élèves du primaire A / B / C / D / E Echelle nominale Une échelle nominale classe les données dans des catégories distinctes entre lesquelles aucun ordre n’est sous- entendu. Variables qualitatives Catégories S. Robin L3 Gestion et Finance Possède un PC Oui / Non Type d’actions détenues Croissance / Autres Fournisseur d’accès Internet Orange / SFR / Free 3. Paramètres de position et de forme Ce sont des indicateurs statistiques qui nous renseignent sur la distribution des données (certains correspondent aux moments de la distribution): La tendance centrale ou position indique autour de quelle valeur les données sont groupées. S. Robin L3 Gestion et Finance La dispersion mesure la variation des données autour de la valeur centrale L’allure de la distribution informe sur l’étendue de ses valeurs, de la plus petite à la plus grande. 3.1. Les indicateurs de position Moyenne arithmétique Médiane Mode S. Robin L3 Gestion et Finance Mode Quantiles Moyenne géométrique (utile en finance) La moyenne arithmétique La moyenne arithmétique est la mesure la plus commune de tendance centrale (au point que le langage courant la désigne simplement comme "la moyenne"). Moyenne arithmétique = somme des valeurs divisée par nombre de valeurs S. Robin L3 Gestion et Finance nombre de valeurs La moyenne arithmétique est donc sensible aux minimum et maximum de la distribution Elle peut donc être affectée par les valeurs extrêmes ("points aberrants"), auxquelles on doit prêter attention quand on la calcule. Formule de la moyenne arithmétique Notée m (ou µ) dans la population et "X barre" dans un échantillon, la moyenne arithmétique se calcule de la même manière dans les deux cas. Dans une population de taille N: ∑ = + + = = N i N i N X X X N m 1 1 ... 1 S. Robin M2 GGRC - Statistiques Et dans un échantillon de taille n: Dans les deux cas, Xi désigne la ième valeur de la VS X = i N N 1 ∑ = + + = = n i n i n X X X n X 1 1 ... 1 Moyenne et valeurs extrêmes: exemple i 1 2 3 4 5 X 3.0 4.5 5.2 3.0 4.0 Avec l'échantillon ci-dessous, on trouve "X barre" = 3.94: Avec cet autre échantillon, tiré de la même population, on trouve "X barre" = 5.14: S. Robin M2 GGRC - Statistiques i 1 2 3 4 5 X 3.0 4.5 5.2 3.0 10.0 "X barre" = 5.14: Si l'on supprime la dernière observation (i=5), car on considère sa valeur comme aberrante, on trouve une moyenne proche de celle obtenue de le premier échantillon: "X barre" = 3.925. La médiane La médiane est une autre mesure de tendance centrale, qui n'est pas affectée par les valeurs extrêmes La médiane est la valeur centrale d'une série ordonnée (50% des valeurs sont au-dessus et 50% au-dessous) S. Robin M2 GGRC - Statistiques des valeurs sont au-dessus et 50% au-dessous) La médiane d'une série ordonnée de 1 à n se situe au niveau de la "(n+1)/2"ème valeur Calcul de la médiane Si le nombre de valeurs est impair, la médiane est la valeur au milieu de la série. Si le nombre de valeurs est pair, la médiane est la moyenne des deux valeurs au milieu de la série. S. Robin M2 GGRC - Statistiques des deux valeurs au milieu de la série. Attention, (n+1)/2 n’est pas la valeur de la médiane, il s’agit de la position de la médiane dans la série ordonnée. Médiane et valeurs extrêmes: exemple Position de la médiane: (5+1)/2=3; Médiane = 4 i 1 2 3 4 5 X 2.0 2.5 4.0 4.5 5.0 Soit un premier échantillon: S. Robin M2 GGRC - Statistiques Position de la médiane: (5+1)/2=3; Médiane = 4 Soit un second échantillon tiré de la même population : i 1 2 3 4 5 X 2.0 2.5 4.0 6.0 7.0 Le mode (1) Le mode d'une série de données est la valeur la plus fréquente dans cette série. Le mode n'est pas affecté par les valeurs extrêmes S. Robin M2 GGRC - Statistiques Le mode peut être utilisé pour les variables quantitatives et qualitatives Il est possible qu'une série ne comporte pas de mode Le mode (2) Il est possible qu'une série comporte plusieurs modes. On parle alors de série plurimodale (par opposition à une série unimodale, qui ne comporte qu'un seul mode). Pour des données groupées dans des classes, on parle de classe modale (classe la plus fréquente) S. Robin M2 GGRC - Statistiques classe modale (classe la plus fréquente) Dans ce cas, la détermination du mode comporte une part d'arbitraire, liée au choix des classes. Le mode: exemple de calcul Soit la série suivante, qui comporte 13 observations : Identifions ses modalités et l'effectif de chacune d'elles : X 1 9 3 7 5 10 5 12 9 13 12 14 9 S. Robin M2 GGRC - Statistiques Le mode est la modalité (valeur) la plus fréquente, soit ici 9 Modalité 1 3 5 7 9 10 12 13 14 Effectif 1 1 2 1 3 1 2 1 1 Le mode: autres exemples Exemple de série ne comportant pas de mode : Exemple de série multimodale: Modalité 2 3 5 7 10 12 Effectif 1 1 1 1 1 1 S. Robin M2 GGRC - Statistiques Exemple de série multimodale: Modalité 1 3 5 7 9 10 12 13 14 Effectif 1 1 3 1 3 1 3 1 1 Autres indicateurs de position: les quartiles Les quartiles séparent une série ordonnée en 4 segments de taille égale (c-à-d. contenant le même nombre de valeurs). Il y a 3 quartiles notés Q1, Q2 et Q3, du plus faible au plus élevé : S. Robin M2 GGRC - Statistiques La taille de chacun des 4 segments représente ¼ (soit 25%) de la taille de la série. Les trois quartiles  Le premier quartile, Q1, est la valeur qui divise l'échantillon selon les proportions ¼ et ¾ : 25% des observations sont inférieures à Q1, et 75% lui sont supérieures.  Le second quartile, Q2, est la valeur qui divise l'échantillon en deux parties égales : 50% des observations sont inférieures uploads/Finance/ chap-1.pdf

  • 37
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager
  • Détails
  • Publié le Jui 19, 2021
  • Catégorie Business / Finance
  • Langue French
  • Taille du fichier 0.2246MB