CTU Master AGPS De la donnée à la connaissance : traitement, analyse et transmi
CTU Master AGPS De la donnée à la connaissance : traitement, analyse et transmission Élément 424b Introduction à la statistique descriptive Prof. Marie-Hélène de Sède-Marceau Année 2010/2011 Statistique 1 Introduction à la statistique descriptive Plan Introduction : Objectifs du cours Court descriptif des objectifs et prétentions du cours et de son organisation Chapitre 1 : Définitions, terminologie et notation Qu’est-ce que la statistique ? Quelques définitions Terminologie et notation standard. Exercices. Chapitre 2 : Données et organisation des données : types de données et tableaux statistiques Données qualitatives et données quantitatives, notion de classes, tableaux unidimensionnel, tableaux croisés à 2 dimensions, tableaux à n dimensions. Exercices. Chapitre 3 : Modes de représentation des données : diagrammes et graphiques Types de données et de tableaux et modes de représentation possibles, échelles graphiques, diagrammes, graphiques. Exercices. Chapitre 4 : Caractériser une distribution et résumer des tableaux statistiques à l’aide de paramètres appropriés : tendance centrale et dispersion Paramètres de tendance centrale (mode, moyenne, médiane, quantiles, etc.), paramètres de dispersion (variance, écart-type, coefficient de variation, standardisation, etc.). Exercices. Chapitre 5 : Série Chronologique : progression et indices Indices temporels et synthétiques, indice de Laspeyres, taux de croissance simple et successifs, etc. Exercices. Chapitre 6 : Tendances et corrélations : relations entre deux variables, interpolation et extrapolation Identifier et matérialiser une tendance par la méthode des moindres carrées, caractériser une relation entre deux variables (coefficient de corrélation), formuler une relation statistique entre deux variables (régression) en vue de l’interpolation ou de l’extrapolation. Exercices. Annexes Annexe 1 : Précision et explication sur une notation spécifique en statistique : somme et produit Annexe 2 : Liste (non exhaustives) des fonctions Excel utiles en statistiques descriptive Annexe 3 : Activer la macro « histogramme » dans Excel Annexe 4 : Tableau croisé dynamique dans Excel : utilisation et compléments 2 Statistique 1 Introduction à la statistique descriptive Introduction - Objectifs du cours Ce cours est destiné en priorité à un public n’ayant aucune formation en statistique et cependant confronté de façon récurrente à la manipulation et à l’analyse de séries de données. Aucun pré-requis en mathématique n’est exigé si ce n’est la connaissance des opérations mathématiques de base. Volonté, curiosité et ténacité permettront de maîtriser sans encombre les notions abordées qui, malgré leur complexité apparente, demeurent relativement simples. Cette formation se présente davantage comme une initiation à la rigueur que nécessite la manipulation d’ensembles de données afin d’utiliser à bon escient les méthodes appropriées pour éviter de faire parler faussement les chiffres. Les concepts et méthodes statistiques seront abordées au travers de nombreux exemples que viendront ponctués des exercices à réaliser dans le logiciel Excel dont la maîtrise de base est supposée acquise. Lorsque nécessaire, un point rouge l signalera la référence d'un exercice à réaliser. Au final, il s’agira de se familiariser avec et de maîtriser la méthode statistique en général en vue de décrire, de résumer et d’analyser une population ou un ensemble de données. Chapitre 1 1. Définitions, terminologie et notation 1.1 Qu’est-ce-que la statistique ? Il n'existe pas de définition universelle et totalement aboutie de la statistique. Celles présentées ci-après donnent un aperçu des différentes facettes que peut revêtir le terme « statistique » en tant que science. La statistique c’est la science des grands nombres regroupant l'ensemble de méthodes mathématiques qui, à partir du recueil et de l'analyse de données réelles, permettent l'élaboration de modèles probabilistes autorisant les prévisions. (Larousse). On perçoit dans cette première définitions plusieurs termes et notions fondamentales propres à la statistique : le recueil sous-entend la collecte qui elle-même suppose dans bien des cas la réalisation d'une enquête ou d'un sondage. Enquête et sondage impose l'échantillonnage en vue de l'inférence1 . L'analyse des données suppose la manipulation de tableaux ou grands ensembles de données qu'il s'agira de décrire et de résumer tout en accompagnant cette opération de représentations graphiques et cartographiques. La notion de modèles probabilistes sous-entend une certaine maîtrise de l'incertitude dans le but de réaliser des prévisions ou de pratiquer l'inférence. Autre définition, moins académique celle-ci : la statistique est un ensemble de méthodes permettant de prendre une bonne décision face à l’incertitude (Wallis & Roberts, The Nature of Statistics) C’est aussi un ensemble d’outils et de méthodes qui permettent de synthétiser et de résumer des grands volumes de données, des grandes matrices d’informations. On voit se dessiner ici les deux principales branches de la statistique : • La statistique descriptive • La statistique mathématique ou inférentielle 1 Inférence: Opération intellectuelle par laquelle on passe d'une vérité à une autre vérité, jugée telle en raison de son lien avec la première. La déduction est une inférence. Règles d'inférence, celles qui permettent, dans une théorie déductive, de conclure à la vérité d'une proposition à partir d'une ou de plusieurs propositions, prises comme hypothèses. En statistique, l'inférence est une opération qui permet de généraliser à une population mère les propriétés et conclusions observées à partie d'un échantillon représentatif de cette population mère 4 1.2 La statistique descriptive : Ensemble des méthodes permettant de décrire une population par le biais des individus qui la composent. La statistique descriptive s’intéresse donc à décrire et caractériser un ensemble d’individus représenté la plupart du temps sous la forme de tableaux (tableaux de données), à résumer et synthétiser ces tableaux par l’intermédiaire de graphiques et de paramètres appropriés (fréquences, distribution, moyenne, dispersion, etc.). Elle s’attachera à éventuellement rechercher des corrélations (liaisons statistiques) entre les éléments de ces tableaux (variables et individus). Exemple : Les températures moyennes mensuelles à Strasbourg sur la période 1971-2000 Températures moyennes mensuelles (°C) Jan. Fév. Mars Avr. Mai Juin Juil. Août Sept. Oct. Nov. Déc. Normales 1,6 2,8 6,7 9,7 14,3 17,3 19,5 19,3 15,5 10,6 5,3 2,8 Maximales 4,2 6,2 11,1 14,9 19,6 22,4 25,1 25,0 20,7 14,6 8,3 5,3 Minimales -1,0 -0,7 2,2 4,6 9,0 12,1 13,9 13,6 10,3 6,6 2,3 0,3 x max Moyenne annuelle maximale = 14,8 °C x norm Moyenne annuelle normales = 10,5 °C x min Moyenne annuelle minimales = 6,1 °C Le « simple » passage d'un tableau de données plus ou moins important à un graphique et/ou à quelques indicateurs pertinents telle que la moyenne constituent une opération relevant de la statistique descriptive. 1.3 La statistique mathématique ou inférentielle : Cette branche des statistiques s’intéresse davantage à extrapoler des résultats issus d’échantillons en vue de caractériser une population mère inconnue, de faire des prévisions de comportements basées sur le calcul de probabilités. 5 Exemple : En période électorale, on interroge 1 000 personnes sur leur intention de vote. A partir des résultats obtenus sur cet échantillon, on prévoit, avec une certaine précision, le comportement de l’ensemble des électeurs (population mère) et par là même, le résultat des élections. C’est ce qu’on appel l’inférence statistique et c’est le principe même du sondage d’opinion par exemple. Le lien de complémentarité entre statistique inférentielle et statistique descriptive est évident : la première collecte et fournit à la seconde la « matière première » à décrire et à et analyser qui, retournée à la première est extrapolée. Le présent cours sera consacré à la statistique descriptive. Mais avant de commencer, il convient de se familiariser avec le vocabulaire et la notation universelle de la statistique. 6 1.4 Terminologie et notation standard de la statistique Terminologie et concepts fondamentaux Population : ensemble des individus (ou unités statistiques) présentant un caractère commun. Pour une thématique donnée, la population regroupe toujours la totalité des individus relatif à cette thématique (notion d'exhaustivité). Exemples : • la population européenne : ensemble des individus résidant sur le territoire européen à un moment donné. • Le parc automobile français: ensemble des automobiles immatriculées sur le territoire français. • Le parc de logements de Toulouse : ensemble des logements de la ville de Toulouse. • Le lot 9 718 du médicament « alpha » : ensemble boîtes de « alpha » produit sous le n°. de lot 9 718. • Le cheptel bovin de l'exploitation Martin : ensemble des bovins femelles et mâles rattachés à l'exploitation agricole Martin. La population est en général notée P L'effectif total d'une population est noté N Unité statistique (ou individu) : élément de base constitutif de la population à laquelle il appartient. Il est indivisible et peut être un animal, un végétal, un humain ou un objet. Exemples : une automobile, un logement, une vache, une ampoule, une ville, etc. noté i Échantillon : sous-ensemble construit et représentatif d'une population donnée. Lorsque l'on parle d'échantillon on parle en général de population mère, c'est-à-dire de la population dont est issu l'échantillon. L'échantillon est fréquemment noté s Dénombrement : comptage exhaustif des individus composant une population donnée. Le recensement de la population est un dénombrement. Caractère(s) : caractéristique(s) de l'individu intégrant la population étudiée. Exemple : la couleur, le sexe, le poids, la taille, la marque, le modèle, l'espèce, le prix, la surface, etc. Variable : une variable est une caractéristique pouvant prendre plusieurs des valeurs d'un ensemble d'observations possibles auquel une mesure ou une qualité peut être uploads/Management/ statistiques 2 .pdf
Documents similaires
-
18
-
0
-
0
Licence et utilisation
Gratuit pour un usage personnel Attribution requise- Détails
- Publié le Fev 10, 2022
- Catégorie Management
- Langue French
- Taille du fichier 2.3493MB