´ ECOLE NATIONALE DES PONTS ET CHAUSS´ EES Ann´ ee universitaire 2006 – 2007 CO
´ ECOLE NATIONALE DES PONTS ET CHAUSS´ EES Ann´ ee universitaire 2006 – 2007 COURS DE STATISTIQUE et ANALYSE des DONN´ EES 12 juin 2007 ii Pr´ eambule Le mot Statistique vient de l’allemand Statistik, qui d´ esigne des donn´ ees utiles ` a l’´ Etat, der Staat (dix-huiti` eme si` ecle). Ce premier sens renvoie donc ` a ce que nous appelons aujour- d’hui, au pluriel, “des statistiques”, c’est-` a-dire des donn´ ees chiffr´ ees, g´ en´ eralement de grande ampleur, avec un accent sur le fait que ces donn´ ees ne sont pas ` a transmettre brutes ` a l’utilisateur (“le prince” dans le sens initial) mais doivent ˆ etre tri´ ees, clarifi´ ees et organis´ ees en fonction d’usages bien pr´ ecis. On peut se mettre ` a parler, historiquement de “Statistique”(au singulier) en tant que science quand, dans le courant du dix-neuvi` eme si` ecle, on prend en compte le fait que ces donn´ ees sont entach´ ees d’al´ eatoire (en particulier en recourant au tirage d’´ echantillons) et que donc on mod´ elise leur recueil par l’usage des m´ ethodes math´ ematiques du calcul des probabilit´ es. Ce point de vue connaˆ ıt un grand essor dans la premi` ere moiti´ e du vingti` eme si` ecle. Dans la deuxi` eme moit´ e du vingti` eme si` ecle le progr` es des moyens de calcul permet de faire subir des traitements simplificateurs ` a des masses de donn´ ees de plus en plus grandes, et ce ´ eventuellement pr´ ealablement ` a la mise en place de mod` eles probabilistes ; c’est alors qu’´ emerge la terminologie “Analyse des donn´ ees”, qui ne doit pas ˆ etre vue comme s’op- posant ` a “Statistique” mais compl´ ementaire, les deux points de vue s’´ etant largement in- terp´ en´ etr´ es dans leur progression commune jusqu’en ce d´ ebut du vingt-et-uni` eme si` ecle. Dans tout ce cours nous d´ esignerons du vocable “statisticien” le praticien dont nous d´ ecrirons et justifierons les techniques qu’il emploie face aux donn´ ees qui lui sont fournies. iii iv PR´ EAMBULE Table des mati` eres Pr´ eambule iii A Introduction 1 I L’activit´ e du statisticien 3 I.1 Le contexte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 I.2 La d´ emarche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 I.3 Le mod` ele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 B Statistique d´ ecisionnelle 7 II Rappels sur le mod` ele param´ etrique 9 II.1 Un exemple introductif . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 II.1.1 Pr´ esentation d’un jeu de donn´ ees . . . . . . . . . . . . . . . . . . . . 9 II.1.2 Remarques sur la mod´ elisation . . . . . . . . . . . . . . . . . . . . . 9 II.1.3 Quels questionnements peut-on soulever ? . . . . . . . . . . . . . . . 11 II.2 D´ efinitions et rappels . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 II.2.1 Les mod` eles param´ etriques . . . . . . . . . . . . . . . . . . . . . . . . 12 II.2.2 Rappels sur la LFGN et le TCL . . . . . . . . . . . . . . . . . . . . . 13 II.3 Estimation ponctuelle : les estimateurs . . . . . . . . . . . . . . . . . . . . 13 II.3.1 Propri´ et´ es des estimateurs . . . . . . . . . . . . . . . . . . . . . . . . 14 II.3.2 L’estimateur du maximum de vraisemblance . . . . . . . . . . . . . . 16 II.4 R´ esum´ e des donn´ ees : les statistiques exhaustives . . . . . . . . . . . . . . 18 II.5 Pr´ ecision de l’estimation : l’intervalle de confiance . . . . . . . . . . . . . . 19 II.6 Proc´ edure de d´ ecision : les tests . . . . . . . . . . . . . . . . . . . . . . . . 23 II.7 Utiliser des donn´ ees ext´ erieures : l’approche bayesienne . . . . . . . . . . . 29 II.8 R´ esum´ e des proc´ edures de test . . . . . . . . . . . . . . . . . . . . . . . . . 31 II.8.1 Le mod` ele de Bernoulli . . . . . . . . . . . . . . . . . . . . . . . . . . 31 III Mod` ele lin´ eaire gaussien 33 III.1 G´ en´ eralit´ es . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 III.1.1 Plans d’exp´ eriences . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 III.1.2 Le mod` ele g´ en´ eral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 III.1.3 Exemples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34 v vi TABLE DES MATI` ERES III.2 Lois associ´ ees aux ´ echantillons gaussiens . . . . . . . . . . . . . . . . . . . 37 III.2.1 Th´ eor` eme de Cochran . . . . . . . . . . . . . . . . . . . . . . . . . . 37 III.2.2 Statistiques fondamentales . . . . . . . . . . . . . . . . . . . . . . . . 38 III.3 Le mod` ele gaussien . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 III.3.1 Un exemple de donn´ ees r´ eelles ` a loi gaussienne . . . . . . . . . . . . 39 III.3.2 ´ Etude du mod` ele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 III.3.3 Estimation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 III.3.4 Intervalle de confiance et tests pour la moyenne . . . . . . . . . . . . 41 III.3.5 Intervalle de confiance pour la moyenne . . . . . . . . . . . . . . . . 41 III.3.6 Intervalles de confiance et tests pour la variance . . . . . . . . . . . . 43 III.3.7 Analyse des donn´ ees r´ eelles . . . . . . . . . . . . . . . . . . . . . . . 44 III.3.8 Approche bayesienne . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 III.4 Comparaison de moyennes de deux ´ echantillons gaussiens . . . . . . . . . . 45 III.5 uploads/Ingenierie_Lourd/ enpc-stat-cours.pdf
Documents similaires
-
12
-
0
-
0
Licence et utilisation
Gratuit pour un usage personnel Attribution requise- Détails
- Publié le Aoû 27, 2021
- Catégorie Heavy Engineering/...
- Langue French
- Taille du fichier 2.8238MB