Cours de statistiques d’IUT Jean-Michel BERNABOTTO 1 Chapitre 1 LES STATISTIQUE

Cours de statistiques d’IUT Jean-Michel BERNABOTTO 1 Chapitre 1 LES STATISTIQUES DESCRIPTIVES A. Statistiques a une variable 1. Vocabulaire de la statistique Un ensemble d’objets ou de personnes d’une étude statistique est appelé population. Un élément de cette population est appelé individu. L’étude statistique porte sur un caractère. Si le caractère est quantitatif, les mesures sont alors les valeurs d’une variable statistique (ex : un âge, une taille...). Si le caractère est qualitatif, on est obligé de le quantifier (ex : sexe...). La variable est dite discrète si elle ne prend que des valeurs isolées (ex : entières). Elle est continue si elle peut prendre toutes la valeurs d’un intervalle (ex : R). L’effectif d’une population est le nombre d’individus total de cette population. La fréquence d’un caractère est le nombre d’individus possédant ce caractère divisé par l’effectif total de la population. 2. Les variables discrètes a) Représentation On représente les variables aléatoires discrètes sous forme d’histogramme ou de camembert grâce aux différentes fréquences b) Caractéristiques (1) La moyenne Soit n valeurs distinctes ou non de la variable. Si cette variable prend p valeurs distinctes (p=n), x1,…,x p , d’effectifs respectifs n 1,…n p alors la moyenne est donnée par : p i i i=1 1 x= n x n∑ (2) Propriété si pour tout i, on peut opérer un changement de variable affine du type : xi = aXi + b alors x = aX + b. (3) La variance Elle est donnée par la formule : : V= 1 n ni(xi −x )2 i=1 p ∑ . (4) L’écart-type Il est donné par la formule : σ = V Cours de statistiques d’IUT Jean-Michel BERNABOTTO 2 (5) Propriétés La formule suivante est plus pratique pour le calcul de V :V= 1 n n ixi 2 i= 1 p ∑ −x 2 De plus si pour tout i, x i = aXi + b alors Vx = a2VX et σx = aσX. 3. Les variables continues a) Représentation Pour leur représentation, on regroupe en général dans des classes adjacentes d’amplitudes pas forcément égales. Ceci est représenté dans le tableau ci-dessous : classes [X0 ; X 1[ [X1 ; X 2 [ ………………… [X p-1 ; X p] centre des classes x1 x 2 xp effectifs n1 n 2 np fréquences n 1/n n2/n np/n La représentation s’effectue alors grâce à un histogramme dont les rectangles sont de largeur l’amplitude de la classe et dont l’aire est proportionnelle à l’effectif. b) Caractéristiques Pour calculer moyenne et écart-type, on prend les formules connues avec les xi centres des classes c’est à dire xi = Xi−1 + Xi 2 B. Statistiques a deux variables 1. Tableau de données. Nuage de points. On observe que dans certains cas, il semble exister un lien entre 2 caractères d’une population (ex : entre poids et taille, entre l’épaisseur d’un mur et sa résistance thermique...). On définit alors une série statistique à 2 variables x et y, prenant des valeurs x1,…,xn et y1,…,yn. a) Tableau de données. Le nom est explicite. On représente les différentes valeurs de x et y dans un tableau à deux entrées. x en mm 2 4 6 8 10 12 15 20 y en m 2.°C 0,83 1,34 1,63 2,29 2,44 2,93 4,06 4,48 b) Nuage de points Le plan P étant muni d’un repère orthogonal, on peut associer au couple (x i ; yi) de la série statistique double, le point Mi de coordonnées x i et y i. L’ensemble des points M i obtenus constitue le nuage de points représentant la série statistique. Cours de statistiques d’IUT Jean-Michel BERNABOTTO 3 Résistance thermique d'un mur en fonction de son épaisseur 0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5 0 5 10 15 20 25 Série1 c) Point moyen On appelle point moyen d’un nuage de n points M i de coordonnées (x i ; yi), le point G de coordonnées xG = x = 1 n xi i= 1 n ∑ y G = y = 1 n y i i=1 n ∑ . C. Ajustement affine 1. Méthode graphique a) Ajustement à la règle On trace au jugé une droite D passant par plus près possible des points du nuage de points, en s’efforçant d’équilibrer le nombre de points situés au dessus et au dessous de la droite D. L’équation de D est alors de la forme y = ax + b. Pour retrouver cette équation, il suffit alors de connaître 2 points de D. b) Ajustement affine par la méthode de Mayer On partage le nuage de points en deux nuages de points de nombres équivalents. On calcule alors le point moyen de chaque nuage qu’on appelle G1 et G 2. La droite (G1G 2) est la droite de Mayer. Elle passe de plus par le point G. C’est une bonne approximation, si le nuage de points est allongé. Ex : 2≤xi ≤8 et 10 ≤xi ≤20 alors on obtient y = 0,21x + 0,47. Cours de statistiques d’IUT Jean-Michel BERNABOTTO 4 2. Ajustement affine par la méthode des moindres carrés a) La droite de régression Soit D une droite d’ajustement. Soit Mi(xi ; yi) un point du nuage. Pi est le point de même abscisse x i que M i situé sur la droite D d’équation y = ax + b. Qi est le point de même ordonnée y i que M i situé sur la droite D’ d’équation x = a’x + b’. On appelle droite de régression de y en x, la droite D tell que : MiP i 2 i=1 n ∑ = y i −(axi + b) [ ] 2 i=1 n ∑ soit minimale. On appelle droite de régression de x en y, la droite D’ telle que : MiQi 2 i=1 n ∑ = xi −(a'y i + b') [ ] 2 i=1 n ∑ soit minimale. b) Covariance d’une série statistique double C’est le nombre cov(x,y) = σxy = 1 n (xi −x )(y i −y ) i=1 n ∑ . Pratiquement on utilise plutôt la formule : σxy = 1 n xiy i i=1 n ∑ −x .y c) Equations des droites de régression On montre que la droite de régression D de y en x a pour équation y = ax + b avec a = σ xy σ x 2 et b vérifiant b= y −ax . De même on montre que la droite de régression D’ de x en y a pour équation x = a’y + b’ avec a'= σxy σy 2 et b' vérifiant b'= x −a'y . Les droites D et D’ passent toutes les deux par le point moyen G. 3. Coefficient de corrélation a) Définition Le coefficient de corrélation d’une série statistique double est le nombre r défini par r = σxy σxσy b) Propriétés r, a, b, σxy, a’ et b’ sont tous de même signe. -1 = r = 1 Cours de statistiques d’IUT Jean-Michel BERNABOTTO 5 c) Interprétation graphique si r2 = 1 alors aa’ = 1. Les droites D et D’ sont alors confondues ; on dit que l’ajustement affine est parfait. si 0,7 = | r | <1 alors les deux droites D et D’ sont proches l’une de l’autre (en fait l’angle entre les deux est inférieur à 45°) ; on dit que l’ajustement affine est justifié. si | r | <0,7 alors l’angle entre les deux droites est supérieur à 45°. L’ajustement affine ne se justifie pas. Cours de statistiques d’IUT Jean-Michel BERNABOTTO 6 D. TD STATISTIQUES A UNE ET DEUX VARIABLES Ex 1 : un tour automatique produit des axes cylindriques. Les diamètres en (1/10 de mm), mesurés sur un lot de 1000 pièces ont donné les résultats suivants : classes [244;246[ [246;248[ [248;249[ [249;250[ [250;251[ [251;252[ [252;254[ [254;258] effectifs 11 132 152 200 194 158 139 14 1) Tracer un histogramme du caractère X (diamètre mesurée). 2) Donner des valeurs approchées de la moyenne et de l’écart type du caractère X. Ex 2 : on donne le tableau d’observations suivant : t 11,9 14,5 15,5 17,3 17,4 17,7 19 19,2 19,6 22,9 23,3 25 27,2 27,3 25,3 x 11,1 14,2 15,1 17,9 17,1 17,1 18,3 19,2 19,7 23 22,8 25,3 26,3 27,5 23,9 Ajuster linéairement x en t et déterminer le coefficient de corrélation linéaire. Ex 3 : on donne le tableau d’observations suivants : t 0,5 2 4,2 1,25 4 3 2,7 0,7 x 5 10 50 7,5 47 24 18,3 4 Ajuster x en t selon la loi x = bat. Ex 4 : on donne le tableau d’observations suivant : t 1 0,1 3 4,2 1,8 2,5 x 5 0,08 45 85 12 35 Ajuster x en t selon la loi x=bta. Ex 5 : on donne le tableau d’observations suivant : t 10 20 30 40 50 60 x 0,3 0,5 1 1,4 2 2,5 Ajuster x selon la loi x = asin2t + b. Cours de statistiques d’IUT Jean-Michel BERNABOTTO 7 Chapitre 2 PROBABILITES uploads/S4/ cours-de-statistiques-descriptives.pdf

  • 28
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager
  • Détails
  • Publié le Jui 17, 2022
  • Catégorie Law / Droit
  • Langue French
  • Taille du fichier 0.1665MB