Sommaire
Introduction
Variance et écart-type
Représentation graphique
Exercices
Si tu es sur cette page c’est que tu as sûrement dû déjà regardé la première partie de ce cours sur les statistiques.
Si ce n’est pas le cas, il est trèèèèèès fortement recommandé (c’est-à-dire obligatoire ) d’aller voir la première partie du cours sur les statistiques, sinon tu risques de ne pas comprendre grand chose à ce qui suit…
Dans cette deuxième partie, nous allons voir la variance et l’écart-type (qui sont un peu plus long à calculer que la moyenne), et l’aspect graphique des statistiques, avec les différents types de représentation graphique et leur utilisation.
Après avoir calculé la moyenne, médiane et les quartiles, il y a une dernière chose que l’on peut calculer dans une série statistique : la variance et l’écart-type. En fait on va voir que quand on connaît l’un, on connaît l’autre très facilement.
Tout d’abord, la variance est notée V (normal), tandis que l’écart-type est noté σ (moins normal )
σ se prononce sigma.
Les deux sont reliés par la formule suivante :
\(\displaystyle V = \sigma ^2 \)
On a aussi :
\(\displaystyle \sigma = \sqrt{V} \)
Alors tu vas dire que l’on pourrait aussi avoir σ = -√ V…et tu aurais tout à fait raison !
Sauf que σ et V sont TOUJOURS POSITIFS !! D’où σ = √ V.
Cela est un bon moyen de vérifier que tu ne t’es pas trompé. Si un jour tu trouves un V ou un σ négatif, dis-toi qu’il y a une erreur quelque part…
Du coup tu n’as qu’à calculer l’un des deux, puis appliquer l’une des deux formules pour avoir l’autre.
Mais comment calcule-t-on le premier ?
En fait la plupart du temps on calcule V, car on dispose non pas d’une, mais de DEUX formules pour la calculer (on rappelle que m est la moyenne) :
\(\displaystyle V = \frac{\sum n_i \times (x_i – m) ^2}{N} \)
\(\displaystyle V = \frac{\sum n_i \times x_i ^2}{N} – m^2 \)
Oulala qu’est-ce-que c’est que ces formules ??
Ne t’inquiète pas nous allons expliquer tout cela avec des exemples, ce n’est pas si compliqué au final, mais sache déjà que la 2ème formule est plus simple à utiliser.
—
Remarque : d’après la 1ère formule, V est un produit et un quotient de termes uniquement positifs (n, (x-m)2 et N), d’où le fait que V soit toujours positif…
—
—
Autre remarque : la moyenne est présente dans chaque formule, donc avant de calculer V il faudra toujours que tu calcules m, même si ce n’est pas demandé.
—
Explication de la 1ère formule :
En fait, dans les 2 cas le principe ressemble fortement au calcul de la moyenne, à savoir multiplier chaque valeur (xi) par chaque effectif (ni), puis diviser par l’effectif total (N). Sauf que dans le cas de la 1ère formule, il faut enlever la moyenne à chaque valeur et mettre le résultat au carré…
Pour l’expliquer nous allons rajouter des lignes à un tableau pour montrer les différentes étapes.
Prenons l’exemple suivant :
Note | 12 | 15 | 16 | 17 | 19 |
---|---|---|---|---|---|
Effectif | 4 | 2 | 6 | 2 | 6 |
Nous avions vu que la moyenne était de 16,1 donc m = 16,1.
1ère étape : on enlève la moyenne à chaque valeur :
Note (xi) | 12 | 15 | 16 | 17 | 19 |
---|---|---|---|---|---|
Effectif (ni) | 4 | 2 | 6 | 2 | 6 |
xi – m | -4,1 | -1,1 | -0,1 | 0,9 | 2,9 |
2ème étape : on met au carré cette nouvelle ligne
Note (xi) | 12 | 15 | 16 | 17 | 19 |
---|---|---|---|---|---|
Effectif (ni) | 4 | 2 | 6 | 2 | 6 |
xi – m | -4,1 | -1,1 | -0,1 | 0,9 | 2,9 |
(xi – m)2 | 16,81 | 1,21 | 0,01 | 0,81 | 8,41 |
3ème étape : on multiplie chacune de ces valeurs par l’effectif et on divise par N :
\(\textstyle V = \frac{4 \times 16,81 + 2 \times 1,21 + 6 \times 0,01 + 2 \times 0,81 + 6 \times 8,41}{20} \)
\(\textstyle V = 6,09 \)
Maintenant que l’on a V on peut calculer σ en appliquant la formule :
\(\textstyle \sigma = \sqrt{V} \)
\(\textstyle \sigma = \sqrt{6,09} \)
\(\textstyle \sigma = 2,47 \)
Et voilà, on a trouvé la variance et l’écart-type !
Par contre tu vois que cela est assez long car il faut rajouter deux lignes au tableau, ce qui augmente le nombre de calculs et donc le nombre de chances de se tromper…
Voyons maintenant comment appliquer la 2ème formule :
1ère étape : on met chaque valeur au carré :
Note (xi) | 12 | 15 | 16 | 17 | 19 |
---|---|---|---|---|---|
Effectif | 4 | 2 | 6 | 2 | 6 |
xi2 | 144 | 225 | 256 | 289 | 361 |
2ème étape : on multiplie chacune de ces valeurs par l’effectif et on divise par N, puis on enlève la moyenne au carré à la fin :
\(\textstyle V = \frac{4 \times 144 + 2 \times 225 + 6 \times 256 + 2 \times 289 + 6 \times 361}{20} – 16,1^2 \)
\(\textstyle V = 6,0 \)
On retrouve évidemment la même chose
On calcule l’écart-type comme précédemment en prenant la racine de la variance.
Comme tu le vois cette 2ème méthode est plus rapide car il n’y a qu’une seule ligne à rajouter avant d’appliquer la formule.
Par contre il ne faut pas oublier d’enlever m2 à la fin de la fraction, ce qui n’était pas le cas pour la formule précédente.
Cela peut te paraître compliqué mais à force de faire des exercices tu verras que cela est plutôt simple finalement, il suffit de prendre l’habitude !
Bon c’est bien beau de calculer V et σ, mais à quoi ça sert ??
En fait seul l’écart type a une signification, la variance ne sert qu’à calculer l’écart type en prenant la racine.
Comment interpréter l’écart-type ?
En gros, plus l’écart-type est grand, plus la dispersion des valeurs est grande.
Prenons deux classes qui ont toutes les deux une moyenne de 12 à un contrôle. La première classe a un écart-type de 2 alors que la deuxième classe a un écart-type de 5. Cela signifie que la première classe est plus homogène que l’autre.
Pour matérialiser cela, il est bon de calculer l’intervalle [m – σ ; m + σ], car on peut dire que « la plupart » des valeurs appartiennent à cet intervalle.
Pour la première classe : [m – σ ; m + σ] = [12-2 ; 12+2 ] = [10 ; 14]
Pour la deuxième classe : [m – σ ; m + σ] = [12-5 ; 12+5] = [7 ; 17]
On peut dire que pour la première classe, la plupart des élèves ont entre 10 et 14, tandis que pour la deuxième classe, la plupart des élèves ont entre 7 et 17. Cela veut bien dire que la première classe est plus homogène que la deuxième.
Tout comme le diagramme en boîte, l’interprétation de l’écart-type est parfois subjective et n’est donc pas toujours demandée. On te demandera donc de calculer la variance et l’écart-type mais pas systématiquement de l’interpréter.
Maintenant que l’on a vu toutes les choses que l’on peut calculer (médiane, moyenne, quartiles etc…), nous allons voir que l’on peut représenter et même calculer tout cela avec des graphiques, ce qui est beaucoup plus visuel qu’un tableau comme dans les exemples ci-dessus.
De nombreux diagrammes et courbes existent, nous verrons ceux que l’on étudie au lycée, à savoir :
– le diagramme circulaire
– le diagramme en bâtons
– l’histogramme
– la courbe des ECC
– la courbe des FCC
Nous allons prendre le même exemple pour illustrer chacun de ces graphiques (sauf l’histogramme). Nous prendrons l’exemple suivant :
Note | 12 | 15 | 16 | 17 | 19 |
---|---|---|---|---|---|
Effectif | 4 | 2 | 6 | 2 | 6 |
ECC | 4 | 6 | 12 | 14 | 20 |
Fréquence | 0,2 | 0,1 | 0,3 | 0,1 | 0,3 |
FCC | 0,2 | 0,3 | 0,6 | 0,7 | 1 |
1er diagramme : le diagramme circulaire
Il s’agit tout simplement d’une histoire de proportionnalité. Le mieux est d’utiliser la fréquence.
Prenons la note 12, sa fréquence est de 0,2.
On sait que 1 tour correspond à 360°. Donc 0,2 correspond à 0,2 × 360 = 72°.
Pour la note 15 de fréquence 0,1 cela correspond à 0,1 × 360 = 36°.
Tu auras compris qu’il suffit de multiplier la fréquence par 360 pour avoir l’angle correspondant en degrés. On rajoute alors une ligne dans le tableau :
Note | 12 | 15 | 16 | 17 | 19 |
---|---|---|---|---|---|
Fréquence | 0,2 | 0,1 | 0,3 | 0,1 | 0,3 |
Angle | 72 | 36 | 108 | 36 | 108 |
Avec un rapporteur et un compas, tu devrais obtenir cela :
Grâce à ce diagramme, on va pouvoir calculer la médiane ainsi que Q1 et Q3 !
Pour que ce soit plus pratique, commence toujours ton diagramme en partant du point tout en haut du cercle (qui correspond à 12h si le cercle était une horloge).
Q1 se trouve alors à 3h, la médiane à 6h et Q3 à 9h, pour continuer l’analogie avec l’horloge :
On voit que Q1 est dans la zone du 15, la médiane dans la zone du 16 et Q3 dans la zone du 19.
Ainsi Q1 = 15, me = 16 et Q3 = 19.
Comme tu le vois c’est plutôt simple, mais si tu dois faire toi-même le graphique il faut être très précis avec les angles !
2ème diagramme : le diagramme en bâtons (ou en barres)
Ce graphique s’utilise généralement avec les effectifs. On met les valeurs en abscisse et les effectifs en ordonnée. On trace alors un bâton (on peut lui donner un peu d’épaisseur) pour chaque valeur.
Toujours avec le même exemple :
Comme tu le vois les bâtons peuvent avoir un peu d’épaisseur mais ne doivent pas se toucher (sinon c’est un histogramme).
Ce diagramme est surtout intéressant pour comparer avec une autre série.
Imaginons que l’on ait deux classes avec les effectifs suivants :
Note | 12 | 15 | 16 | 17 | 19 |
---|---|---|---|---|---|
Effectif (classe 1) | 4 | 2 | 6 | 2 | 6 |
Effectif (classe 2) | 2 | 1 | 6 | 3 | 8 |
On voit sur le diagramme que la 2ème classe a plus de 17 et 19 et moins de 12 et 15 que 1ère classe, donc elle est meilleure.
Contrairement au diagramme circulaire, ce graphique ne permet pas de trouver la médiane et les quartiles.
3ème diagramme : l’histogramme
L’histogramme ressemble au diagramme en bâtons mais les bâtons, ou les barres se touchent.
Ceci est dû au fait que ce diagramme s’utilise quand les valeurs sont des intervalles (des classes) et non des nombres.
L’histogramme est en réalité assez complexe car il s’agit d’une histoire de proportionnalité d’aires, ce qui pose problème quand les intervalles ne sont pas de même longueur…
Pour simplifier les choses nous nous contenterons d’étudier le cas où les intervalles sont de même longueur.
Prenons un exemple avec la taille des personnes, la population va être classée suivant sa taille : entre 150 et 160 cm, entre 160 et 170 cm etc… (les intervalles sont bien tous de même longueur à savoir 10 cm).
Taille | [150;160[ | [160;170[ | [170;180[ | [180;190[ | [190;200[ |
---|---|---|---|---|---|
Effectif | 4 | 2 | 6 | 3 | 5 |
Comme on le voit sur le graphique, les valeurs (150, 160 etc…) sont au niveau des séparations entre les barres, alors que pour le diagramme en bâtons les valeurs étaient sous la barre.
4ème diagramme : la courbe des ECC
Cette courbe est intéressante car, tout comme le diagramme circulaire, elle va nous permettre de calculer la médiane et les quartiles.
Reprenons notre exemple en ne gardant que la ligne des ECC puisque c’est elle qui va nous intéresser :
Note | 12 | 15 | 16 | 17 | 19 |
---|---|---|---|---|---|
ECC | 4 | 6 | 12 | 14 | 20 |
On place tout simplement les points correspondants dans le repère et on relie les points entre eux.
—
Attention, il faut relier les points par des droites, ne fais pas de courbe arrondie !!
—
Voyons maintenant comment trouver la médiane, Q1 et Q3 avec cette courbe.
Le principe est le même que par le calcul. Pour Q1 et Q3, on calcule N/4 et 3N/4 (N = effectif total).
D’après la courbe N=20. Donc N/4 = 5 et 3N/4 = 15.
On place alors 5 et 15 sur l’axe des ECC et on regarde l’abscisse correspondant :
On voit qu’en abscisse on ne tombe pas sur des valeurs précises (environ 13,9 et 17,2).
On arrondit alors TOUJOURS à la valeur supérieure, mais ATTENTION, à la valeur supérieure qui existe dans le tableau !!
Ici on arrondit 13,9 à 15 puisque l’on n’a pas la valeur 14 dans la tableau mais la valeur 15.
De même on arrondit 17,2 à 19 puisque l’on n’a pas la valeur 18 dans la tableau mais la valeur 19.
Ainsi Q1 = 15 et Q3 = 19.
—
Remarque : on peut également dire que l’on prend le point d’après sur la courbe :
—
Pour la médiane, le principe est simple si l’effectif total est impair.
On calcule (N+1)/2 ce qui donne un chiffre que l’on met sur l’axe des ECC et comme pour Q1 et Q3 on regarde la valeur correspondante en abscisse. Evidemment on arrondit comme pour les quartiles à la valeur supérieure qui existe dans le tableau.
Si l’effectif total est pair (comme dans l’exemple), c’est un peu plus compliqué.
En effet, tout comme quand on calcule la médiane avec la formule, il faut faire N/2. Ici N/2 = 10.
La médiane est alors la moyenne entre les 10ème et 11ème valeurs. Il faut donc mettre 10 et 11 sur l’axe des ECC, regarder les valeurs correspondantes sur les abscisses et arrondir à la valeur supérieure qui existe dans le tableau (pour les 2).
On fait alors la moyenne de ces deux valeurs.
Encore une fois les valeurs abscisses ne tombent pas pile (15,8 et 15,9 environ), mais comme on arrondit au-dessus on prend 16, car la valeur 16 est bien dans le tableau.
On fait alors la moyenne entre 16 et 16 qui est… 16, donc la médiane est 16 !
Comme tu le vois tout cela n’est pas très simple et c’est d’ailleurs assez rare que l’on te demande cela… en tout cas avec des valeurs qui sont des nombres !
En effet, on fait exactement la même technique quand les valeurs sont des intervalles, mais là pas besoin d’arrondir, on prend directement la valeur lue en abscisse ! (ce qui est beaucoup plus simple )
Reprenons l’exemple des tailles :
Taille | [150;160[ | [160;170[ | [170;180[ | [180;190[ | [190;200[ |
---|---|---|---|---|---|
ECC | 4 | 6 | 12 | 15 | 20 |
Il faut faire attention que la valeur la plus faible (ici 150) correspond au 0.
L’ECC correspond au 2ème nombre de l’intervalle, c’est-à-dire que l’ECC 4 sera pour 160, l’ECC 6 pour 170, l’ECC 12 pour 180 etc…
Ce qui donne :
Pour la médiane, Q1 et Q3, on calcule N/2, N/4 et 3N/4 que l’on met sur l’axe des ECC.
Les valeurs lues en abscisse correspondent à la médiane, Q1 et Q3 (et là pas besoin d’arrondir !! )
Dans l’exemple, on voit que Q1 = 165, me = 177 et Q3 = 190
Tu remarqueras que c’est plus simple qu’avant^^
Le problème de cette technique est que ce n’est pas très précis. Ici le Q3 tombe pile sur 190, donc c’est précis, mais pour Q1 et la médiane ce n’est pas aussi précis…
En revanche, cela permet de donner la valeur de la médiane, Q1 et Q3 pour une série avec des intervalles, ce qui n’est pas possible par le calcul…
5ème diagramme : la courbe des FCC
Le principe est exactement le même que pour la courbe des ECC, ce pourquoi nous allons étudier cela un peu plus rapidement que la courbe des ECC !
Nous allons uniquement étudier le cas avec les intervalles :
Taille | [150;160[ | [160;170[ | [170;180[ | [180;190[ | [190;200[ |
---|---|---|---|---|---|
FCC | 0,2 | 0,3 | 0,6 | 0,75 | 1 |
On retrouve évidemment le même graphique avec des fréquences au lieu des effectifs.
Pour la médiane, Q1 et Q3 on regarde les abscisses correspondant à 25%, 50% et 75%, donc aux FCC 0,25 et 0,50 et 0,75.
On retrouve les mêmes valeurs pour la médiane, Q1 et Q3 (heureusement ! )
Tu trouveras tous les exercices disponibles sur les statistiques en cliquant ici !
Retour au cours de PremièreRetour au cours de TerminaleRemonter en haut de la page