Statistiques – 1ère Partie

Sommaire

Introduction
Vocabulaire
Moyenne
Médiane
Quartiles
Diagramme en boîte
Exercices

Introduction

Dans la vie de tous les jours, on retrouve les statistiques au niveau des sondages par exemple : on prend quelques personnes (des centaines voire des milliers) que l’on étudie et on en déduit des pourcentages, puis on dit que ce pourcentage est vrai pour beaucoup plus de personnes que celles étudiées.
Dans ce cours, nous étudierons une population et nous allons les classer dans un tableau selon un certain critère, par exemple leur taille ou la note qu’ils ont obtenue au dernier contrôle. A partir de ce tableau nous allons pouvoir calculer certaines caractéristiques comme la moyenne par exemple, et faire des graphiques pour représenter ces données (tu as déjà dû voir ces graphiques dans les journaux ou à la télé notamment).

Ce cours étant assez long, il a été découpé en deux parties (comme ça cela te semblera moins lourd à apprendre ).
Un lien vers les exercices est disponible en bas de chaque partie.

Vocabulaire

Il y a beaucoup de vocabulaire nouveau dans ce chapitre, donc on va commencer par ça !
Pour cela nous allons prendre un exemple que l’on va expliquer au fur et à mesure.
Imaginons que l’on étudie le nombre de frères et sœurs que possèdent les élèves d’une classe de 30 élèves.
Certains élèves auront 0 frère et sœur, d’autres 1, d’autres 2, d’autres 3, et encore d’autres 4.

La POPULATION, c’est l’ensemble des personnes étudiées, ici la population est : les élèves de la classe.
L’EFFECTIF TOTAL, c’est le nombre de personnes étudiées, ici c’est 30 (car il y a 30 élèves en tout). Il est souvent noté N.
Le CARACTÈRE, c’est la propriété qui va nous intéresser chez chaque individu étudié, ici le caractère est le nombre de frères et sœurs. Le caractère est souvent noté x.
Dans ce cours nous appellerons parfois cela VALEUR.
L’EFFECTIF, c’est le nombre de personnes qui ont un certain caractère. Il est souvent noté n.

Imaginons que dans la classe de 30 élèves , il y ait 5 élèves qui ont 0 frères et soeurs, 6 élèves qui en ont 1, 8 élèves qui en ont 2, 7 élèves qui en ont 3, et 4 élèves qui en ont 4.
Ainsi l’effectif du caractère 0 est 5, l’effectif du caractère 1 est 6, l’effectif du caractère 2 est 8, etc…
On peut alors représenter la situation sous forme de tableau :

Nombre de frères et soeurs 0 1 2 3 4
Effectif 5 6 8 7 4 30

Comme tu le vois c’est beaucoup plus simple sous forme de tableau qu’avec des phrases
Nous verrons plus tard que le tableau est extrêmement pratique pour calculer certaines choses!

Mais que vient faire le 30 à la fin du tableau ??
Et bien c’est l’effectif total !
En effet, l’effectif total est obtenu en additionnant tous les effectifs, ici 5+6+8+7+4 = 30.
Cela te permet de vérifier que tu n’as pas oublié un effectif. Tu n’es pas obligé de rajouter une case au bout comme ci-dessus, mais calcule-le systématiquement car cela te permet de détecter une éventuelle erreur dans ton tableau. Or ce dernier est primordial car généralement la suite de l’exercice dépend du tableau, donc si ton tableau est faux tous les résultats suivants seront faux !!!
Par ailleurs, il existe des exercices dans lesquels on te donne une suite de chiffres que tu dois toi-même mettre sous forme de tableau.
Pour l’exemple précédent, on aurait pu te donner :
2 – 3 – 0 – 3 – 4 – 4 – 2 – 3 – 0 – 1 – 2 – 1 – 0 – 4 – 2 – 2 – 3 – 1 – 2 – 3 – 4 – 1 – 2 – 1 – 0 – 2 – 3 – 1 – 3 – 0
Et tu aurais dû compter combien il y a de 0, combien il y a de 1, combien il y a de 2, combien il y a de 3 et combien il y a de 4.
Tu aurais alors mis le résultat sous forme de tableau comme ci-dessus (ce qui est avouons-le beaucoup plus pratique qu’une suite de chiffres qui n’est même pas dans l’ordre !!!)

Une fois que l’on a fait le tableau, on peut rajouter une ligne qui va correspondre à l’EFFECTIF CUMULE CROISSANT (ECC en abrégé) :

Nombre de frères et soeurs 0 1 2 3 4
Effectif 5 6 8 7 4
Effectif cumulé croissant 5 11 19 26 30

Comme tu le vois avec le schéma ci-dessus, il suffit d’additionner au fur et à mesure les effectifs (d’où le nom ECC).
Evidemment, à la fin on doit retrouver l’effectif total puisque l’on a additionné tous les effectifs, ce qui te permet de vérifier que tu ne t’es pas trompé sur la ligne des ECC (mettre le total à la fin de la ligne Effectif n’est donc plus nécessaire mais tu peux quand même le mettre si tu veux).

On va encore rajouter une ligne dans la tableau, qui va correspondre à la FRÉQUENCE des caractères.
La fréquence, c’est comme le pourcentage, mais divisé par 100.
Ainsi 20% correspond à une fréquence de 0,20 (20/100), 5% correspond à 0,05 (5/100), 18% à 0,18 etc…


Remarque importante : la fréquence est toujours comprise entre 0 et 1 !! (comme une probabilité).
Ainsi une fréquence négative n’existe pas, de même qu’une fréquence plus grande que 1.
Si dans l’énoncé on te dit que la fréquence est de 30%, tu dois écrire f = 0,30 et non f = 30…

Mais comment calculer cette fréquence ?
Il y a une formule très simple, mais avant nous allons donner quelques notations :
la fréquence est presque toujours notée f.
L’effectif de chaque caractère est noté n.
L’effectif total est noté N.

Et on a la formule :

\(\displaystyle f = \frac{n}{N} \)

Ainsi, la fréquence d’un caractère est égal à l’effectif du caractère divisé par l’effectif total. La fréquence sera donc très souvent sous forme de fraction. On peut la mettre sous forme décimale (0,…) mais il faut que la valeur soit exacte, pas une valeur approchée, ce qui n’est pas toujours le cas.

Pour l’exemple que l’on prend depuis le début :
la fréquence du caractère 0 est 5/30 = 1/6
la fréquence du caractère 1 est 6/30 = 1/5
la fréquence du caractère 2 est 8/30 = 4/15
la fréquence du caractère 3 est 7/30
la fréquence du caractère 4 est 4/30 = 2/15

On peut donc compléter le tableau :

Nombre de frères et soeurs 0 1 2 3 4
Effectif 5 6 8 7 4
Effectif cumulé croissant (ECC) 5 11 19 26 30
Fréquence 1/6 1/5 4/15 7/30 2/15

De la même manière que pour les effectifs, on peut rajouter en dessous la fréquence cumulée croissante (FCC). Cela fonctionne sur le même principe que l’ECC, à savoir qu’on additionne au fur et à mesure les fréquences. Cependant, comme les fréquences sont sous forme de fraction et qu’on les additionne, il est préférable, EXCEPTIONNELLEMENT, de laisser la fraction non simplifiée (c’est un des rares cas où l’on ne simplifie pas les fractions) :

Nombre de frères et soeurs 0 1 2 3 4
Effectif 5 6 8 7 4
Effectif cumulé croissant (ECC) 5 11 19 26 30
Fréquence 5/30 6/30 8/30 7/30 4/30
Fréquence cumulée croissante (FCC) 5/30 11/30 19/30 26/30 30/30 = 1

Tu auras remarqué que, de la même manière que la dernière case de l’ECC correspond à l’effectif total, la dernière case de la FCC correspond à la fréquence totale, à savoir 1, qui correspond à 100%. C’est donc là aussi un moyen de vérifier que tu ne t’es pas trompé


Remarque : pour calculer FCC, on peut également utiliser les ECC et diviser par l’effectif total :

\(\textstyle Fcc = \frac{Ecc}{N} \)

En effet, dans le tableau ci-dessus, tu remarqueras que la ligne des FCC est la même que celle des ECC mais divisé par 30 qui est l’effectif total.

On a vu comment passer de l’effectif à la fréquence en calculant f=n/N.
Mais on peut également faire l’inverse ! A savoir calculer l’effectif à partir de la fréquence, tout simplement en inversant la formule.
f=n/N signifie aussi que n = f × N :

\(\displaystyle n = f \times N \)

On se sert de cela quand l’énoncé nous donne non pas l’effectif de chaque caractère mais sa fréquence. Dans ce cas, la fréquence est souvent donnée sous forme décimale.
Prenons un exemple : supposons que l’on ait une classe de 20 élèves, et on étudie leur note au dernier contrôle. Il y a eu des 12, des 15, des 16, des 17 et des 19 (oui c’est une très bonne classe ! )
On nous donne la fréquence de chaque note :

Note 12 15 16 17 19
Fréquence 0,2 0,1 0,3 0,1 0,3

Déjà on peut vérifier que la fréquence totale vaut bien 1 : 0,2 + 0,1 + 0,3 + 0,1 + 0,3 = 1, c’est bon !
Pour calculer l’effectif, il suffit de multiplier chaque fréquence par 20 qui est l’effectif total (N = 20).
En effet, n = f × N = f × 20
Ainsi, l’effectif de 12 est 0,2 × 20 = 4
L’effectif de 15 est 0,1 × 20 = 2
etc…

On met évidemment tout ça dans le tableau en rajoutant la ligne Effectif :

Note 12 15 16 17 19
Fréquence 0,2 0,1 0,3 0,1 0,3
Effectif 4 2 6 2 6

Comme pour la fréquence, on vérifie que l’effectif total est bon : 4 + 2 + 6 + 2 + 6 = 20, pas de problème !

Rien de compliqué comme tu le vois, il faut juste bien penser à appliquer la formule n = f × N

Voyons maintenant un cas particulier que tu peux rencontrer : LES CLASSES
Les classes, c’est tout simplement quand les valeurs du caractère étudié ne sont pas des nombres mais des intervalles.
Une classe est en fait un intervalle.
Imaginons que l’on étudie la taille (en cm) de 20 élèves. Le plus petit mesure 1m50 (150 cm) et le plus grand 1m90 (190 cm).
Si l’on faisait toutes les valeurs de 150 cm à 190 cm, on aurait beaucoup de valeurs…
On va alors répartir les élèves par tranche de 10 cm : de 150 à 160 cm, de 160 à 170 cm etc…
On aura donc les intervalles [150;160[, [160;170[, [170;180[ et [180;190].


ATTENTION !! Tu as sûrement remarqué que les crochets de l’intervalle sont fermés d’un côté mais ouverts de l’autre…
En effet, pour 160 par exemple, on ne peut pas fermer le crochet dans les deux intervalles, sinon un élève de 160 cm devrait être compté dans les deux intervalles… De même pour 170 et 180. Il faut donc que ces valeurs ne soient prises que dans un seul intervalle.
Pour les extrémités en revanche (150 et 190), comme elles n’apparaissent que dans un seul intervalle, elles sont obligatoirement prises.

On a donc un tableau qui ressemble à ça :

Taille [150;160[ [160;170[ [170;180[ [180;190[
Effectif 4 5 6 5

Dernier mot nouveau que tu dois connaître : l’ETENDUE.
L’étendue d’une série est tout simplement la plus grande valeur moins la plus petite valeur.
Si on prend le tableau vu plus-haut, la note maximale est 19, et la note minimale est 12.
19 – 12 = 7, donc l’étendue est de 7.
Très simple par rapport à d’autres choses vues plus haut
Si on a des intervalles comme on vient de voir dans l’exemple ci-dessus, même principe : la plus grande valeur était 190 et la plus petite 150. Donc l’étendue est 190 – 150 = 40.

Petite remarque avant de passer à la suite : on a vu que l’effectif était souvent noté n. Mais on ne précise pas à quel effectif du tableau cela se réfère !
Ce pourquoi on note souvent les effectifs avec des indices. Le premier effectif est noté n1, le deuxième est noté n2, le troisième est noté n3 etc…
On fait la même chose pour les caractères (noté x) : x1, x2, x3… et les fréquences f1, f2, f3

Le tableau est donc le suivant :

Caractère x1 x2 x3 x4 x5
Effectif n1 n2 n3 n4 n5
Fréquence f1 f2 f3 f4 f5

Dans ce tableau nous avons choisi de faire 5 colonnes mais évidemment ce n’est qu’un exemple, il faut s’adapter à l’énoncé de l’exercice.


ATTENTION !! x1 ne correspond pas forcément au caractère 1 mais au 1er caractère, x2 ne correspond pas forcément au caractère 2 mais au 2ème caractère, etc…

Dans ce tableau par exemple :

Note 12 15 16 17 19
Effectif 4 2 6 2 6
Fréquence 0,2 0,1 0,3 0,1 0,3

on a x1 = 12, x2 = 15, x3 = 16 etc…
n1 = 4, n2 = 2, n3 = 6 etc…

Passons maintenant aux calculs que l’on va effectuer avec les tableaux !



Moyenne

Haut de page

La moyenne est une des caractéristiques de la série que l’on peut calculer (comme la médiane ou les quartiles que l’on verra plus bas).
Pour la calculer, plusieurs manières, mais le plus simple est d’utiliser le tableau que l’on a vu plus haut (d’où l’intérêt de ne pas se tromper dans le tableau^^).
Note bien au passage que la moyenne se note m (pour moyenne) ou \bar{x} , c’est-à-dire un x avec une barre au-dessus si le caractère est noté x (on prononce ‘x barre’).

Avec le tableau il y a deux manières de calculer la moyenne : avec l’effectif ou avec la fréquence, donc tout dépend de ce que tu as dans l’énoncé ou ce que tu as calculé.
Voyons d’abord comment faire avec les effectifs, méthode la plus courante (car on a plus souvent l’effectif que la fréquence).

On applique la formule suivante :

\(\displaystyle \bar{x} = \frac{n_1 x_1 + n_2 x_2 + n_3 x_3 + …}{N} \)

Qu’est-ce-que c’est que cette formule ???
En fait c’est beaucoup plus simple qu’il n’y paraît.
Reprenons un exemple vu ci-dessus :

Note 12 15 16 17 19
Effectif 4 2 6 2 6

Ici x1 = 12, x2 = 15, x3 = 16 etc…
n1 = 4, n2 = 2, n3 = 6 etc…
Et N = 20 (l’effectif total).

Si on applique la formule, cela nous donne :

\(\textstyle \bar{x} = \frac{12\times4 + 15\times2 + 16 \times 6 + 17\times 2 + 19 \times 6}{20} \)

Comme tu le vois on multiplie chaque valeur de la ligne du haut par la valeur en-dessous, et on additionne chacun de ces produits.
Il ne reste plus qu’à finir le calcul :

\(\textstyle \bar{x} =\frac{322}{20} \)

\(\textstyle \bar{x} = 16,1 \)

Et voilà, tout simplement !


Petite astuce : vérifie à chaque fois que la valeur trouvée est cohérente. Déjà la moyenne doit être comprise entre la valeur minimale et la valeur maximale (ici 16,1 est bien compris entre 12 et 19).
Tu peux aussi, un peu plus dur, voir la répartition des valeurs, surtout quand cela est très déséquilibré. Si par exemple tu as de nombreux effectifs dans les faibles valeurs, la moyenne aura tendance à être proche des valeurs les plus faibles et inversement. Si la répartition est équitable entre les valeurs, la moyenne sera à peu près au milieu des valeurs.


Remarque : la formule devrait te faire penser à quelque chose que tu fais avec tes notes : ta moyenne générale !
En effet, tu multiplies chacune de tes notes par le coefficient, et à la fin tu divises par la somme des coefficients.
Dans notre cas, l’effectif représente le coefficient et l’effectif total correspondant à la somme de tes coefficients.

Voyons maintenant la deuxième méthode avec la fréquence, qui tu vas le voir ressemble beaucoup !
En effet, il suffit d’appliquer la formule :

\(\displaystyle \bar{x} = f_1 x_1 + f_2 x_2 + f_3 x_3 +… \)

Comme tu le vois on ne met pas l’effectif mais la fréquence, et on ne divise pas par N.
Mais pourquoi cela ??
Faisons la démonstration : on a vu que

\(\textstyle \bar{x} = \frac{n_1 x_1 + n_2 x_2 + n_3 x_3 +…}{N} \)

Si on sépare cela donne

\(\textstyle \bar{x} = \frac{n_1 x_1}{N} + \frac{n_2 x_2}{N} + \frac{n_3 x_3}{N} + … \)

\(\textstyle \bar{x} = x_1\frac{n_1}{N} + x_2\frac{n_2}{N} + x_3\frac{n_3}{N} +… \)

Et on a vu que f = n/N, d’où

\(\textstyle \bar{x} = f_1 x_1 + f_2 x_2 + f_3 x_3 + … \)

Apprends bien cette démonstration car elle peut t’être demandée en contrôle

Voyons un exemple d’application :

Note 12 15 16 17 19
Fréquence 0,3 0,1 0,2 0,3 0,1

Comme pour la formule précédente, il s’agit de multiplier chaque note par sa fréquence et d’additionner tout cela :

\(\textstyle \bar{x} = 12 \times 0,3 + 15 \times 0,1 + 16 \times 0,2 + 17 \times 0,3 + 19 \times 0,1 \)

\(\textstyle \bar{x} = 15,3 \)


ATTENTION à ne pas confondre les deux formules !! Quand on utilise l’effectif on divise par N, mais quand on utilise la fréquence on ne divise pas par N.
En effet, dans la démonstration on a remplacé n/N par f puisque f = n/N, donc le « divisé par N » est compris dans le f…

Avant de passer à la suite, il faut que l’on parle du cas où l’on a des intervalles…
En effet, reprenons un exemple vu plus haut :

Taille [150;160[ [160;170[ [170;180[ [180;190[
Effectif 4 5 6 5

Pour calculer la moyenne dans ces cas-là, il faut prendre le MILIEU de chaque intervalle.
Les milieux des quatre intervalles sont 155, 165, 175 et 185.
La moyenne est donc :

\(\textstyle \bar{x} = \frac{155\times 4 + 165\times 5 + 175 \times 6 + 185\times 5}{20} \)

\(\textstyle \bar{x} = 171 \)

Evidemment on a le même principe avec la fréquence, on multiplie le milieu de l’intervalle par la fréquence.


Remarque : pour calculer le milieu de chaque intervalle, on additionne les deux extrémités et on divise par 2.
Pour [150;160[ par exemple, on fait (150+160)/2 = 155.
Pour [160;170[ par exemple, on fait (160+170)/2 = 165.
Etc…

Maintenant que tu sais comment calculer la moyenne, nous allons voir comment calculer la médiane.

Médiane

Haut de page

Souvent les élèves ont tendance à mélanger les deux, car les deux mots se ressemblent un peu, mais avec l’habitude tu devrais arriver à ne pas te tromper

La médiane est une valeur qui sépare les différentes valeurs en deux parties égales

Avec un exemple ça ira mieux^^
Imaginons que l’on ait dans une classe les notes suivantes :
12 – 12 – 13 – 14 – 15 – 16 – 17 – 17 – 18 – 18 – 19

On veut répartir les notes en deux parties égales. Ici il y a 11 notes, on va donc faire deux groupes de 5 (les 5 premières et les 5 dernières). Il reste une note, au milieu, qui séparera les deux groupes.
Le premier groupe est constitué des notes 12 – 12 – 13 – 14 – 15.
Le deuxième groupe est constitué des notes 17 – 17 – 18 – 18 – 19.
Et la valeur 16 sépare les deux groupes :
12 – 12 – 13 – 14 – 15 – 16 – 17 – 17 – 18 – 18 – 19

Donc la médiane est 16 !
Souvent la médiane est notée me (à ne pas confondre avec la moyenne notée m), donc me=16.


ATTENTION ! Pour faire ce genre de raisonnement il faut au départ que les valeurs soient dans l’ordre, de la plus petite à la plus grande !!

Quand on a un nombre impair de valeurs (comme ici 11), on peut faire deux groupes égaux et alors la médiane est la valeur qui sépare les deux groupes.
Tu peux faire cela avec les doigts d’une de tes mains, le majeur sépare le pouce et l’index d’un côté, et l’auriculaire et l’annulaire de l’autre.

Mais si l’on a un nombre pair de valeurs, on peut faire deux groupes égaux, mais il n’y a plus de valeur qui sépare les groupes !!
Par exemple imaginons que l’on ait 6 notes :
8 – 10 – 11 – 14 – 15 – 19
On va faire 2 groupes de trois notes : 8 – 10 – 11 et 14 – 15 – 19.

A ce moment-là, la médiane va être la moyenne entre les deux valeurs « au milieu ». Dans l’exemple, il s’agit de 11 et 14 :
8 – 10 – 11 – 14 – 15 – 19

On a donc :

\(\textstyle me = \frac{11 + 14}{2} \)

\(\textstyle me = \frac{25}{2} \)

\(\textstyle me = 12,5 \)

La médiane est donc de 12,5 dans cet exemple.


Remarque : la médiane n’est donc pas forcément une des valeurs de la série. Ici aucun élève n’a 12,5, et pourtant la médiane vaut 12,5.
En revanche, comme pour la moyenne tu peux vérifier la cohérence du résultat car la médiane doit toujours être comprise entre la valeur minimale et la valeur maximale (ici 12,5 est bien compris entre 8 et 19).


Autre remarque : dans le cas présent la moyenne entre les deux valeurs est parfois appelée demi-somme, car on additionne deux valeurs que l’on divise par 2, d’où le nom de demi-somme.

On vient de voir comment calculer la moyenne dans les cas où l’on a un nombre pair de valeurs (N pair) ou impair de valeurs (N impair).
Mais la méthode ci-dessus marche bien quand on n’a que quelques valeurs et que l’on peut les écrire, s’il y en a 412 cela risque d’être plus compliqué…

Rassure-toi il y a une formule que tu vas pouvoir appliquer
En fait il y a 2 formules, une pour chaque cas (N pair et N impair).

1er cas : si N est impair.
On calcule (N+1)/2.
On trouve par exemple 25. La médiane sera alors la 25ème VALEUR.
J’insiste sur le fait que la médiane n’est PAS 25 mais la 25ème VALEUR !!!!!

Reprenons l’exemple de tout à l’heure :
12 – 12 – 13 – 14 – 15 – 16 – 17 – 17 – 18 – 18 – 19
On a 11 notes, donc N = 11.
(N+1)/2 = 12/2 = 6
Donc la médiane est la 6ème valeur (la médiane n’est pas 6 !!).
Or la 6ème valeur est 16.
Donc me = 16.


Tu vois ici toute l’importance de mettre les valeurs dans l’ordre, si tu les mets dans un ordre quelconque la 6ème valeur ne sera pas forcément la médiane…

Autre exemple : on a la série
2 – 5 – 6 – 6 – 9 – 9 – 9 – 10 – 11 – 11 – 11 – 14 – 15 – 16 – 16
Ici N = 15.
(15+1)/2 = 16/2 = 8
Donc la médiane est la 8ème valeur, qui est 10.
Donc me = 8.

Cependant, il arrive souvent que l’énoncé te donne un tableau avec les différentes valeurs (surtout s’il y en a beaucoup).

Valeur 8 11 13 17 19
Effectif 4 3 6 3 5 21

Ici on a un total de 21 personnes, N = 21.
(21+1)/2 = 11. Donc la médiane est la 11ème valeur.
Mais où est cette 11ème valeur ??
Pour cela il faut calculer l’ECC :

Valeur 8 11 15 17 19
Effectif 4 3 6 3 5
Effectif cumulé croissant (ECC) 4 7 13 16 21

Pour trouver la 11ème valeur, il faut regarder l’ECC le plus proche de 11 mais au-dessus de 11.
Ici c’est l’ECC 13, qui correspond à la valeur 15.
Donc me = 15.


ATTENTION encore une fois, la médiane se lit au niveau des valeurs et non de l’effectif. Donc on prend l’ECC 13 mais qui correspond à la valeur 15.
Donc la médiane n’est pas 13 mais 15.

2ème cas : si N est pair.
Comme on l’a vu plus haut il faudra prendre la moyenne entre deux valeurs.
Pour savoir lesquelles, on calcule N/2.
On trouve par exemple 7.
On prend alors les 7ème et 8ème valeurs, et on fait la moyenne des deux, ce qui donne la médiane.
Ainsi, on prend la VALEUR correspondant à N/2, et celle D’APRÈS.

Prenons l’exemple suivant :

Valeur 7 10 12 17 19
Effectif 5 6 8 7 4
ECC 5 11 19 26 30

Ici N = 30, donc N/2 = 15.
On fait donc la moyenne entre la 15ème et la 16ème valeur.


ATTENTION !! On ne fait pas la moyenne entre 15 et 16 mais entre les 15ème et 16ème VALEURS.

D’après le tableau, la 15ème et la 16ème valeur sont toutes les deux 12.
On fait donc la moyenne de 12 et 12 : (12+12)/2 = 12.
Donc la médiane est 12.


Remarque : ici les 2 valeurs sont identiques donc la moyenne des 2 est également le même chiffre, ce qui arrive assez souvent. Mais dans d’autres exemples ce n’est pas le cas.

Prenons justement cet autre exemple :

Valeur 7 10 12 25 29
Effectif 3 5 6 8 6
ECC 3 8 14 22 28

N = 28. Donc N/2 = 14.
On fait donc la moyenne entre la 14ème et la 15 ème valeur.
La 14ème valeur est 12, la 15ème valeur est 25.
(12+25)/2 = 37/2 = 18,5
Donc la médiane est 18,5.


Remarque : la médiane ne correspond pas à une valeur du tableau. En effet, on fait la moyenne entre 2 valeurs, donc le résultat n’est pas forcément une valeur du tableau.



Quartiles

Haut de page

Après la médiane, on calcule souvent les quartiles, et plus précisément le 1er et le 3ème quartiles notés Q1 et Q3 (on verra pourquoi on ne calcule pas Q2).
Grossièrement, on peut dire que les quartiles sont les valeurs qui « coupent » la série en 4 :

Ce schéma n’est pas à retenir, c’est juste pour t’expliquer le principe, nous le préciserons par la suite.

Sur le schéma tu vois que Q2 correspond en fait à la médiane (50% à gauche et 50% à droite), ce pourquoi on ne le calcule pas^^.

En fait le schéma n’est pas complètement vrai. En effet, Q1 et Q3 correspondent à des valeurs de la série.
Or la série n’est pas forcément divisible en 4 parties égales. Si on a un effectif total de 10 par exemple, on ne peut pas répartir les 10 valeurs en 4 groupes égaux.
C’est pourquoi dans la définition de Q1 et Q3 on ajoute une petite subtilité qu’il faut absolument retenir et que l’on va illustrer par des exemples juste après.
Q1 et Q3 sont définis de la manière suivante :


Q1 est la plus petite valeur de la série telle que au moins 25% des valeurs soient inférieures ou égales à Q1.


Q3 est la plus petite valeur de la série telle que au moins 75% des valeurs soient inférieures ou égales à Q3.

Retiens bien ces définitions car elles peuvent t’être demandées en question de cours !
Avec ces définitions, on peut affiner le schéma précédent :

Bon c’est bien beau mais ça ne dit pas comment calculer Q1 et Q3.

Le principe va être très simple : pour calculer Q1, on calcule N/4 (car 1/4 = 0,25 soit 25%).
Cela nous donne un chiffre que l’on arrondit TOUJOURS AU-DESSUS, quelque soit le chiffre après la virgule.
Ainsi 4,2 sera arrondi à 5 ; 6,8 sera arrondi à 7 ; 5,1 sera arrondi à 6 etc…
Q1 est alors la VALEUR correspondant à ce chiffre.
Si par exemple on trouve 7, on prendra la 7ème valeur, si on trouve 12 on prendra la 12ème valeur.


ATTENTION !! Si N/4 = 15,2 par exemple, on arrondit à 16.
Q1 est alors la 16ème VALEUR !!
Il ne faut surtout pas dire que Q1 = 16…

Pour calculer Q3 c’est exactement le même principe mais en calculant 3N/4 et non N/4 (car 3/4 = 0,75 soit 75%).
Et comme précédemment on arrondit à l’entier supérieur quelque soit le chiffre après la virgule.
Q3 est alors la VALEUR correspondant à cet entier.

Voyons tout de suite un exemple, cela sera plus parlant. Imaginons que l’on ait la série suivante (qu’il faut évidemment classer dans l’ordre croissant) :
2 – 5 – 6 – 6 – 7 – 12 – 13 – 15 – 18 – 20 – 21 – 21 – 25

Ici N = 13.
Calculons Q1 :
N/4 = 3,25
On arrondit à 4.
Donc Q1 est la 4ème valeur, à savoir 6.
Donc Q1 = 6.

Calculons Q3 :
3N/4 = 9,75
On arrondit à 10.
Donc Q3 est la 10ème valeur, à savoir 20.
Donc Q3 = 20.


Remarque : c’est le fait de toujours arrondir à l’entier supérieur, quelque soit le chiffre après la virgule, qui permet de dire qu’il y a AU MOINS 25% (ou 75%) des valeurs qui sont inférieures ou égales à Q1 (ou Q3).

En effet, si l’on regarde Q1 = 6, on voit qu’il y a 4 valeurs inférieures ou égales à 6.
Ces 4 valeurs représentent (4/13)*100 = 31% des valeurs, donc il y a bien AU MOINS 25% des valeurs.

Si l’on regarde Q3 = 20, on voit qu’il y a 10 valeur inférieures ou égales à 20.
Ces 10 valeurs représentent (10/13)*100 = 77% des valeurs, donc il y a bien AU MOINS 75% des valeurs.

Voyons un autre exemple avec un tableau cette fois-ci.

Note 12 15 16 17 19
Effectif 3 8 7 1 7

Ici N = 26.
Calculons Q1 :
N/4 = 6,5
On arrondit à 7.
Donc Q1 est la 7ème valeur.
Pour trouver la 7ème valeur on peut faire l’ECC :

Note 12 15 16 17 19
Effectif 3 8 7 1 7
ECC 3 11 18 19 26

La 7ème valeur est 15.
Donc Q1 = 15.

Calculons Q3 :
3N/4 = 19,5.
On arrondit à 20.
Donc Q3 est la 20ème valeur.
D’après le tableau la 20ème valeur est 19.
Donc Q3 = 19.

Tu es peut-être étonné du fait que Q3 soit la dernière valeur.
En effet, dans cet exemple, 100% des valeurs sont inférieures ou égales à Q3, on est donc loin des 75%… mais ce n’est pas grave car la définition dit qu’il faut AU MOINS 75% des valeurs, sans donner de limite.
Il est donc tout à fait possible que Q3 soit la plus grande valeur, tout comme il est possible que Q1 soit la plus petite valeur, tout dépend de la répartition des valeurs.

Une fois que l’on a calculé Q1 et Q3, on peut donner l’intervalle interquartile, qui correspond tout simplement à l’intervalle [Q1 ; Q3]
Dans l’exemple précédent, Q1 = 15 et Q3 = 19, donc l’intervalle interquartile est [15 ; 19]

Par contre, il ne faut surtout pas confondre avec l’ÉCART interquartiles qui correspond à
Q3 – Q1
Dans l’exemple, l’écart interquartiles est Q3 – Q1 = 19 – 15 = 4.

Ainsi :

\(\displaystyle Intervalle \ interquartiles : [Q_1 ; Q_3] \)

\(\displaystyle Ecart \ interquartiles = Q_3 – Q_1 \)


ATTENTION à ne pas confondre les deux !!!

Diagramme en boîte

Haut de page

Une fois que l’on a calculé la médiane, Q1 et Q3, il est souvent demandé de mettre cela sous forme de diagramme, appelé diagramme en boîte, ou boîte à moustache (tu vas comprendre pourquoi ).

Pour ce diagramme nous aurons besoin de la valeur minimale, la valeur maximale, la médiane, Q1 et Q3.
On va alors faire le diagramme suivant :

Tu comprends maintenant pourquoi on appelle cela boîte à moustache : au milieu on a une boîte délimitée par les valeurs de Q1 et de Q3, avec la médiane dans la boîte.
De part et d’autre on a des moustaches, qui vont jusqu’aux valeurs minimales et maximales.


ATTENTION ! Le schéma n’est pas forcément symétrique, la médiane n’est pas forcément au milieu de la boîte.
Evidemment il faut que le schéma soit à l’échelle sinon on ne pourra pas l’interpréter correctement.

Voyons un exemple :

Note 12 13 16 17 19
ECC 3 11 18 21 26

Les notes minimales et maximales sont 12 et 19.
Si tu fais le calcul (tu le feras pour t’entraîner ), tu trouveras :
Me = 16, Q1 = 13 et Q3 = 17.
On a donc le diagramme suivant :

Remarque : pas besoin d’écrire Min, Q1, Me, Q3 et Max sur le graphique, c’est sous-entendu^^

Bon c’est bien beau ce graphique, mais à quoi ça sert ??
On a vu que Q1, Me et Q3 séparaient la série en 4 parts, mais attention celles-ci ne sont pas forcément égales !!
On peut dire en général qu’il y a environ 25% des valeurs de la série dans chacune des 4 parts :

Bien sûr cela n’est pas une science exacte car c’est environ 25%, mais cela peut permettre de bien interpréter la répartition dans certains cas.
Prenons ces diagrammes, où les valeurs représentent les notes d’une classe :

Déjà, les notes maximales et minimales sont les mêmes.
En revanche, alors que la 1ère classe semble avoir un niveau homogène, la 2ème classe a un meilleur niveau (environ 75% des élèves ont entre 16 et 19, et environ 25% entre 12 et 16), allors que la 3ème classe semble avoir un niveau plus faible (environ 75% des élèves ont entre 12 et 15, et environ 25% entre 15 et 19)

Tout cela reste assez subjectif, ce pourquoi il n’est pas souvent demandé d’interpréter les diagrammes en boîte car plusieurs réponses sont possibles.

Cette première partie est maintenant terminée, mais le cours n’est pas fini !
Dans la deuxième partie du cours sur les statistiques, nous verrons la variance et l’écart-type (qui sont un peu plus long à calculer que la moyenne), ainsi que l’aspect graphique des statistiques, avec les différents types de représentation graphique et leur utilisation.
Mais avant cela tu peux d’ores et déjà faire les exercices sur ce que l’on vient de voir dans ce cours !

Exercices

Haut de page

Tu trouveras tous les exercices disponibles sur les statistiques en cliquant ici !

Retour au cours de PremièreRetour au cours de TerminaleRemonter en haut de la page