Sommaire
ILes caractéristiques de positionALa moyenneBLes médianesIIUne caractéristique de dispersion : l'étendueIIIVers une autre caractéristique de dispersion : l'écart interquartileLes caractéristiques de position
La moyenne
Moyenne
La moyenne d'une série statistique discrète, souvent notée m, se calcule en additionnant toutes les valeurs puis en divisant par l'effectif total.
Voici les notes obtenues par les 32 élèves d'une classe au dernier contrôle de maths :
5 - 8 - 8 - 8 - 9 - 9 - 9 - 9 - 9 - 10 - 10 - 10 - 10 - 10 - 10 - 10,5 - 10,5 - 11 - 11 - 11 - 11 - 11 - 13 - 13 - 13 - 13 - 13 - 13 - 14 - 14,5 - 14,5 - 16
La moyenne de ce contrôle est égale à la somme de toutes ces notes, divisée par le nombre de notes, c'est-à-dire par 32 :
m = \dfrac{347}{32} \approx 10{,}8 (arrondie au dixième).
On peut uniquement calculer la moyenne des séries statistiques dont les valeurs sont des nombres (et pas des sports, des couleurs, etc.), c'est-à-dire des séries quantitatives.
Pour les séries quantitatives continues (valeurs rangées en classes), on détermine une valeur approchée de la moyenne en remplaçant chaque classe par son centre.
On considère la série statistique suivante :
Taille x (en cm) | 10 \leq x \lt 20 | 20 \leq x \lt 25 | 25 \leq x \lt 40 | 40 \leq x \leq 50 |
---|---|---|---|---|
Centre de la classe (cm) | 15 | 22,5 | 32,5 | 45 |
Effectif | 11 | 8 | 16 | 3 |
Une valeur approchée de la moyenne des tailles est donc :
m\approx\dfrac{15\times11+22{,}5\times8+32{,}5\times16+45\times3}{11+8+16+3}\approx26{,}3 cm (arrondie au dixième).
Moyenne pondérée
La moyenne pondérée d'une série de données est égale au quotient de la somme des produits de chaque valeur par son effectif et de l'effectif total.
\text{Moyenne pondérée}=\dfrac{\text{Somme des produits des valeurs par leur effectif}}{\text{Effectif total}}
Le tableau d'effectifs suivant présente les notes obtenues par un groupe d'élèves :
Note | 5 | 8 | 9 | 10 | 10,5 | 11 | 13 | 14 | 14,5 | 16 |
---|---|---|---|---|---|---|---|---|---|---|
Nombre d'élèves | 1 | 3 | 5 | 6 | 2 | 5 | 6 | 1 | 2 | 1 |
On peut ainsi calculer la moyenne pondérée arrondie au dixième :
m = \dfrac{5 \times 1 + 8 \times 3 + 9 \times 5 + 10 \times 6 + 10{,}5 \times 2 + 11 \times 5 + 13 \times 6 + 14 \times 1 + 14{,}5 \times 2 + 16 \times 1}{32} \approx 10{,}8
Dans cette dernière formule, on peut remplacer "effectifs" par "fréquences" et "effectif total" par "fréquence totale".
Les médianes
Médiane
On appelle médiane d'une série rangée par ordre croissant toute valeur de la série qui la partage en deux populations de même effectif.
On considère une série dont les valeurs des n individus sont rangées par ordre croissant.
- Si n est impair, une médiane est égale à la \dfrac{n+1}{2}^{\text{ème}} valeur de la série ordonnée.
- Si n est pair, on choisit comme médiane le nombre central situé entre la \dfrac{n}{2}^{\text{ème}} valeur et la \left(\dfrac{n}{2}+ 1\right) ^{\text{ème}} valeur.
On considère la série d'effectif 7 suivante : 3, 5, 6, 11, 14, 21, 27
7 est impair et \dfrac{7+1}{2}=4.
Une médiane est donc la 4e valeur de la série soit 11.
On considère la série d'effectif 6 suivante : 12, 13, 14, 19, 31, 41.
6 est pair et \dfrac{6}{2}=3.
Une médiane est donc égale à la moyenne du 3e et 4e éléments de la série soit \dfrac{14+19}{2}.
Une médiane de la série est donc 16,5.
Un tableau des effectifs cumulés croissants peut aider à déterminer une médiane.
Pour déterminer une médiane dans le cas d'une série statistique quantitative continue :
- On peut utiliser un graphique des effectifs cumulés croissants. Une fois le graphique tracé, on lit ensuite la valeur correspondant à un effectif cumulé croissant de \dfrac{n+1}{2} si n est impair, et entre la \dfrac{n}{2} ème et la \dfrac{n}{2}+1 ème valeur si n est pair.
- On peut également utiliser un graphique des fréquences cumulées croissantes. Une fois le graphique tracé, on lit la valeur correspondant à une fréquence cumulée croissante de 50%.
Une caractéristique de dispersion : l'étendue
Étendue
L'étendue d'une série quantitative est égale à la différence entre la plus grande valeur et la plus petite valeur de la série.
Le tableau d'effectifs suivant présente les notes obtenues par un groupe d'élèves :
Note | 5 | 8 | 9 | 10 | 10,5 | 11 | 13 | 14 | 14,5 | 16 |
---|---|---|---|---|---|---|---|---|---|---|
Nombre d'élèves | 1 | 3 | 5 | 6 | 2 | 5 | 6 | 1 | 2 | 1 |
Les notes vont de 5 à 16. L'étendue de la série est donc égale à 16 - 5 = 11.
Dans le cas d'une série continue, on considère que la plus grande valeur de la série est la borne supérieure du dernier intervalle et la plus petite valeur, la borne inférieure du premier intervalle.
Vers une autre caractéristique de dispersion : l'écart interquartile
Premier quartile
Le premier quartile est la plus petite valeur de la série telle qu'au moins 25% de l'effectif lui soit inférieur ou égal. On le note souvent Q_1.
On considère la série d'effectif 8 suivante : 3, 5, 6, 11, 14, 21, 27, 30.
Comme \dfrac{25}{100}\times8=2, le premier quartile de cette série est son deuxième élément soit 5.
On considère la série d'effectif 10 suivante :12, 13, 14, 19, 20, 22, 24, 31, 41, 46.
Comme \dfrac{25}{100}\times10=2{,}5, le premier quartile de cette série est son troisième élément, soit 14.
Troisième quartile
Le troisième quartile est la plus petite valeur de la série telle qu'au moins 75% de l'effectif lui soit inférieur ou égal. On le note souvent Q_3.
On considère la série d'effectif 8 suivante : 3, 5, 6, 11, 14, 21, 27, 30.
Comme \dfrac{75}{100}\times8=6, le troisième quartile de cette série est son sixième élément soit 21.
On considère la série d'effectif 10 suivante : 12, 13, 14, 19, 20, 22, 24, 31, 41, 46.
Comme \dfrac{75}{100}\times10=7{,}5, le troisième quartile de cette série est son huitième élément, soit 31.
Les premier et troisième quartiles sont des caractéristiques de position.
Écart interquartile
On appelle écart interquartile l'écart entre le premier et le troisième quartile, soit :
\text{écart interquatile}=Q_3-Q_1
On considère de nouveau la série d'effectif 8 suivante : 3, 5, 6, 11, 14, 21, 27, 30. On sait que :
- Q_1=5
- Q_3=21
Ainsi, l'écart interquartile de cette série vaut :
21-5=16
L'écart interquartile est une caractéristique de dispersion.