Sommaire
IPrésentation des séries statistiquesAVocabulaireBLes séries statistiquesCLes séries statistiques regroupées en classesIILes paramètres de position d'une série statistiqueALa moyenneBLa médianeIIILes paramètres de dispersion d'une série statistiqueALes quartiles : une approche de la dispersion autour de la médianeBL'étendue : valeurs extrêmesIVLes représentations graphiquesALes diagrammes en bâtonsBLes histogrammesCLe diagramme circulairePrésentation des séries statistiques
Vocabulaire
Population
Une population est un ensemble d'individus.
Les enfants nés à Paris en 2000 représentent une population par exemple.
Les voitures produites dans une usine au cours du mois de février 2010 représentent également une population.
Echantillon d'une population
Lorsque l'effectif d'une population est trop important, on étudie ses caractères à partir d'un échantillon représentatif.
Si on veut par exemple étudier l'ensemble de la population française, il est préférable d'étudier un échantillon de cette population car l'effectif est trop grand.
Caractère
Un caractère est une caractéristique qui définit les individus d'une population, et dont les valeurs sont différentes d'un individu à un autre de la population.
La couleur, la taille, le poids, l'âge, la date de production sont des exemples de caractères.
Caractère quantitatif ou qualitatif
Un caractère peut être quantitatif, si ses valeurs sont numériques, ou qualitatif, si ses valeurs ne sont pas numériques.
La taille est un caractère quantitatif alors que la couleur des yeux est un caractère qualitatif.
Les séries statistiques
Série statistique
Une série statistique est la suite des valeurs de chaque individu d'une population pour un caractère donné.
La série statistique représentant les pointures de chaussures d'un groupe de 10 amis est : 38 - 39 - 39 - 40 - 41 - 43 - 43 - 43 - 43 - 45.
Effectif total
L'effectif total d'une série statistique correspond au nombre d'individus de la population étudiée.
Si la population étudiée est l'ensemble des élèves d'une classe de 35 élèves, alors l'effectif total est 35.
On regroupe en général une série statistique par valeurs identiques au sein d'un tableau, qui précise l'effectif de chaque valeur, c'est-à-dire le nombre d'individus présentant chaque valeur. Pour chaque valeur, on peut alors calculer également la fréquence, égale à l'effectif de la valeur divisé par l'effectif total.
- La somme de la ligne des effectifs est égale à l'effectif total de la série.
- La somme de la ligne des fréquences est égale à 1.
Dans un sac de 60 billes, on trouve 12 billes rouges, 28 billes bleues, 7 billes vertes et 13 billes jaunes.
On a donc les fréquences suivantes :
- la fréquence des billes rouges est \dfrac{12}{60} soit \dfrac{1}{5}
- la fréquence des billes bleues est \dfrac{28}{60} soit \dfrac{7}{15}
- la fréquence des billes vertes est \dfrac{7}{60}
- la fréquence des billes jaunes est \dfrac{13}{60}
On a donc le tableau suivant :
Couleur | Rouge | Bleu | Vert | Jaune | TOTAL |
---|---|---|---|---|---|
Effectif | 12 | 28 | 7 | 13 | 60 |
Fréquence | \dfrac{1}{5} | \dfrac{7}{15} | \dfrac{7}{60} | \dfrac{13}{60} | 1 |
Les séries statistiques regroupées en classes
Série statistique en classes
Une série statistique regroupée en classes est une série statistique dont les valeurs sont regroupées par intervalles.
Taille x (en cm) | 10 \leq x \lt 20 | 20 \leq x \lt 25 | 25 \leq x \lt 40 | 40 \leq x \leq 50 |
---|---|---|---|---|
Effectif | 11 | 8 | 16 | 3 |
Les paramètres de position d'une série statistique
La moyenne
Moyenne
La moyenne d'une série quantitative est égale à la somme des valeurs de la série divisée par l'effectif total.
Voici les notes obtenues par les 32 élèves d'une classe au dernier contrôle de maths :
5 - 8 - 8 - 8 - 9 - 9 - 9 - 9 - 9 - 10 - 10 - 10 - 10 - 10 - 10 - 10,5 - 10,5 - 11 - 11 - 11 - 11 - 11 - 13 - 13 - 13 - 13 - 13 - 13 - 14 - 14,5 - 14,5 - 16
La moyenne de ce contrôle est égale à la somme de toutes ces notes, divisée par le nombre de notes, c'est-à-dire par 32 :
m = \dfrac{347}{32} \approx 10{,}8 (arrondie au dixième).
On peut uniquement calculer la moyenne des séries statistiques quantitatives et pas celle des séries statistiques qualitatives.
Par exemple, on ne peut pas calculer la moyenne de la couleur des yeux des élèves, du sport pratiqué,...
Pour calculer plus facilement une moyenne, on peut utiliser la formule de la moyenne pondérée :
- on multiplie chaque valeur par son effectif
- on calcule la somme de ces produits
- on divise enfin cette somme par l'effectif total
Le tableau d'effectifs suivant présente les notes obtenues par un groupe d'élèves :
Note | 5 | 8 | 9 | 10 | 10,5 | 11 | 13 | 14 | 14,5 | 16 |
---|---|---|---|---|---|---|---|---|---|---|
Nombre d'élèves | 1 | 3 | 5 | 6 | 2 | 5 | 6 | 1 | 2 | 1 |
On peut ainsi calculer facilement la moyenne pondérée :
m = \dfrac{5 \times 1 + 8 \times 3 + 9 \times 5 + 10 \times 6 + 10{,}5 \times 2 + 11 \times 5 + 13 \times 6 + 14 \times 1 + 14{,}5 \times 2 + 16 \times 1}{32} \approx 10{,}8 (arrondie au dixième)
Cette méthode de calcul de la moyenne est plus appropriée lorsque la série statistique est présentée sous forme de tableau.
Pour une série regroupée en classes, on prend les valeurs centrales des classes pour calculer la moyenne.
On considère la série statistique suivante :
Taille x (en cm) | 10 \leq x \lt 20 | 20 \leq x \lt 25 | 25 \leq x \lt 40 | 40 \leq x \leq 50 |
---|---|---|---|---|
Centre de la classe (cm) | 15 | 22,5 | 32,5 | 45 |
Effectif | 11 | 8 | 16 | 3 |
La moyenne des tailles est donc :
m=\dfrac{15\times11+22{,}5\times8+32{,}5\times16+45\times3}{11+8+16+3}\approx26{,}3 cm (arrondie au dixième).
La médiane
Médiane
On appelle médiane d'une série rangée par ordre croissant la valeur d'une série qui la partage en deux populations de même effectif.
On considère une série dont les valeurs des n individus sont rangées par ordre croissant.
- Si n est impair, la médiane est égale à la \dfrac{n+1}{2}^{\text{ème}} valeur de la série ordonnée.
- Si n est pair, on assimile la médiane au nombre central situé entre la \dfrac{n}{2}^{\text{ème}} valeur et la \dfrac{n}{2}+ 1 ^{\text{ème}} valeur.
On considère la série d'effectif 7 suivante : 3, 5, 6, 11, 14, 21, 27
7 est impair et \dfrac{7+1}{2}=4.
La médiane est donc la 4e valeur de la série soit 11.
On considère la série d'effectif 6 suivante : 12, 13, 14, 19, 31, 41.
6 est pair et \dfrac{6}{2}=3.
La médiane est donc égale à la moyenne du 3e et 4e éléments de la série soit \dfrac{14+19}{2}.
La médiane de la série est donc 16,5.
La médiane n'est pas toujours une valeur observée dans la série statistique.
Les paramètres de dispersion d'une série statistique
Les quartiles : une approche de la dispersion autour de la médiane
Quartiles
Dans une série rangée par ordre croissant, les premier, deuxième et troisième quartiles sont les valeurs qui la partagent en quatre populations de même effectif.
Alors que la médiane n'est pas toujours une valeur observée, les quartiles sont toujours des valeurs observées.
Premier quartile
Le premier quartile est la plus petite valeur de la série telle qu'au moins 25% de l'effectif lui soit inférieur ou égal.
On considère la série d'effectif 8 suivante : 3, 5, 6, 11, 14, 21, 27, 30.
Comme \dfrac{25}{100}\times8=2, le premier quartile de cette série est son deuxième élément soit 5.
On considère la série d'effectif 10 suivante :12, 13, 14, 19, 20, 22, 24, 31, 41, 46.
Comme \dfrac{25}{100}\times10=2{,}5, le premier quartile de cette série est son troisième élément, soit 14.
Deuxième quartile
Le deuxième quartile est la plus petite valeur de la série telle qu'au moins 50% de l'effectif lui soit inférieur ou égal.
On considère la série d'effectif 8 suivante : 3, 5, 6, 11, 14, 21, 27, 30.
Comme \dfrac{50}{100}\times8=4, le deuxième quartile de cette série est son quatrième élément soit 11.
On considère la série d'effectif 9 suivante :12, 13, 14, 19, 20, 22, 24, 31, 41.
Comme \dfrac{50}{100}\times9=4{,}5, le deuxième quartile de cette série est son cinquième élément, soit 20.
Si l'effectif de la série est impair, le deuxième quartile est égal à la médiane.
Attention, ce n'est pas le cas si l'effectif de la série est pair.
Troisième quartile
Le troisième quartile est la plus petite valeur de la série telle qu'au moins 75% de l'effectif lui soit inférieur ou égal.
On considère la série d'effectif 8 suivante : 3, 5, 6, 11, 14, 21, 27, 30.
Comme \dfrac{75}{100}\times8=6, le troisième quartile de cette série est son sixième élément soit 21.
On considère la série d'effectif 10 suivante :12, 13, 14, 19, 20, 22, 24, 31, 41, 46.
Comme \dfrac{75}{100}\times10=7{,}5, le troisième quartile de cette série est son huitième élément, soit 31.
L'étendue : valeurs extrêmes
Etendue
L'étendue d'une série quantitative est égale à la différence entre la plus grande valeur et la plus petite valeur de la série.
Le tableau d'effectifs suivant présente les notes obtenues par un groupe d'élèves :
Note | 5 | 8 | 9 | 10 | 10,5 | 11 | 13 | 14 | 14,5 | 16 |
---|---|---|---|---|---|---|---|---|---|---|
Nombre d'élèves | 1 | 3 | 5 | 6 | 2 | 5 | 6 | 1 | 2 | 1 |
Les notes vont de 5 à 16. L'étendue de la série est donc égale à 16 - 5 = 11.
Les représentations graphiques
Les diagrammes en bâtons
Diagramme en bâtons
Pour représenter une série non regroupée en classes, on peut construire un diagramme en bâtons : on associe un bâton à chacune des valeurs distinctes de la série, dont la hauteur est proportionnelle à l'effectif.
On considère la série statistique suivante :
Couleur | Rouge | Bleu | Vert | Jaune |
---|---|---|---|---|
Effectif | 12 | 28 | 7 | 13 |
Le diagramme en bâtons suivant représente la série de ce tableau, où un carreau en hauteur est égal à un effectif de 4.
Les histogrammes
Histogramme
Pour représenter une série regroupée en classes, on peut construire un histogramme : on associe un rectangle à chacune des classes de la série, dont l'aire est proportionnelle à l'effectif.
On considère la série statistique suivante :
Taille (en cm) | 10 \leq x \lt 20 | 20 \leq x \lt 30 | 30 \leq x \lt 40 | 40 \leq x \leq 50 |
---|---|---|---|---|
Effectif | 12 | 8 | 16 | 4 |
L'histogramme suivant représente la série de ce tableau, où un carreau en abscisse est égal à 5 cm et l'aire d'un carreau est égale à un effectif de 1.
Le diagramme circulaire
Diagramme circulaire
Pour représenter une série statistique, on peut construire un diagramme circulaire. L'angle des portions est proportionnel aux effectifs.
Les douze garçons d'une classe ont le choix entre le foot, le basket, le tennis et le volley. Voici la répartition des choix sous forme de diagramme circulaire. Pour obtenir la mesure de l'angle, on multiplie la fréquence de la valeur par 360.
Sport choisi | Foot | Basket | Tennis | Volley |
---|---|---|---|---|
Nombre de garçons | 4 | 3 | 3 | 2 |
Fréquence | \dfrac{4}{12} | \dfrac{3}{12} | \dfrac{3}{12} | \dfrac{2}{12} |
Angle | \dfrac{4}{12} \times 360 = 120^\circ | \dfrac{3}{12} \times 360 = 90^\circ | \dfrac{3}{12} \times 360 = 90^\circ | \dfrac{2}{12} \times 360 = 60^\circ |
Pour les garçons faisant du foot : 4\times\dfrac{360}{12}=120°.