Sommaire
ILes séries statistiquesADéfinitionsBLes valeurs et les effectifsCLes valeurs données en classesIILa fréquenceIIILes caractéristiques de position : la moyenne et la médianeALa moyenneBLa médiane1Définition2L'utilisation des effectifs cumulés croissants pour déterminer la médiane3L'utilisation des fréquences cumulées croissantes pour déterminer la médianeIVUne caractéristique de dispersion : l'étendueVLes représentations d'une série statistiqueALe diagramme en bâtons (ou en barres)BLe diagramme circulaire ou semi-circulaireCL'histogrammeLes séries statistiques
Une série statistique est la suite des valeurs que prend un caractère au sein d'une population. On étudie ce caractère par le biais des différentes valeurs qu'il peut prendre. En fonction du caractère et de ces valeurs, la série statistique peut prendre plusieurs noms.
Définitions
Une série statistique peut être quantitative ou qualitative. On parle aussi de série statistique discrète quand les différentes valeurs du caractère étudié sont isolées les unes des autres.
Série statistique
Une série statistique est la suite des valeurs que prend un caractère au sein d'une population.
Voici le sport choisi par les douze garçons d'une classe qui avaient le choix entre le foot, le basket, le tennis et le volley :
« tennis ; tennis ; basket ; foot ; basket ; foot ; volley ; foot ; foot ; tennis ; basket ; volley ».
Il s'agit de la série statistique décrivant la valeur du caractère « le sport choisi » au sein de la population « les garçons de la classe ».
Série quantitative
On dit qu'une série statistique est une série quantitative lorsque le caractère étudié prend des valeurs numériques.
La série des tailles des élèves d'une classe de 4e est une série quantitative car le caractère étudié (la taille) prend des valeurs numériques.
Lorsqu'une série statistique n'est pas quantitative, on dit qu'elle est qualitative.
Les valeurs du caractère ne sont pas numériques, on ne pourra donc pas effectuer de calculs à partir de ces valeurs.
La série statistique décrivant la valeur du caractère « le sport choisi » au sein de la population « les garçons de la classe » n'est pas une série quantitative.
Série statistique discrète
On dit qu'une série statistique est une série statistique discrète lorsque le caractère étudié prend des valeurs numériques isolées (c'est-à-dire distinctes) les unes des autres.
La série statistique des notes d'une classe de 3ème au dernier contrôle de Mathématiques est une série statistique discrète.
Les valeurs numériques sont des valeurs isolées les unes des autres si on les place sur un axe gradué.
Les valeurs et les effectifs
Le caractère étudié peut avoir plusieurs valeurs, dont les nombres d'apparition sont les effectifs. On distingue effectif total et effectif cumulé croissant : l'effectif total est la somme des effectifs d'une série statistique ; l'effectif cumulé croissant d'une valeur de la série est le nombre de valeurs inférieures ou égales à la valeur considérée.
On présente souvent les résultats d'une étude statistique sous forme de tableau. La première ligne recense les différentes valeurs de la série et la seconde ligne affiche l'effectif correspondant à chaque valeur.
La série statistique décrivant la valeur du caractère « le sport choisi » au sein de la population « les garçons de la classe » peut être représentée par le tableau suivant :
Sport choisi | Foot | Basket | Tennis | Volley |
---|---|---|---|---|
Nombre de garçons | 4 | 3 | 3 | 2 |
Effectif
L'effectif d'une valeur d'une série statistique est le nombre d'apparitions de cette valeur dans la série.
On considère la série statistique : « tennis ; tennis ; basket ; foot ; basket ; foot ; volley ; foot ; foot ; tennis ; basket ; volley ».
Dans cette série, la valeur « foot » a pour effectif 4 car elle apparaît 4 fois.
Effectif total
La somme des effectifs d'une série statistique est égale à l'effectif total.
On considère la série statistique : « tennis ; tennis ; basket ; foot ; basket ; foot ; volley ; foot ; foot ; tennis ; basket ; volley ».
Sport choisi | Foot | Basket | Tennis | Volley |
---|---|---|---|---|
Nombre de garçons | 4 | 3 | 3 | 2 |
L'effectif total, qui correspond au nombre de garçons de la classe, est égal à :
4 + 3 + 3 + 2 = 12
Effectif cumulé croissant
On considère une série statistique quantitative.
On appelle « effectif cumulé croissant » d'une valeur de la série le nombre de valeurs inférieures ou égales à la valeur considérée.
Le tableau statistique suivant donne la répartition des notes dans une classe :
Note | 8 | 11 | 13 | 16 |
---|---|---|---|---|
Effectif | 8 | 13 | 14 | 3 |
Effectif cumulé croissant | 8 | 21 | 35 | 38 |
On peut calculer les effectifs cumulés croissants :
- La valeur 8 a un effectif cumulé croissant de 8 car il y a 8 valeurs inférieures ou égales à 8 (uniquement les valeurs égales à 8).
- La valeur 11 a un effectif cumulé croissant de 21 car il y a 21 valeurs inférieures ou égales à 11 (les valeurs égales à 8 et celles égales à 11).
- La valeur 13 a un effectif cumulé croissant de 35 car il y a 35 valeurs inférieures ou égales à 13 (les valeurs égales à 8, celles égales à 11 et celles égales à 13).
- La valeur 16 a un effectif cumulé croissant de 38 car il y a 38 valeurs inférieures ou égales à 16 (toutes les valeurs sont inférieures ou égales à 16).
Les valeurs données en classes
Lorsque les valeurs possibles sont trop nombreuses, elles sont regroupées par intervalles, que l'on appelle « classes ». On parle de série statistique continue.
Dans certaines séries statistiques dont le caractère étudié prend des valeurs numériques, on peut regrouper les valeurs dans des intervalles.
Ces intervalles sont appelés « classes » et l'on peut calculer l'effectif de chaque classe.
On peut regrouper les employés d'une entreprise par classe de taille en centimètres.
Taille (cm) | \left[ 150;155 \right[ | \left[ 155;160 \right[ | \left[ 160;165 \right[ | \left[ 165;170 \right[ | \left[ 170;175 \right[ | \left[ 175;180 \right] |
---|---|---|---|---|---|---|
Effectif | 3 | 10 | 11 | 18 | 13 | 8 |
Série statistique continue
Lorsque les valeurs du caractère étudié dans une série statistique sont regroupées en classes, on dit que la série est une série statistique continue.
Lorsqu'on regroupe les employés d'une entreprise par classe de taille en centimètres, on étudie une série statistique continue, telle que représentée dans le tableau suivant :
Taille (cm) | \left[ 150;155 \right[ | \left[ 155;160 \right[ | \left[ 160;165 \right[ | \left[ 165;170 \right[ | \left[ 170;175 \right[ | \left[ 175;180 \right] |
---|---|---|---|---|---|---|
Effectif | 3 | 10 | 11 | 18 | 13 | 8 |
La fréquence
La fréquence permet de comparer le caractère fréquent d'une valeur par rapport aux autres.
Fréquence
La fréquence d'une valeur (ou d'une classe) d'une série statistique est égale à :
f = \dfrac{\text{Effectif de la valeur (ou de la classe)}}{\text{Effectif total}}
On considère la série statistique donnant le sport choisi par les douze garçons d'une classe :
Sport choisi | Foot | Basket | Tennis | Volley |
---|---|---|---|---|
Nombre de garçons | 4 | 3 | 3 | 2 |
La fréquence des garçons ayant choisi le basket est \dfrac{3}{12}.
Une fréquence peut être donnée en fraction réduite ou en valeur décimale (seulement si la valeur est exacte ou si l'on demande une valeur arrondie).
Dans l'exemple précédent, la fréquence des garçons ayant choisi le basket est :
\dfrac{3}{12}=\dfrac{1}{4}=0{,}25
Une fréquence est toujours un nombre compris entre 0 et 1.
Dans l'exemple précédent, la fréquence des garçons ayant choisi le basket est \dfrac{3}{12}.
On a :
\dfrac{0}{12}\leq \dfrac{3}{12}\leq \dfrac{12}{12}
Donc :
0\leq \dfrac{3}{12}\leq 1
La somme de toutes les fréquences d'une série est égale à 1.
On ajoute une ligne au tableau de la série statistique précédente pour visualiser la fréquence de chaque sport :
Sport choisi | Foot | Basket | Tennis | Volley |
---|---|---|---|---|
Nombre de garçons | 4 | 3 | 3 | 2 |
Fréquence | \dfrac{4}{12} | \dfrac{3}{12} | \dfrac{3}{12} | \dfrac{2}{12} |
On a bien :
\dfrac{4}{12} + \dfrac{3}{12} + \dfrac{3}{12} + \dfrac{2}{12} = \dfrac{4+3+3+2}{12} = \dfrac{12}{12} = 1
Les caractéristiques de position : la moyenne et la médiane
Lorsque plusieurs séries statistiques correspondent à l'étude d'un même caractère sur une même population ou sur une autre population, on peut comparer les valeurs des séries. Plutôt que de comparer les valeurs une à une, certains indicateurs permettent de comparer des résultats calculés à partir des données des séries. La moyenne et la médiane font partie de ces indicateurs.
La moyenne
Calculer la moyenne d'une série statistique permet de comparer des séries entre elles.
Moyenne
La moyenne d'une série statistique discrète, souvent notée m, se calcule en additionnant toutes les valeurs puis en divisant par l'effectif total.
Voici les notes obtenues par les 32 élèves d'une classe au dernier contrôle de maths :
5 ; 8 ; 8 ; 8 ; 9 ; 9 ; 9 ; 9 ; 9 ; 10 ; 10 ; 10 ; 10 ; 10 ; 10 ; 10,5 ; 10,5 ; 11 ; 11 ; 11 ; 11 ; 11 ; 13 ; 13 ; 13 ; 13 ; 13 ; 13 ; 14 ; 14,5 ; 14,5 ; 16.
La moyenne de ce contrôle est égale à la somme de toutes ces notes, divisée par le nombre de notes, c'est-à-dire par 32 :
m = \dfrac{347}{32} \approx 10{,}8 (arrondi au dixième)
On peut uniquement calculer la moyenne des séries statistiques dont les valeurs sont des nombres (et non des sports, des couleurs, etc.), c'est-à-dire des séries quantitatives.
Pour les séries quantitatives continues (valeurs rangées en classes), on détermine une valeur approchée de la moyenne en remplaçant chaque classe par son centre.
On considère la série statistique suivante :
Taille x (en cm) | 10 \leq x \lt 20 | 20 \leq x \lt 25 | 25 \leq x \lt 40 | 40 \leq x \leq 50 |
---|---|---|---|---|
Centre de la classe (cm) | 15 | 22,5 | 32,5 | 45 |
Effectif | 11 | 8 | 16 | 3 |
Une valeur approchée de la moyenne des tailles est donc :
m\approx\dfrac{15\times11+22{,}5\times8+32{,}5\times16+45\times3}{11+8+16+3}\approx26{,}3\text{ cm} (arrondie au dixième)
Moyenne pondérée
La moyenne pondérée d'une série de données est égale au quotient de la somme des produits de chaque valeur par son effectif et de l'effectif total.
\text{Moyenne pondérée}=\dfrac{\text{Somme des produits des valeurs par leur effectif}}{\text{Effectif total}}
Le tableau d'effectifs suivant présente les notes obtenues par un groupe d'élèves :
Note | 5 | 8 | 9 | 10 | 10,5 | 11 | 13 | 14 | 14,5 | 16 |
---|---|---|---|---|---|---|---|---|---|---|
Nombre d'élèves | 1 | 3 | 5 | 6 | 2 | 5 | 6 | 1 | 2 | 1 |
On peut ainsi calculer la moyenne pondérée arrondie au dixième :
m = \dfrac{5 \times 1 + 8 \times 3 + 9 \times 5 + 10 \times 6 + 10{,}5 \times 2 + 11 \times 5 + 13 \times 6 + 14 \times 1 + 14{,}5 \times 2 + 16 \times 1}{32} \approx 10{,}8
Dans cette dernière formule, on peut remplacer « effectifs » par « fréquences » et « effectif total » par « fréquence totale ».
La médiane
La médiane est une autre caractéristique de position : dans une série statistique rangée par ordre croissant, elle est la valeur qui sépare cette série en deux séries de même effectif. Un tableau et un graphique des effectifs cumulés croissants ou des fréquences cumulées croissantes peuvent aider à la déterminer.
Définition
La médiane d'une série statistique rangée par ordre croissant est la valeur qui partage cette série en deux séries de même effectif.
Médiane
On appelle « médiane » d'une série rangée par ordre croissant toute valeur de la série qui la partage en deux populations de même effectif.
On considère une série dont les valeurs des n individus sont rangées par ordre croissant.
- Si n est impair, une médiane est égale à la \dfrac{n+1}{2}^{\text{ème}} valeur de la série ordonnée.
- Si n est pair, on choisit comme médiane le nombre central situé entre la \dfrac{n}{2}^{\text{ème}} valeur et la \left(\dfrac{n}{2}+ 1\right) ^{\text{ème}} valeur.
-
On considère la série d'effectif 7 suivante :
3 ; 5 ; 6 ; 11 ; 14 ; 21 ; 27.7 est impair et \dfrac{7+1}{2}=4.
Une médiane est donc la 4e valeur de la série soit 11.
-
On considère la série d'effectif 6 suivante :
12 ; 13 ; 14 ; 19 ; 31 ; 41.6 est pair et \dfrac{6}{2}=3.
Une médiane est donc égale à la moyenne des 3e et 4e éléments de la série soit \dfrac{14+19}{2}.
Une médiane de la série est donc 16,5.
L'utilisation des effectifs cumulés croissants pour déterminer la médiane
On peut utiliser un tableau et un graphique des effectifs cumulés croissants pour déterminer une médiane.
Pour déterminer une médiane dans le cas d'une série statistique quantitative continue, on peut utiliser un tableau et un graphique des effectifs cumulés croissants.
Une fois le graphique tracé, on lit ensuite la valeur correspondant à un effectif cumulé croissant de \dfrac{n+1}{2} si n est impair, et entre la \dfrac{n}{2}^{\text{ème}} et la \dfrac{n}{2}+1^{\text{ème}} valeur si n est pair.
Voici le montant des achats de chaque client dans un magasin sur une semaine :
Dépense en € | ]0;40] | ]40;80] | ]80;100] | ]100;200] |
Nombre de clients | 350 | 320 | 210 | 120 |
Lorsqu'on détermine les effectifs cumulés croissants, on obtient :
Dépense en € | ]0;40] | ]40;80] | ]80;100] | ]100;200] |
Nombre de clients | 350 | 320 | 210 | 120 |
Effectif cumulé croissant | 350 | 670 | 880 | 1 000 |
Pour tracer le graphique des effectifs cumulés croissants, les effectifs cumulés croissants correspondent aux bornes supérieures des intervalles.
En effet, on a 350 clients dont la dépense est inférieure ou égale à 40 €, 670 clients dont la dépense est inférieure ou égale à 80 €, etc.
On obtient donc :
Ici, l'effectif total est pair et égal à 1 000.
Les médianes sont donc situées entre les 500e et 501e valeurs.
Sur l'axe des ordonnées, on se place entre 500 et 501 (ce qui est très proche ici).
On cherche sur la courbe des effectifs cumulés croissants le point qui possède cette ordonnée.
On lit ensuite l'abscisse de ce point.
On vient de déterminer une médiane.
Ici 58,75 est une médiane de la série.
L'utilisation des fréquences cumulées croissantes pour déterminer la médiane
On peut utiliser un tableau et un graphique des fréquences cumulées croissantes pour déterminer une médiane.
Pour déterminer une médiane dans le cas d'une série statistique quantitative continue, on peut également utiliser un tableau et un graphique des fréquences cumulées croissantes. Une fois le graphique tracé, on lit la valeur correspondant à une fréquence cumulée croissante de 50 %.
On reprend l'exemple précédent.
Le tableau des fréquences cumulées croissantes est le suivant :
Dépense en € | ]0;40] | ]40;80] | ]80;100] | ]100;200] |
Nombre de clients | 350 | 320 | 210 | 120 |
Fréquence | 0,35 | 0,32 | 0,21 | 0,12 |
Fréquence cumulée croissante (en %) | 35 | 67 | 88 | 100 |
On trace le graphique des fréquences cumulées croissantes comme on a tracé celui des effectifs cumulés croissants.
On obtient :
On cherche l'abscisse du point de la courbe des fréquences cumulées croissantes qui a pour ordonnée 50 %.
On retrouve le fait que 58,75 est une médiane de la série.
Une caractéristique de dispersion : l'étendue
L'étendue est une caractéristique permettant d'obtenir une information sur la dispersion plus ou moins grande des valeurs d'une série statistique. Elle est égale à la différence entre la plus grande et la plus petite valeur de la série.
Étendue
L'étendue d'une série quantitative est égale à la différence entre la plus grande valeur et la plus petite valeur de la série.
Le tableau d'effectifs suivant présente les notes obtenues par un groupe d'élèves :
Note | 5 | 8 | 9 | 10 | 10,5 | 11 | 13 | 14 | 14,5 | 16 |
---|---|---|---|---|---|---|---|---|---|---|
Nombre d'élèves | 1 | 3 | 5 | 6 | 2 | 5 | 6 | 1 | 2 | 1 |
Les notes vont de 5 à 16.
L'étendue de la série est donc égale à :
16 - 5 = 11
Dans le cas d'une série continue, on considère que la plus grande valeur de la série est la borne supérieure du dernier intervalle et la plus petite valeur, la borne inférieure du premier intervalle.
Le tableau d'effectifs suivant présente les tailles des élèves d'une classe :
Taille (en cm) | \left[ 120;130 \right[ | \left[ 130;140 \right[ | \left[ 140;150 \right[ | \left[ 150;160 \right[ | \left[ 160;175 \right] |
---|---|---|---|---|---|
Nombre d'élèves | 1 | 3 | 5 | 6 | 2 |
Les tailles vont de 120 cm à 175 cm.
L'étendue vaut donc :
175-120=55
Les représentations d'une série statistique
Il y a différentes façons de représenter visuellement les valeurs d'une série statistique : les diagrammes en bâtons et en barres, les diagrammes circulaires et semi-circulaires et les histogrammes en sont des exemples.
Le diagramme en bâtons (ou en barres)
Le diagramme en bâtons (ou en barres) représente une série statistique grâce à des bâtons ou des barres proportionnelles aux effectifs.
Diagramme en bâtons
Pour représenter une série statistique, on peut réaliser un diagramme en bâtons (ou en barres). La hauteur des bâtons (ou des barres) est proportionnelle aux effectifs.
Le diagramme en bâtons suivant représente la série statistique des garçons pratiquant du sport dans la classe.
Un diagramme en barres est un diagramme en bâtons avec des bâtons « larges ».
Le diagramme circulaire ou semi-circulaire
Les diagrammes circulaire et semi-circulaire permettent de comparer visuellement les fréquences des différentes valeurs. L'angle des portions (ou secteurs angulaires) est proportionnel aux effectifs.
Diagramme circulaire
Pour représenter une série statistique, on peut tracer un diagramme circulaire.
L'angle des portions (ou secteurs angulaires) est proportionnel aux effectifs.
Le diagramme circulaire suivant représente la série statistique des garçons pratiquant du sport dans la classe.
Pour obtenir la mesure de l'angle, on multiplie la fréquence de la valeur par 360 :
Sport choisi | Foot | Basket | Tennis | Volley |
---|---|---|---|---|
Nombre de garçons | 4 | 3 | 3 | 2 |
Fréquence | \dfrac{4}{12} | \dfrac{3}{12} | \dfrac{3}{12} | \dfrac{2}{12} |
Angle | \dfrac{4}{12} \times 360 = 120^\circ | \dfrac{3}{12} \times 360 = 90^\circ | \dfrac{3}{12} \times 360 = 90^\circ | \dfrac{2}{12} \times 360 = 60^\circ |
Pour obtenir la mesure de l'angle, on peut également multiplier l'effectif de la valeur par \dfrac{360}{\text{Effectif total}}.
Pour les garçons faisant du foot, le secteur angulaire correspondant possède un angle égal à 4\times\dfrac{360}{12}=120° ou \dfrac{4}{12}\times 360=120°.
Diagramme semi-circulaire
Pour représenter une série statistique, on peut tracer un diagramme semi-circulaire (demi-cercle).
L'angle des portions (ou secteurs angulaires) est proportionnel aux effectifs.
Le diagramme semi-circulaire suivant représente la série statistique des garçons pratiquant du sport dans la classe.
Pour obtenir la mesure de l'angle, on multiplie la fréquence de la valeur par 180 :
Sport choisi | Foot | Basket | Tennis | Volley |
---|---|---|---|---|
Nombre de garçons | 4 | 3 | 3 | 2 |
Fréquence | \dfrac{4}{12} | \dfrac{3}{12} | \dfrac{3}{12} | \dfrac{2}{12} |
Angle | \dfrac{4}{12} \times 180 = 60^\circ | \dfrac{3}{12} \times 180 = 45^\circ | \dfrac{3}{12} \times 180 = 45^\circ | \dfrac{2}{12} \times 180 = 30^\circ |
Pour obtenir la mesure de l'angle, on peut également multiplier l'effectif de la valeur par \dfrac{180}{\text{Effectif total}}.
Pour les garçons faisant du foot, on a ainsi 4\times\dfrac{180}{12}=60° ou \dfrac{4}{12}\times 180=60°.
L'histogramme
L'histogramme est une représentation adaptée aux séries statistiques continues. Son aspect visuel est semblable à celui d'un diagramme en bâtons mais la logique de construction n'est pas la même. Il est formé à partir de rectangles dont la largeur est l'amplitude de la classe correspondante et dont l'aire dépend de l'unité d'aire choisie pour le diagramme.
Histogramme
Pour représenter une série statistique continue (en classes), on peut tracer un histogramme.
Il s'agit de rectangles dont la largeur est l'amplitude de la classe correspondante et dont l'aire dépend de l'unité d'aire choisie pour le diagramme.
Lors d'un devoir commun, les notes de tout l'établissement ont été regroupées en classes.
Note | [0;4[ | [4;8[ | [8;10[ | [10;12[ | [12;16[ | [16;20[ |
Effectif | 2 | 6 | 4 | 9 | 6 | 3 |
Pour construire un histogramme correspondant à cette série à partir des effectifs, on choisit une unité d'aire.
On construit ensuite des rectangles dont l'aire correspond à l'effectif annoncé en fonction de l'unité d'aire choisie.
Voici un exemple :
Sur un histogramme, il n'y a pas d'axe des ordonnées, mais une unité d'aire indiquée.