Sommaire
ILes séries statistiquesALe vocabulaire des statistiquesBLes valeurs et les effectifsCLes valeurs données en classesIILa fréquenceIIILes caractéristiques de positionALa moyenne1Définition de la moyenne2La moyenne pondéréeBLa médianeIVLes représentations d'une série statistiqueALe diagramme en bâtons (ou en barres)BLe diagramme circulaire ou semi-circulaireLes séries statistiques
Une série statistique est la suite des valeurs que prend un caractère au sein d'une population. On étudie ce caractère par le biais des différentes valeurs qu'il peut prendre. En fonction du caractère et de ces valeurs, la série statistique peut prendre plusieurs noms.
Le vocabulaire des statistiques
La « population » est l'ensemble des individus sur lesquels on effectue une étude statistique. Le « caractère » représente la caractéristique de la population que l'on choisit d'étudier ; il peut prendre plusieurs valeurs. La série statistique peut être quantitative ou qualitative. On parle aussi de « série statistique discrète » quand les différentes valeurs du caractère étudié sont isolées les unes des autres.
Population
La population est l'ensemble des individus sur lesquels on effectue une étude statistique.
L'ensemble des garçons d'une classe ou l'ensemble des produits fabriqués par une usine sont des populations.
Caractère
Le caractère représente une des caractéristiques de la population que l'on étudie. Il peut prendre plusieurs valeurs (chiffrées ou non).
Dans l'ensemble des garçons de la classe, on peut s'intéresser au sport choisi. Plusieurs valeurs sont possibles : foot, basket, tennis, volley.
Série statistique
Une série statistique est la suite des valeurs que prend un caractère au sein d'une population.
Voici le sport choisi par les douze garçons d'une classe qui avaient le choix entre le foot, le basket, le tennis et le volley :
« tennis ; tennis ; basket ; foot ; basket ; foot ; volley ; foot ; foot ; tennis ; basket ; volley ».
Il s'agit de la série statistique décrivant la valeur du caractère « le sport choisi » au sein de la population « les garçons de la classe ».
Série quantitative
On dit qu'une série statistique est une « série quantitative » lorsque le caractère étudié prend des valeurs numériques.
La série des tailles des élèves d'une classe de 4e est une série quantitative car le caractère étudié (la taille) prend des valeurs numériques.
Lorsqu'une série statistique n'est pas quantitative, on dit qu'elle est « qualitative ».
Les valeurs du caractère ne sont pas numériques, on ne pourra donc pas effectuer de calculs à partir de ces valeurs.
La série statistique décrivant la valeur du caractère « le sport choisi » au sein de la population « les garçons de la classe » n'est pas une série quantitative.
Série statistique discrète
Une série statistique discrète est une série statistique dans laquelle les différentes valeurs du caractère étudié sont isolées les unes des autres.
Dans l'exemple précédent, le caractère étudié est « le sport choisi » et les différentes valeurs possibles du caractère sont isolées les unes des autres.
Il y a quatre valeurs possibles qui sont « le foot, le basket, le tennis et le volley ».
Les valeurs et les effectifs
Le caractère étudié peut avoir plusieurs valeurs, dont les nombres d'apparition sont les effectifs. On distingue « effectif total » et « effectif cumulé croissant ». L'effectif total est la somme des effectifs d'une série statistique ; l'effectif cumulé croissant d'une valeur de la série est le nombre de valeurs inférieures ou égales à la valeur considérée.
On présente souvent les résultats d'une étude statistique sous forme de tableau. La première ligne recense les différentes valeurs de la série et la seconde ligne affiche l'effectif correspondant à chaque valeur.
La série statistique décrivant la valeur du caractère « le sport choisi » au sein de la population « les garçons de la classe » peut être représentée par le tableau suivant :
Sport choisi | Foot | Basket | Tennis | Volley |
---|---|---|---|---|
Nombre de garçons | 4 | 3 | 3 | 2 |
Effectif
L'effectif d'une valeur d'une série statistique est le nombre d'apparitions de cette valeur dans la série.
On considère la série statistique : « tennis ; tennis ; basket ; foot ; basket ; foot ; volley ; foot ; foot ; tennis ; basket ; volley ».
Dans cette série, la valeur « foot » a pour effectif 4 car elle apparaît 4 fois.
Effectif total
La somme des effectifs d'une série statistique est égale à l'effectif total.
On considère la série statistique : « tennis ; tennis ; basket ; foot ; basket ; foot ; volley ; foot ; foot ; tennis ; basket ; volley ».
Sport choisi | Foot | Basket | Tennis | Volley |
---|---|---|---|---|
Nombre de garçons | 4 | 3 | 3 | 2 |
L'effectif total, qui correspond au nombre de garçons de la classe, est égal à :
4 + 3 + 3 + 2 = 12
Effectif cumulé croissant
On considère une série statistique quantitative.
On appelle « effectif cumulé croissant » d'une valeur de la série le nombre de valeurs inférieures ou égales à la valeur considérée.
Le tableau statistique suivant donne la répartition des notes dans une classe :
Notes | 8 | 11 | 13 | 16 |
---|---|---|---|---|
Effectifs | 8 | 13 | 14 | 3 |
Effectifs cumulés croissants | 8 | 21 | 35 | 38 |
On peut calculer les effectifs cumulés croissants :
- La valeur 8 a un effectif cumulé croissant de 8 car il y a 8 valeurs inférieures ou égales à 8 (uniquement les valeurs égales à 8).
- La valeur 11 a un effectif cumulé croissant de 21 car il y a 21 valeurs inférieures ou égales à 11 (les valeurs égales à 8 et celles égales à 11).
- La valeur 13 a un effectif cumulé croissant de 35 car il y a 35 valeurs inférieures ou égales à 13 (les valeurs égales à 8, celles égales à 11 et celles égales à 13).
- La valeur 16 a un effectif cumulé croissant de 38 car il y a 38 valeurs inférieures ou égales à 16 (toutes les valeurs sont inférieures ou égales à 16).
Les valeurs données en classes
Lorsque les valeurs possibles sont trop nombreuses, elles sont regroupées par intervalles, que l'on appelle « classes ». On parle de « série statistique continue ».
Dans certaines séries statistiques dont le caractère étudié prend des valeurs numériques, on peut regrouper les valeurs dans des intervalles.
Ces intervalles sont appelés des « classes » et l'on peut calculer l'effectif de chaque classe.
On peut regrouper les employés d'une entreprise par classe de taille en centimètres.
Taille (cm) | \left[ 150;155 \right[ | \left[ 155;160 \right[ | \left[ 160;165 \right[ | \left[ 165;170 \right[ | \left[ 170;175 \right[ | \left[ 175;180 \right] |
---|---|---|---|---|---|---|
Effectif | 3 | 10 | 11 | 18 | 13 | 8 |
Série statistique continue
Lorsque les valeurs du caractère étudié dans une série statistique sont regroupées en classes, on dit que la série est une « série statistique continue ».
Lorsqu'on regroupe les employés d'une entreprise par classe de taille en centimètres, on étudie une série statistique continue, telle que représentée dans le tableau suivant :
Taille (cm) | \left[ 150;155 \right[ | \left[ 155;160 \right[ | \left[ 160;165 \right[ | \left[ 165;170 \right[ | \left[ 170;175 \right[ | \left[ 175;180 \right] |
---|---|---|---|---|---|---|
Effectif | 3 | 10 | 11 | 18 | 13 | 8 |
La fréquence
La fréquence permet de comparer le caractère fréquent d'une valeur par rapport aux autres.
Fréquence
La fréquence d'une valeur (ou d'une classe) d'une série statistique est égale à :
f = \dfrac{\text{Effectif de la valeur (ou de la classe)}}{\text{Effectif total}}
On considère la série statistique donnant le sport choisi par les douze garçons d'une classe, représentée dans le tableau suivant :
Sport choisi | Foot | Basket | Tennis | Volley |
---|---|---|---|---|
Nombre de garçons | 4 | 3 | 3 | 2 |
La fréquence des garçons ayant choisi le basket est \dfrac{3}{12}.
Une fréquence peut être donnée en fraction réduite ou en valeur décimale (seulement si la valeur est exacte ou si l'on demande une valeur arrondie).
Dans l'exemple précédent, la fréquence des garçons ayant choisi le basket est :
\dfrac{3}{12}=\dfrac{1}{4}=0{,}25
Une fréquence est toujours un nombre compris entre 0 et 1.
Dans l'exemple précédent, la fréquence des garçons ayant choisi le basket est \dfrac{3}{12}.
On a :
\dfrac{0}{12}\leq \dfrac{3}{12}\leq \dfrac{12}{12}
Donc :
0\leq \dfrac{3}{12}\leq 1
La somme de toutes les fréquences d'une série est égale à 1.
On ajoute une ligne au tableau de la série statistique précédente pour visualiser la fréquence de chaque sport, tel que représenté dans le tableau suivant :
Sport choisi | Foot | Basket | Tennis | Volley |
---|---|---|---|---|
Nombre de garçons | 4 | 3 | 3 | 2 |
Fréquence | \dfrac{4}{12} | \dfrac{3}{12} | \dfrac{3}{12} | \dfrac{2}{12} |
On a bien :
\dfrac{4}{12} + \dfrac{3}{12} + \dfrac{3}{12} + \dfrac{2}{12} = \dfrac{4+3+3+2}{12} = \dfrac{12}{12} = 1
Les caractéristiques de position
Lorsque plusieurs séries statistiques correspondent à l'étude d'un même caractère sur une même population ou sur une autre population, on peut comparer les valeurs des séries. Plutôt que de comparer les valeurs une à une, certains indicateurs permettent de comparer des résultats calculés à partir des données des séries. La moyenne et la médiane font partie de ces indicateurs.
La moyenne
On ne peut calculer la moyenne que de séries quantitatives : elle se calcule à partir des valeurs et de l'effectif total. La moyenne pondérée se calcule différemment : on peut utiliser la fréquence dans la formule.
Définition de la moyenne
On calcule la moyenne en additionnant toutes les valeurs de la série statistique puis en divisant le résultat par l'effectif total.
Moyenne
La moyenne d'une série statistique discrète, souvent notée m, se calcule en additionnant toutes les valeurs puis en divisant par l'effectif total.
On donne la série statistique suivante :
« 12 ; 5 ; 16 ; 32 ; 15 ; 2 ; 19 ; 10 ; 4 ; 5 »
On remarque que l'effectif total est de 10. On peut calculer la moyenne :
m=\dfrac{12+5+16+32+15+2+19+10+4+5}{10}
m=\dfrac{120}{10}=12
On peut uniquement calculer la moyenne des séries statistiques dont les valeurs sont des nombres (et pas des sports, des couleurs, etc.), c'est-à-dire des séries quantitatives.
Pour les séries quantitatives continues (valeurs rangées en classes), on détermine une valeur approchée de la moyenne en remplaçant chaque classe par son centre.
On donne la série statistique suivante :
Âge | \left[ 12;18 \right[ | \left[ 18;25 \right[ | \left[ 25;40 \right[ | \left[ 40;60 \right] |
---|---|---|---|---|
Effectif | 2 | 3 | 2 | 1 |
On détermine le centre des classes et on ajoute cette ligne dans le tableau suivant :
Âge | \left[ 12;18 \right[ | \left[ 18;25 \right[ | \left[ 25;40 \right[ | \left[ 40;60 \right] |
---|---|---|---|---|
Centre de classe | 15 | 21,5 | 32,5 | 50 |
Effectif | 2 | 3 | 2 | 1 |
On peut ensuite calculer une valeur approchée de la moyenne, en remarquant que l'effectif total est 8 :
m\approx\dfrac{15+15+21{,}5+21{,}5+21{,}5+32{,}5+32{,}5+50}{8}
m\approx\dfrac{209{,}5}{8}\approx26
La moyenne d'une série statistique est une valeur centrale sensible aux valeurs extrêmes.
On reprend l'un des exemples précédents avec la série statistique suivante :
« 12 ; 5 ; 16 ; 32 ; 15 ; 2 ; 19 ; 10 ; 4 ; 5 »
La moyenne est :
m=\dfrac{12+5+16+32+15+2+19+10+4+5}{10}
m=\dfrac{120}{10}
m=12
Si l'on ajoute une valeur supérieure à toutes les autres, par exemple 100, la moyenne devient :
m=\dfrac{12+5+16+32+15+2+19+10+4+5+100}{11}
m=\dfrac{220}{11}
m=20
On remarque que la moyenne a fortement augmenté en ajoutant seulement une valeur.
La moyenne pondérée
On calcule la moyenne pondérée en additionnant les produits de chaque valeur par son effectif, puis en divisant le résultat par l'effectif total.
Moyenne pondérée
La moyenne pondérée d'une série de données est égale au quotient de la somme des produits de chaque valeur par son effectif sur l'effectif total.
Autrement dit :
\text{Moyenne pondérée}=\dfrac{\text{Somme des produits des valeurs par leurs effectifs}}{\text{Effectif total}}
On présente la série de l'exemple précédent dans le tableau d'effectifs suivant :
Notes | 5 | 8 | 9 | 10 | 10,5 | 11 | 13 | 14 | 14,5 | 16 |
---|---|---|---|---|---|---|---|---|---|---|
Nombres d'élèves | 1 | 3 | 5 | 6 | 2 | 5 | 6 | 1 | 2 | 1 |
L'effectif total est égal à 32.
On peut ainsi calculer la moyenne pondérée arrondie au dixième :
m = \dfrac{5 \times 1 + 8 \times 3 + 9 \times 5 + 10 \times 6 + 10{,}5 \times 2 + 11 \times 5 + 13 \times 6 + 14 \times 1 + 14{,}5 \times 2 + 16 \times 1}{32} \approx 10{,}8
Dans cette dernière formule, on peut remplacer « effectifs » par « fréquences » et « effectif total » par « fréquence totale ».
Mais comme la fréquence totale est égale à 1, la division par la fréquence totale n'est plus utile.
On présente la série de l'exemple précédent dans le tableau d'effectifs suivant :
Notes | 5 | 8 | 9 | 10 | 10,5 | 11 | 13 | 14 | 14,5 | 16 |
---|---|---|---|---|---|---|---|---|---|---|
Fréquences | \dfrac{1}{32} | \dfrac{3}{32} | \dfrac{5}{32} | \dfrac{6}{32} | \dfrac{2}{32} | \dfrac{5}{32} | \dfrac{6}{32} | \dfrac{1}{32} | \dfrac{2}{32} | \dfrac{1}{32} |
On peut calculer la moyenne pondérée arrondie au dixième à partir des fréquences :
m = 5 \times \dfrac{1}{32} + 8 \times \dfrac{3}{32} + 9 \times \dfrac{5}{32} + 10 \times \dfrac{6}{32} + 10{,}5 \times \dfrac{2}{32} + 11 \times \dfrac{5}{32} + 13 \times \dfrac{6}{32} + 14 \times \dfrac{1}{32} + 14{,}5 \times \dfrac{2}{32} + 16 \times \dfrac{1}{32} \approx 10{,}8
La médiane
La médiane d'une série statistique rangée par ordre croissant est la valeur qui partage cette série en deux séries de même effectif.
Médiane
On appelle « médiane » d'une série rangée par ordre croissant toute valeur de la série qui la partage en deux séries de même effectif.
On reprend l'un des exemples précédents avec la série statistique suivante :
« 12 ; 5 ; 16 ; 32 ; 15 ; 2 ; 19 ; 10 ; 4 ; 13 ; 5 »
On range les valeurs dans l'ordre croissant :
« 2 ;4 ; 5 ; 5 ; 10 ; 12 ; 13 ; 15 ; 16 ; 19 ; 32 »
La série a une effectif total de 11.
La 6e valeur est 12 : la série comprend cinq nombres inférieurs ou égaux à 12 et cinq nombres supérieurs ou égaux à 12.
La médiane de la série statistique est donc 12.
On considère une série dont les valeurs des n individus sont rangées par ordre croissant.
- Si n est impair, une médiane est égale à la \dfrac{n+1}{2}^{\text{ème}} valeur de la série ordonnée.
- Si n est pair, on choisit comme médiane le nombre central situé entre la \dfrac{n}{2}^{\text{ème}} valeur et la \left(\dfrac{n}{2}+ 1\right) ^{\text{ème}} valeur.
On considère la série suivante, dont l'effectif est 6 :
« 12 ; 13 ; 14 ; 19 ; 31 ; 41 »
6 est pair et \dfrac{6}{2}=3.
La médiane est donc égale à la moyenne des 3e et 4e éléments de la série soit \dfrac{14+19}{2}.
La médiane de la série est donc 16,5.
Un tableau des effectifs cumulés croissants peut aider à déterminer une médiane.
C'est notamment utile lorsque les effectifs deviennent assez importants.
On présente la série de l'exemple précédent dans le tableau d'effectifs suivant :
Notes | 5 | 8 | 9 | 10 | 10,5 | 11 | 13 | 14 | 14,5 | 16 |
---|---|---|---|---|---|---|---|---|---|---|
Effectifs | 1 | 3 | 5 | 6 | 2 | 5 | 6 | 1 | 2 | 1 |
Effectifs cumulés croissants | 1 | 4 | 9 | 15 | 17 | 22 | 28 | 29 | 31 | 32 |
L'effectif total est égal à 32.
Les médianes sont situées entre les 16e et 17e valeurs.
Les effectifs cumulés croissants sont ainsi :
- La 16e valeur est 10,5.
- La 17e valeur est 10,5.
La médiane est donc 10,5.
Les représentations d'une série statistique
Il existe différentes façons de représenter les valeurs d'une série statistique : les diagrammes en bâtons et en barres et les diagrammes circulaires et semi-circulaires en sont des exemples.
Le diagramme en bâtons (ou en barres)
Le diagramme en bâtons (ou en barres) représente une série statistique grâce à des bâtons ou des barres proportionnelles aux effectifs.
Diagramme en bâtons (ou en barres)
Pour représenter une série statistique, on peut tracer un diagramme en bâtons (ou en barres). La hauteur des bâtons (ou des barres) est proportionnelle aux effectifs. Ces diagrammes sont adaptés aux séries discrètes quantitatives.
Le diagramme en bâtons suivant représente la série statistique des garçons pratiquant du sport dans la classe.
Un diagramme en barres est un diagramme en bâtons avec des bâtons « larges ».
Le diagramme circulaire ou semi-circulaire
Les diagrammes circulaire et semi-circulaire permettent de comparer visuellement les fréquences des différentes valeurs. L'angle des portions (ou secteurs angulaires) est proportionnel aux effectifs.
Diagramme circulaire
Pour représenter une série statistique, on peut tracer un diagramme circulaire. L'angle des portions est proportionnel aux effectifs.
Le diagramme circulaire suivant représente la série statistique des garçons pratiquant du sport dans la classe. Pour obtenir la mesure de l'angle, on multiplie la fréquence de la valeur par 360.
Sport choisi | Foot | Basket | Tennis | Volley |
---|---|---|---|---|
Nombre de garçons | 4 | 3 | 3 | 2 |
Fréquence | \dfrac{4}{12} | \dfrac{3}{12} | \dfrac{3}{12} | \dfrac{2}{12} |
Angle | \dfrac{4}{12} \times 360 = 120^\circ | \dfrac{3}{12} \times 360 = 90^\circ | \dfrac{3}{12} \times 360 = 90^\circ | \dfrac{2}{12} \times 360 = 60^\circ |
Pour obtenir la mesure de l'angle, on peut également multiplier l'effectif de la valeur par \dfrac{360}{\text{Effectif total}}.
Pour les garçons faisant du foot on a ainsi :
4\times\dfrac{360}{12}=120°
Diagramme semi-circulaire
Pour représenter une série statistique, on peut tracer un diagramme semi-circulaire (en demi-cercle). L'angle des portions est proportionnel aux effectifs.
Le diagramme semi-circulaire suivant représente la série statistique des garçons pratiquant du sport dans la classe. Pour obtenir la mesure de l'angle, on multiplie la fréquence de la valeur par 180.
Sport choisi | Foot | Basket | Tennis | Volley |
---|---|---|---|---|
Nombre de garçons | 4 | 3 | 3 | 2 |
Fréquence | \dfrac{4}{12} | \dfrac{3}{12} | \dfrac{3}{12} | \dfrac{2}{12} |
Angle | \dfrac{4}{12} \times 180 = 60^\circ | \dfrac{3}{12} \times 180 = 45^\circ | \dfrac{3}{12} \times 180 = 45^\circ | \dfrac{2}{12} \times 180 = 30^\circ |
Pour obtenir la mesure de l'angle, on peut également multiplier l'effectif de la valeur par \dfrac{180}{\text{Effectif total}}.
Pour les garçons faisant du foot, on a ainsi :
4\times\dfrac{180}{12}=60°