On sait que dans un pays A, 23% de la population a plus de 60 ans.
On considère un échantillon de 800 personnes dans cette population et on note X le nombre ayant plus de 60 ans. On note F = \dfrac{X}{800} la fréquence des personnes ayant plus de 60 ans dans l'échantillon.
Quelle loi suit la variable aléatoire X ?
L'expérience "donner l'âge d'une personne" a deux issues possibles :
- Succès : l'individu a plus de 60 ans, obtenu avec la probabilité p = 0, 23.
- Echec : l'individu a moins de 60 ans, obtenu avec la probabilité q = 1-p = 0{,}77.
Cette expérience est répétée 800 fois de manière indépendante.
X est la variable aléatoire qui dénombre les succès.
X suit donc une loi binomiale de paramètres n=800 et p=0, 23.
Pourquoi peut-on donner un intervalle de fluctuation asymptotique de la fréquence F ?
D'après le cours on sait qu'on peut déterminer un intervalle de fluctuation si les conditions suivantes sont satisfaites :
- n \geq 30
- np \geq 5
- n\left(1-p\right) \geq 5
Ici, on a :
- n=800 donc n \geq 30
- np = 800 \times 0, 23 = 184 donc np \geq 5
- n\left(1-p\right) = 200 \times 0{,}77 = 616 donc n\left(1-p\right) \geq 5
On peut donc déterminer un intervalle de fluctuation asymptotique de la fréquence.
Quelle proposition correspond à un intervalle de fluctuation de la fréquence F au seuil de 95% ?
D'après le cours, un intervalle de fluctuation à 95% de la fréquence vaut :
I = \left[ p-1{,}96 \dfrac{\sqrt{p\left(1-p\right)}}{\sqrt n};p+1{,}96 \dfrac{\sqrt{p\left(1-p\right)}}{\sqrt n} \right]
Ici, on a p = 0{,}23 et n = 800.
Donc on obtient :
I = \left[ 0{,}23-1{,}96 \dfrac{\sqrt{0{,}23\left(1-0{,}23\right)}}{\sqrt{800}};0{,}23+1{,}96 \dfrac{\sqrt{0{,}23\left(1-0{,}23\right)}}{\sqrt {800}} \right]
Et, après calculs :
I = \left[ 0, 201 ; 0, 259 \right]
L'intervalle de fluctuation asymptotique de la fréquence au seuil de 95% vaut I = \left[ 0, 201 ; 0, 259 \right].
Sur les 800 individus de l'échantillon, 205 ont plus de 60 ans.
Cet échantillon est-il représentatif ?
Sur les 800 individus de l'échantillon, 205 ont plus de 60 ans. On a donc une fréquence de :
F = \dfrac{205}{800}= 0{,}256.
Or la fréquence F fluctue à 95% dans l'intervalle I= \left[ 0, 201; 0, 259 \right].
On a 0{,}256 \in I.
On peut conclure, au risque d'erreur de 5%, que cet échantillon est représentatif de la population.