On sait qu'en France, 42% de la population est de groupe sanguin O.
On considère un échantillon de 200 personnes dans cette population et on note X le nombre étant de groupe sanguin O. On note F = \dfrac{X}{200} la fréquence des personnes de groupe sanguin dans l'échantillon.
Quelle loi suit la variable aléatoire X ?
L'expérience "donner le groupe sanguin d'une personne" a deux issues possibles :
- Succès : l'individu est de groupe sanguin O, obtenu avec la probabilité p = 0{,}42.
- Echec : l'individu n'est pas de groupe sanguin O, obtenu avec la probabilité q = 1-p = 0{,}58.
Cette expérience est répétée 200 fois de manière indépendante.
X est la variable aléatoire qui dénombre les succès.
X suit donc une loi binomiale de paramètres n=200 et p=0{,}42.
Pourquoi peut-on donner un intervalle de fluctuation asymptotique de la fréquence F ?
D'après le cours on sait qu'on peut déterminer un intervalle de fluctuation si les conditions suivantes sont satisfaites :
- n \geq 30
- np \geq 5
- n\left(1-p\right) \geq 5
Ici, on a :
- n=200 donc n \geq 30
- np = 200 \times 0{,}42 = 84 donc np \geq 5
- n\left(1-p\right) = 200 \times 0{,}58 = 116 donc n\left(1-p\right) \geq 5
On peut donc déterminer un intervalle de fluctuation asymptotique de la fréquence.
Quelle proposition correspond à un intervalle de fluctuation de la fréquence F au seuil de 95% ?
D'après le cours, un intervalle de fluctuation à 95% de la fréquence vaut :
I = \left[ p-1{,}96 \dfrac{\sqrt{p\left(1-p\right)}}{\sqrt n};p+1{,}96 \dfrac{\sqrt{p\left(1-p\right)}}{\sqrt n} \right]
Ici, on a p = 0{,}42 et n = 200.
Donc on obtient :
I = \left[ 0{,}42-1{,}96 \dfrac{\sqrt{0{,}42\left(1-0{,}42\right)}}{\sqrt{200}};0{,}42+1{,}96 \dfrac{\sqrt{0{,}42\left(1-0{,}42\right)}}{\sqrt {200}} \right]
Et, après calculs :
I = \left[ 0, 352 ; 0{,}488 \right]
L'intervalle de fluctuation asymptotique de la fréquence au seuil de 95% vaut I = \left[ 0, 352 ; 0{,}488 \right].
Sur les 200 individus de l'échantillon, 72 sont de groupe sanguin O.
Cet échantillon est-il représentatif ?
Sur les 200 individus de l'échantillon, 72 sont de groupe sanguin O. On a donc une fréquence de :
F = \dfrac{72}{200}= 0{,}36.
Or la fréquence F fluctue à 95% dans l'intervalle I= \left[ 0, 352; 0{,}488 \right].
On a 0{,}36 \in I.
On peut conclure, au risque d'erreur de 5%, que cet échantillon est représentatif de la population.