On sait que dans un pays A, 34% des individus fument régulièrement.
On considère un échantillon de 65 individus dans cette population et on note X le nombre de fumeurs. On note F = \dfrac{X}{65} la fréquence des fumeurs.
Quelle loi suit la variable aléatoire X ?
L'expérience "choisir un individu" a deux issues possibles :
- Succès : l'individu fume, obtenu avec la probabilité p = 0, 34.
- Echec : l'individu ne fume pas, obtenu avec la probabilité q = 1-p = 0, 66.
Cette expérience est répétée 65 fois de manière indépendante.
X est la variable aléatoire qui dénombre les succès.
X suit donc une loi binomiale de paramètres n=65 et p=0, 34.
Pourquoi peut-on donner un intervalle de fluctuation asymptotique de la fréquence F ?
D'après le cours on sait qu'on peut déterminer un intervalle de fluctuation si les conditions suivantes sont satisfaites :
- n \geq 30
- np \geq 5
- n\left(1-p\right) \geq 5
Ici, on a :
- n=65 donc n \geq 30
- np = 65 \times 0, 34= 22{,}1 donc np \geq 5
- n\left(1-p\right) = 65 \times 0, 66 = 42{,}9 donc n\left(1-p\right) \geq 5
On peut donc déterminer un intervalle de fluctuation asymptotique de la fréquence.
Quelle proposition correspond à un intervalle de fluctuation de la fréquence F au seuil de 95% ?
D'après le cours, un intervalle de fluctuation à 95% de la fréquence vaut :
I = \left[ p-1{,}96 \dfrac{\sqrt{p\left(1-p\right)}}{\sqrt n};p+1{,}96 \dfrac{\sqrt{p\left(1-p\right)}}{\sqrt n} \right]
Ici, on a p = 0, 34 et n =65.
Donc on obtient :
I = \left[ 0, 34-1{,}96 \dfrac{\sqrt{0, 34\left(1-0, 34\right)}}{\sqrt{65}};0, 34+1{,}96 \dfrac{\sqrt{0{,}34\left(1-0, 34\right)}}{\sqrt {65}} \right]
Et, après calculs :
I = \left[ 0, 225 ; 0, 455 \right]
L'intervalle de fluctuation asymptotique de la fréquence au seuil de 95% vaut I = \left[ 0, 225 ; 0, 455 \right].
Sur les 65 individus de l'échantillon, 31 fument.
Cet échantillon est-il représentatif ?
Sur les 65 individus de l'échantillon, 31 sont des fumeurs. On a donc une fréquence de :
F = \dfrac{31}{65} \approx 0, 477.
Or la fréquence F fluctue à 95% dans l'intervalle I = \left[ 0, 225 ; 0, 455 \right].
On a 0, 477 \notin I.
On peut conclure, au risque d'erreur de 5%, que cet échantillon n'est pas représentatif de la population.