Sommaire
ILe théorème de Moivre-LaplaceIILes intervalles de fluctuationIIILes intervalles de confianceLe théorème de Moivre-Laplace
Théorème de Moivre-Laplace
Soit \left(X_n \right) une suite de variables aléatoires telle que pour tout entier naturel n, X_n suit la loi binomiale \mathcal{B}\left(n;p\right). On définit alors, pour tout entier n, la variable aléatoire Z_n par :
Z_n = \dfrac{X_n-np}{\sqrt{np\left(1-p\right)}}
Pour tous réels a et b (a \lt b), on a alors :
\lim\limits_{n \to +\infty } p\left(a \leq Z_n \leq b\right) = \dfrac{1}{\sqrt{2\pi }}\int_{a}^{b}e^{-\frac{t^2}{2}} \ \mathrm dt
Si les conditions d'approximation n\geq 30, np\geq5 et n\left(1-p\right)\geq 5 sont vérifiées, alors une bonne approximation de la variable aléatoire X_n (c'est-à-dire la loi binomiale de paramètres n et p) est la loi normale de paramètres \left(np;np\left(1-p\right)\right).
Les intervalles de fluctuation
Intervalle de fluctuation
Soient Z une variable aléatoire suivant la loi normale centrée réduite, \alpha un réel de \left]0;1\right[ et u_{\alpha } l'unique réel positif tel que P\left(-u_{\alpha } \leq Z \leq u_{\alpha }\right) = 1-\alpha .
Si X_n est une variable aléatoire suivant la loi binomiale \mathcal{B}\left(n;p\right), on pose :
I_n = \left[ p - u_{\alpha } \dfrac{\sqrt{p\left(1-p\right)}}{\sqrt{n}} ; p + u_{\alpha } \dfrac{\sqrt{p\left(1-p\right)}}{\sqrt{n}} \right]
On a alors :
\lim\limits_{n \to +\infty } P\left(\dfrac{X_n}{n} \in I_n \right) = 1-\alpha
L'intervalle I_n est appelé intervalle de fluctuation de \dfrac{X_n}{n} au seuil 1-\alpha , si les conditions suivantes sont satisfaites :
- n \geq 30
- np \geq 5
- n\left(1-p\right) \geq 5
Il s'agit de l'intervalle de fluctuation au seuil de \left( 1-\alpha\right) de la fréquence d'un caractère dans un échantillon. Ce caractère a une fréquence p dans la population dont est issu l'échantillon de taille n. C'est donc l'intervalle centré sur p dans lequel on s'attend à trouver la fréquence du caractère étudié avec une probabilité de \left( 1-\alpha\right).
Dans ce cas, la proportion du caractère étudié dans la population, ou la probabilité de l'observer en situation d’équiprobabilité, sont connues.
En particulier, pour \alpha = 0{,}05, un intervalle de fluctuation au seuil de 95\% de la fréquence d'apparition d'un caractère dans un échantillon aléatoire de taille n (à condition d'avoir n \geq 30, np \geq 5 et n\left(1-p\right) \geq 5 ) est :
I=\left[ p - 1{,}96 \dfrac{\sqrt{p\left(1-p\right)}}{\sqrt{n}} ; p + 1{,}96 \dfrac{\sqrt{p\left(1-p\right)}}{\sqrt{n}} \right]
Un fabricant de calculatrices commande auprès de son fournisseur deux types de composants électroniques : CA365 et TI512. Il demande 900 composants de chaque sorte.
Au moment de la livraison, le service de contrôle retire 50 composants.
Quel est l'intervalle de fluctuation asymptotique au seuil 0,95 de la fréquence de composants CA365 ?
Le fabricant a commandé autant de composants de chaque sorte. On peut donc supposer que la proportion de composants CA365 est égale à 0,5.
La taille de l'échantillon est n=50.
Vérifions si les paramètres n et p répondent aux conditions imposées :
- n=50\geq30
- n\times p=50\times 0{,}5=25\geq5
- n\times \left(1-p\right)=50\times 0{,}5=25\geq5
L'intervalle de fluctuation asymptotique au seuil 0,95 est :
I=\left[ 0{,}5 - 1{,}96\times \dfrac{\sqrt{0{,}5\times0{,}5}}{\sqrt{50}} ; 0{,}5 + 1{,}96\times \dfrac{\sqrt{0{,}5\times0{,}5}}{\sqrt{50}} \right]
Soit, après calculs :
I=\left[ 0{,}361;0{,}639 \right]
Un intervalle de fluctuation asymptotique peut servir à prendre une décision par rapport à une hypothèse émise, à savoir accepter l'hypothèse ou la rejeter. Lorsque la proportion du caractère étudié dans une population est supposée être égale à p, on peut, si les conditions suivantes sont vérifiées, accepter ou rejeter l'hypothèse à partir d'une fréquence observée sur un échantillon de taille n.
- n \geq 30
- np \geq 5
- n\left(1-p\right) \geq 5
On note I l'intervalle de fluctuation asymptotique au seuil de 95% obtenu à partir de l'hypothèse de la proportion p :
- Si f\in I, alors on accepte l'hypothèse faite sur la proportion p.
- Si f\notin I, alors on rejette l'hypothèse faite sur la proportion p avec un risque de 5% de se tromper.
Les intervalles de confiance
Intervalle de confiance
On considère une expérience de Bernoulli dont on veut estimer la probabilité de succès p. On appelle f_n la fréquence d'apparition du succès après n répétitions indépendantes. Si les trois conditions suivantes sont vérifiées :
- n \geq 30
- nf_n \geq 5
- n\left(1-f_n\right) \geq 5
Alors p appartient à l'intervalle suivant avec un niveau de confiance de 95\% :
I_C=\left[ f_n - \dfrac{1}{\sqrt{n}} ; f_n + \dfrac{1}{\sqrt{n}} \right]
Il s'agit d'un intervalle de confiance à 95% de la proportion p du caractère étudié dans la population. C'est donc un intervalle centré sur f dans lequel on s'attend à trouver la proportion p avec une probabilité de 95%.
On dispose d'une urne contenant un grand nombre de boules blanches et noires. La proportion de boules blanches contenues dans l'urne n'est pas connue. On réalise un tirage de 100 boules et on obtient 54 boules blanches.
La fréquence observée est donc f=0{,}54.
L'intervalle de confiance de la proportion de boule blanche dans l'urne au niveau de confiance 95% est :
I_C=\left[ 0{,}54 - \dfrac{1}{\sqrt{100}} ; 0{,}54 + \dfrac{1}{\sqrt{100}} \right]
Soit, après calculs :
I_C=\left[ 0{,}44;0{,}64 \right]
Dans cette configuration, la proportion ou probabilité de succès p est inconnue.