On cherche à estimer avec un certain niveau de confiance, la proportion p inconnue d'un caractère au sein d'une population à partir d'un échantillon de taille n.
Soit f la fréquence observée d'un caractère dans un échantillon de taille n.
Sous les conditions usuelles d'approximation , et , l'intervalle est un intervalle de confiance au niveau de confiance 0,95 de la proportion inconnue p dans la population.
exemple
On interroge au hasard 150 clients ayant effectué des achats à la sortie d'une grande surface. Le temps d'attente aux caisses a été jugé raisonnable par 78 personnes interrogées.
Peut-on considérer que plus de 50 % des clients de cette grande surface estiment que le temps d'attente aux caisses est raisonnable ?
Soit la fréquence des clients qui estiment que le temps d'attente aux caisses est raisonnable.
Les bornes de l'intervalle de confiance au niveau de confiance 95 % de la proportion des clients qui estiment que le temps d'attente aux caisses est raisonnable sont :
On a : et d'où et .
Soit , et . Les conditions d'approximation d'un intervalle de confiance au niveau de confiance 95 % sont vérifiées.
Un intervalle de confiance au niveau de confiance 95 % de la proportion de clients qui estiment que le temps d'attente aux caisses est raisonnable est .
La borne inférieure de l'intervalle de confiance est 0,438, il est donc possible que moins de 50 % des clients trouvent que le temps d'attente aux caisses est raisonnable.
Déterminer le nombre minimal de clients qu'il faut interroger pour estimer la proportion p de clients qui trouvent le temps d'attente aux caisses raisonnable avec une précision inférieure à 0,1.
La précision de l'estimation de la proportion inconnue p est . Pour tout entier naturel n :
Il faut interroger plus de 400 clients pour obtenir une estimation de la proportion p de clients qui trouvent le temps d'attente aux caisses raisonnable avec une précision inférieure à 0,1.
À fréquence observée égale à 0,52, quel nombre de clients aurait-il fallu interroger pour estimer que plus de 50 % des clients trouvent que le temps d'attente aux caisses est raisonnable ?
La borne inférieure de l'intervalle de confiance au niveau de confiance 0,95 sur un échantillon de taille n est d'où n est solution de l'inéquation :
Avec une fréquence observée égale à 0,52, il faudrait un échantillon de taille supérieure à 2500 pour que la proportion p de clients qui trouvent le temps d'attente aux caisses raisonnable appartienne à un intervalle de confiance dont la borne inférieure est supérieure à 0,5.
Les documents présentés ne sont pas libres de droits. Vous pouvez les télécharger et diffuser (en indiquant la provenance) à condition de ne pas en faire un usage commercial.