Test d'adéquation

Test d'adéquation à une loi équirépartie

Le problème

Dans une population on prélève un échantillon dont les effectifs des différentes modalités sont : n1,n2,,nk, peut-on considérer que la distribution statistique observée dans cet échantillon est en adéquation avec une distribution théorique équirépartie ?

En d'autres termes, il s'agit de savoir si les écarts entre la distribution observée sur l'échantillon et une distribution théorique sont imputables aux fluctuations d'échantillonage ou si, ces écarts sont trop importants pour que l'on puisse accepter l'hypothèse: "L'échantillon est tiré d'une population caractérisée par une distribution équirépartie".

Soit n l'effectif total de l'échantillon, dans le cas d'une adéquation à une loi équiprobable la probabilité de chacune des k modalités est :  p= 1 k .

Les effectifs théoriques associés à chaque modalité sont n k .

Si les valeurs ni des effectifs observés lors de l’expérimentation sont "proches" des valeurs théoriques , il y a de "fortes chances" pour que la réponse au problème posé soit oui.

Comment quantifier cette proximité?

Le test retenu en terminale ES est de comparer l'écart quadratique moyen : E 2 = 1 n i=1 k ( n i - n k ) 2 avec un seuil obtenu par simulation d'une série de prélèvements aléatoires d'échantillons de même taille dans une population dont la distribution des différentes modalités est équirépartie.

Or 1 n i=1 k n i - n k 2 = 1 n i=1 k n 2 n i n - 1 k 2 = n i=1 k n i n - 1 k 2

Soit en notant fi, la fréquence de chacune des différentes modalités : E 2 =n i=1 k f i - 1 k 2

En prenant la définition classique de la distance entre les fréquences des différentes modalités observées et la probabilité théorique nous avons dobs2 = i=1 k f i - 1 k2

Il s'agit alors de comparer E 2 =n dobs2 avec un seuil obtenu par simulation.

Se fixer un seuil à t % c'est prendre le risque de rejeter à tort l'hypothèse d'équiprobabilité dans t % des cas les plus rares.


procédure du test

exemple des résultats obtenus avec le classeur Excel adéquation à une loi équirépartie

  1. n étant l'effectif total, on calcule n dobs2=n i=1 k f i - 1 k 2

  2. À l'aide d'un tableur par exemple on réalise une simulation d'un grand nombre N de séries de n nombres au hasard dans {1,2,…,k}. Pour chacune de ces séries, on calcule nd2. On obtient une série de N valeurs de nd2. Cette série de valeurs définit une série statistique appellée "variable de décision".

  3. On calcule ses quartiles, ses déciles, et peut-être ses centiles. Par exemple en prenant le risque de rejeter à tort l'hypothèse d'équiprobabilité dans 10% des cas on convient alors, que :

    • Si n dobs2D9, alors les données observées sont compatibles avec le modèle théorique au seuil de risque de 10%.

    • Si n dobs2>D9, alors on rejette l'hypothèse de la compatibilité des données observées avec un modèle équiréparti au seuil de risque de 10%.

  4. Il y a donc quatre possibilités :

    • L'hypothèse d'un modèle équiréparti est vraie et on opte pour l'adéquation à la fin du test.
    • L'hypothèse d'un modèle équiréparti est vraie et on la rejette à la fin du test.
    • L'hypothèse d'un modèle équiréparti est fausse et on opte pour le modèle équiréparti à la fin du test.
    • L'hypothèse d'un modèle équiréparti est fausse et on rejette le modèle équiréparti à la fin du test.

Les classeurs Excel

Deux classeurs sont disponibles:

  1. Le classeur adéquation :   ( .zip 30 ko )
    • Fabrication d'une série "variable de décision" de N valeurs à l'aide du tableur en simulant une série de nd2.
    • Distribution de la série "variable de décision" sous forme d'histogramme.
    • Calcul des quantiles.
    • Seuil théorique au risque de 10% et de 5%
  2. le classeur dé truqué  :   ( .zip 30 ko )
    • Simulation de n lancers d'un dé qui peut être pipé d'une manière aléatoire.
    • Obtention d'une série étalon "variable de décision" de valeurs de nd2 et d'éléments de décision : distribution de la série, quantiles, représentation à l'aide d'un graphique "boîte à moustaches".
    • À l'aide des différents éléments décider si on accepte au seuil de 10% l'hypothèse " Le dé est équilibré"
    • Vérifier si la réponse possible est en accord avec la situation réelle.

Les différentes procédures sont écrites sous Excel 2000, le code n'est pas protégé et peut être modifié. Ne pas oublier d'activer les macros lors de l'ouverture du classeur.

[ Accueil ]

L'affichage recommandé pour une meilleure lisibilité est de 1280 × 1024.

math@es

✉ A.Yallouz

Powered by MathJax