ajustement affine d'une série statistique à deux variables
nuage de points
On s'intéresse à deux variables quantitatives discrètes sur une population. À chaque individu de cette population, on associe un couple , où est la valeur de la première variable et la valeur de la seconde. L'ensemble des couples forme une série statistique à deux variables.
Soit une série statistique à deux variables.
Dans le plan muni d'un repère, l'ensemble des points est appelé le nuage de points de la série statistique.
Le point moyen du nuage est le point où est la moyenne des et est la moyenne des .
exemple
Le graphique ci-dessous, présente le nombre de milliers d'emploi dans le secteur « hébergement et restauration » (série ) et dans la « construction » (série ) en France entre le 1er trimestre 2009 et le 2e trimestre 2010. Le point est le point moyen du nuage.
ajustement affine par la méthode des moindres carrés
Lorsque les points sont approximativement alignés, on peut penser qu'une relation du type « résume » correctement une corrélation entre les deux variables x et y.
Or pour chaque valeur observée, la valeur calculée correspondante diffère de la valeur observée d'un écart résiduel qui peut être positif ou négatif. On a donc pour chaque couple d'observation i, la relation suivante : Un ajustement affine par la méthode des moindres carrés, consiste à déterminer la fonction affine telle que la somme soit minimale.
étape 1
On considère la somme comme un polynôme du second degré en b. En effet, donc
S est un polynôme du second degré en b de la forme avec , et . Comme , la somme S est minimale pour . Soit
Or et . Donc la somme S est minimale pour .
remarque
. D'où la propriété suivante :
propriété
La droite d'ajustement affine par la méthode des moindres carrés passe par le point moyen du nuage.
étape 2
Pour déterminer a remplaçons b par son expression, ce qui donne
Développons la somme S de manière à obtenir un polynôme du second degré en a :
S est un polynôme du second degré en a de la forme avec , et où est la variance de la première série statistique et la variance de la deuxième série statistique.
Comme , la somme S est minimale pour . Soit
définition
Le nombre est appelé covariance de x et y. On note
Donc la somme S est minimale pour .
droite d'ajustement affine
La droite d'ajustement affine de y en x par la méthode des moindres carrés d'une série statistique à deux variables est la droite d'équation avec et . Avec et . Cette droite passe par le point moyen du nuage de points.
Remarques
La droite d'ajustement affine de y en x par la méthode des moindres carrés est aussi appelée droite de régression de y en x par la méthode des moindres carrés.
Le lien mis en évidence entre deux variables quantitatives x et y par la droite d'ajustement affine ne signifie pas nécessairement que l'une soit la cause de l'autre, mais simplement qu'il existe une corrélation dans l'évolution des deux variables.
La covariance est un indicateur du sens de la variation simultanée des séries quantitatives x et y. Si les données x et les données y croissent globalement en même temps, alors , tandis que si la tendance des données y est décroissante lorsque les données x croissent alors .
Les documents présentés ne sont pas libres de droits. Vous pouvez les télécharger et diffuser (en indiquant la provenance) à condition de ne pas en faire un usage commercial.