cours première ES

Statistiques

Les premières études statistiques étaient des recensements démographiques : on en a conservé le vocabulaire.

Lorsque les différentes valeurs d'un caractère sont des nombres, le caractère est quantitatif. Dans le cas contraire, le caractère est qualitatif.

I - Médiane et quantiles

1 - Médiane

La médiane d'une série statistique est une valeur telle qu'il y ait autant d'observations ayant une valeur supérieure à la médiane que d'observations ayant une valeur inférieure à la médiane.

La médiane d'une série statistique de N valeurs rangées par ordre croissant est le nombre Me défini par :

  • si l'effectif N est impair, la médiane Me est la valeur centrale du caractère c'est à dire la valeur de rang N+12 de la série ordonnée ;
  • si l'effectif N est pair, la médiane Me est la demi-somme des deux valeurs centrales du caractère c'est à dire la moyenne des valeurs de rangs N2 et N2+1 de la série ordonnée.

exemple

Dans un service de maintenance, on a répertorié le nombre d'interventions par jour sur un mois. On a obtenu la distribution suivante :

Nombre d'interventions xi356789
Nombre de jours ni258631

L'effectif total N=25 donc la médiane est la valeur du caractère de rang 13 soit Me=6.

2 - Les quantiles

Les quartiles

Les quartiles au nombre de trois Q1, Q2 et Q3 partagent l'ensemble étudié de N éléments préalablement classés par valeurs croissantes, en quatre sous ensembles.

Quartiles : L'illustration svg n'est pas visible par votre navigateur.

remarque

L'intervalle interquartile [Q1;Q3] contient au moins 50 % des valeurs de la série.

exemple

Dans la série précédente, l'effectif total N=25.

Les déciles

Les déciles au nombre de neuf D1, D2, … , D9 partagent l'ensemble étudié de N éléments préalablement classés par valeurs croissantes, en dix sous ensembles.

3 - Caractéristiques de dispersion

4 - Diagramme en boîte

La représentation graphique de la dispersion d'une série statistique se fait à l'aide de diagramme en boîte appelés aussi « boîte à moustaches » ou « box-plot ».

Pour une catégorie donnée, on construit, en face d'un axe permettant de repérer les quantiles de la variable étudiée, un rectangle dont la longueur est égale à l'écart interquartile Q3-Q1, la médiane est représentée par un trait. On ajoute alors des segments aux extrémités menant jusqu'aux valeurs extrêmes, ou jusqu'aux premier et neuvième déciles.

exemple

Le tableau suivant donne la distribution du revenu salarial par secteur d'activité en France en 2014.

Source : INSEE Première (janvier 2017)
D1Q1MédianeQ3D9
Secteur privé2 2188 57017 52025 37737 234
Secteur public4 71615 74421 22127 99636 797

La distribution du revenu salarial par secteur d'activité est représentée à l'aide de diagrammes en boîte :

Diagramme en boîte : L'illustration svg n'est pas visible par votre navigateur.

suivant>> Moyenne

[ Accueil ]


Les documents présentés ne sont pas libres de droits. Vous pouvez les télécharger et diffuser (en indiquant la provenance) à condition de ne pas en faire un usage commercial.