Le théorème central limite

Contactez moi pour vos questions

Mes idées cadeaux pour Noël

Pourquoi est'il important ?

Le théorème central limite est sans doute le théorème le plus important des statistiques. C'est le théorème qui nous est le plus utile pour les expérimentations que nous faisons dans le monde. Il est utilisé pour les démarches inférentielles.

Alors n'ayez pas peur de ce nom abstrait, et lancez vous dans la découverte de ses secrets.

Ses fondements

La distribution d'échantillonnage des moyennes

Comment construire la distribution d'échantillonnage des moyennes ?

Pour comprendre le théorème, je vous propose de découvrir le mécanisme de construction d'échantillonnage en 6 étapes.

Etape 1 : Prenons comme exemple la population suivante pour laquelle nous pouvons visualiser la distribution. On notera que la distribution ne suit aucune loi. Elle est totalement aléatoire.

Sur la gauche vous trouverez l'ensemble des individus.
Sur la droite vous trouverez sa distribution totalement aléatoire.

Responsive image

Etape 2 : Prélevons 5 échantillons
Note : La taille de l'échantillon est de 15 éléments.

Responsive image

Etape 3 : On calcul les moyennes et on les positionne sur un graphique

Responsive image

On peux maintenant visualiser les prémices d'une distribution d'échantillonnage avec ces 5 premiers échantillons.

Responsive image

Imaginons que vous ayez prélevé un grand nombre échantillons voici à quoi ressemblerait la distribution.

Responsive image

Si on met vis-à-vis la distribution de la population on remarque que les moyennes des échantillons ont tendance à ce rapprocher de la moyenne de la population car les valeurs extrêmes s'équilibrent. La moyenne d'échantillon est une approximation de la moyenne de la population. En effet la plupart des valeurs sont proche de la moyenne de la population, tout en ne correspondant jamais exactement à celle-ci. Toutefois, on remarque qu'il existe un lien entre a moyenne d'échantillon et la moyenne de la population.

En conséquence on peut affirmer que la moyenne de la distribution d'échantillonage correspond à la moyenne de la population.

Ce que dit le théorème central limite ?

1.A) Si la taille de l'échantillon est suffisament grand (>30) alors la distribution d'échantillonnage se rapproche de la distribution de la loi normale.
1.B) Si la distribution de la population est distribuée selon la loi normale, la distribution d'échantillonnage suit une loi normale indépendement de la taille de l'échantillon.

Responsive image

2) La moyenne de la distribution d'échantillonnage des moyennes des échantillons est égale à la moyenne de la distribution de la population originale.
Responsive image

Responsive image

Cela est vrai quelque soit la forme de la distribution originale.
Voici quelques exemples.

Responsive image

3) L'écart type de la distribution d'échantillonnage est égale à l'écart type de la population divisé par la racine carrée de la taille d'échantillon.
Responsive image

Avec cette formule on peut faire les constats suivants : Plus le σ de la population diminue plus le σ Xdiminue. Egalement plus n augmente plus σ X diminue.

Distribution d'échantillonnage de pourcentage

La distribution d'échantillonnage de pourcentage est une distribution des pourcentages de tous les échantillons possibles qui peuvent être pris dans une situation donnée, ou les échantillons sont des échantillons simples d'un nombre fixe n.

Rappel des notations

  • π est le pourcentage de population.
  • N est la taille de la population
  • X est le nombre d'individu
  • μp est la moyenne de la distribution d'échantillonnage des pourcentages
  • p est le pourcentage de l'échantillon
  • σp est l'écart type de la distribution d'échantillonnage des pourcentages

Moyenne de la distribution d'échantillonnage des pourcentages

Calcul de la moyenne de la population

Responsive image

La moyenne de distribution d'échantillonnage est égale à la moynne de la population.

Responsive image

Ecart type de la distribution d'échantillonnage des pourcentages

L'erreur type du pourcentage est égale à l'écart type de la distribution d'échantillonnage des pourcentages et est représenté par :σp

La formule est la suivante : Responsive image

Exemple : Nombre de mots dans un livre

Par exemple si on prend la longueur des mots d'un livre, on sait que ces longueurs ne suivent pas une loi normale, par contre si on prend comme échantillon une page du livre, et qu l'on fait la même chos pour toutes les pages du livre on verra que les moyennes suivront une loi normale.

Etes-vous curieux ? Alors je vous conseille...

Livre très pratique pour faire des statistiques avec Excel rapidement. Cette page a été inspirée de méthodes décrites dans ce livre.
Dans le top 10 des livres que je recommande !


Pour aller plus loin consulter également le site qui constitue une importante source de connaissance : http://onlinestatbook.com/

Autres sites à découvrir

Autres dossiers à découvrir