Le théorème central limite

Contactez moi pour vos questions

Pourquoi le théorème central limite est important ?

Le théorème central limite est sans doute le théorème le plus important des statistiques. C'est le théorème qui nous est le plus utile pour les expérimentations que nous faisons dans le monde. Il est utilisé pour les démarches inférentielles.

Alors n'ayez pas peur de ce nom abstrait, et lancez vous dans la découverte de ses secrets.

Les fondements du théorème central limite

La distribution d'échantillonnage des moyennes

Comment construire la distribution d'échantillonnage des moyennes ?

Pour comprendre le théorème, je vous propose de découvrir le mécanisme de construction d'échantillonnage en 6 étapes.

Etape 1 : Prenons comme exemple la population suivante pour laquelle nous pouvons visualiser la distribution. On notera que la distribution ne suit aucune loi. Elle est totalement aléatoire.

Sur la gauche vous trouverez l'ensemble des individus.
Sur la droite vous trouverez sa distribution totalement aléatoire.

Population

Etape 2 : Prélevons 5 échantillons
Note : La taille de l'échantillon est de 15 éléments.

 la distribution des échantillons

Etape 3 : On calcul les moyennes et on les positionne sur un graphique

 la distribution d'échantillonnage des moyennes

On peux maintenant visualiser les prémices d'une distribution d'échantillonnage avec ces 5 premiers échantillons.

 la distribution d'échantillonnage

Imaginons que vous ayez prélevé un grand nombre échantillons voici à quoi ressemblerait la distribution.

 la distribution d'échantillonnage 2

Si on met vis-à-vis la distribution de la population on remarque que les moyennes des échantillons ont tendance à ce rapprocher de la moyenne de la population car les valeurs extrêmes s'équilibrent. La moyenne d'échantillon est une approximation de la moyenne de la population. En effet la plupart des valeurs sont proche de la moyenne de la population, tout en ne correspondant jamais exactement à celle-ci. Toutefois, on remarque qu'il existe un lien entre a moyenne d'échantillon et la moyenne de la population.

En conséquence on peut affirmer que la moyenne de la distribution d'échantillonage correspond à la moyenne de la population.

Ce que dit le théorème central limite ?

1.A) Si la taille de l'échantillon est suffisament grand (>30) alors la distribution d'échantillonnage se rapproche de la distribution de la loi normale.
1.B) Si la distribution de la population est distribuée selon la loi normale, la distribution d'échantillonnage suit une loi normale indépendement de la taille de l'échantillon.

Echantillonnage

2) La moyenne de la distribution d'échantillonnage des moyennes des échantillons est égale à la moyenne de la distribution de la population originale.
La moyenne de la distribution d'échantillonnage des moyennes des échantillons est égale à la moyenne de la distribution de la population originale

La moyenne de la distribution d'échantillonnage

Cela est vrai quelque soit la forme de la distribution originale.
Voici quelques exemples.

théorème central limite

3) L'écart type de la distribution d'échantillonnage est égale à l'écart type de la population divisé par la racine carrée de la taille d'échantillon.
L'écart type de la distribution d'échantillonnage est égale à l'écart type de la population divisé par la racine carrée de la taille d'échantillon.

Avec cette formule on peut faire les constats suivants : Plus le σ de la population diminue plus le σ Xdiminue. Egalement plus n augmente plus σ X diminue.

Distribution d'échantillonnage de pourcentage

La distribution d'échantillonnage de pourcentage est une distribution des pourcentages de tous les échantillons possibles qui peuvent être pris dans une situation donnée, ou les échantillons sont des échantillons simples d'un nombre fixe n.

Rappel des notations

  • π est le pourcentage de population.
  • N est la taille de la population
  • X est le nombre d'individu
  • μp est la moyenne de la distribution d'échantillonnage des pourcentages
  • p est le pourcentage de l'échantillon
  • σp est l'écart type de la distribution d'échantillonnage des pourcentages

Moyenne de la distribution d'échantillonnage des pourcentages

Calcul de la moyenne de la population

Moyenne de la distribution d'échantillonnage des pourcentages

La moyenne de distribution d'échantillonnage est égale à la moynne de la population.

La moyenne de distribution d'échantillonnage est égale à la moynne de la population.

Ecart type de la distribution d'échantillonnage des pourcentages

L'erreur type du pourcentage est égale à l'écart type de la distribution d'échantillonnage des pourcentages et est représenté par :σp

La formule est la suivante : Ecart type de la distribution d'échantillonnage des pourcentages

Exemple : Nombre de mots dans un livre

Par exemple si on prend la longueur des mots d'un livre, on sait que ces longueurs ne suivent pas une loi normale, par contre si on prend comme échantillon une page du livre, et qu l'on fait la même chos pour toutes les pages du livre on verra que les moyennes suivront une loi normale.

Etes-vous curieux ? Alors je vous conseille...

Livre très pratique pour faire des statistiques avec Excel rapidement. Cette page a été inspirée de méthodes décrites dans ce livre.
Dans le top 10 des livres que je recommande !


Pour aller plus loin consulter également le site qui constitue une importante source de connaissance : http://onlinestatbook.com/

Autres sites à découvrir

Autres dossiers à découvrir