Responsive image

L'échantillonnage

"Je veux extrapoler mes données"

Mise à jour le 7 octobre 2018

Avant de commencer

Si vous êtes novice en statistique ou si vous voulez parfaire vos connaissances, vous trouverez sur ce site un programme complet vous permettant de vous approprier les notions fondamentales en statistique en suivants les liens suivant classés dans l'ordre logique d'apprentissage :

  1. Vision d'ensemble des statistiques
  2. Les variables
  3. Les tableaux
  4. Les graphiques
  5. Paramètres statistiques
  6. Distribution statistiques
  7. Distribution normale
  8. Echantillonnage
  9. Demarche

Population et échantillon

Une population : L'ensemble des unités considérés par le statisticien. Il peut s'agir par exemple de l'ensemble des élèves d'une école.

Note : Losrque l'on parle de population, on ne parle pas nécessairement d'êtres humain. Par exemple on pourra considéré comme population, l'ensemble des habitantes de Tunis ou encore les pommes du pommier en bas de chez moi.

Un échantillon : Sous-ensemble de la population choisi pour l'étude. Un échantillon est par nature incomplet, mais peu s'avérer tout à fait suffisant pour atteindre les objectifs de l'étude avec un niveau de confiance suffisant.

Responsive image

Les mesures relatives à une population sont les paramètres.
Les mesures relatives à un échantillon sont appelées statistiques.

Nous allons voir que les terminologies et les symboles sont différents entre une population et un échantillon.

Les symboles

 

Responsive image

Correspondance Population Echantillon
Moyenne
μ
x
Variance
α2
s2
Ecart type
α
s
Taille
N
n
Pourcentage
π
p

 

Pourquoi faire de l'échantillonnage ?

Lorsque l'on souhaite avoir des informations sur une population il n'est pas toujours possible de considéré l'ensemble des entités.
Si par exemple votre population est l'ensemble des élèves d'une école, il est possible d'observer toute la population concernée. (recensement)
Si votre population est le nombre d'habitant du Maroc alors là il est plus difficile de faire des observations sur l'ensemble des individus, dans ce cas là, on peut prélever des échantillons représentatifs de la population.

L'échantillon doit fournir suffisament d'information pour qu'une inférence soit possible à propos des caractéristiques de la population ait le niveau de prévision requis. En effet une estimation de parametres (Moyenne ou écart type) d'une population à partir d'un échantillon s'accompagne nécessairement d'un degré de confiance.

Les avantages de l'échantillonnage sont :
  • un coût moins élevé qu'un recencement
  • une prise de décision plus rapide
  • des destructions de produits limités (cas des contrôles destructifs).
  • La précision des échantillonnage peut être très proche de celle d'un recencement.

Les enjeux de l'échantillonnage

Or les résultats des échantillons ne donnent jamais exactement les mêmes valeurs que les caractéristiques de la population. On appel cela l'erreur d'échantillonnage ou biais d'échantillonnage.

Heureusement, l'erreur d'échantillonnage est quantifiable et les résultats obtenus à partir des échantillons sont utilisables pour la prise de décision.

En effet, associé à un certain degré de confiance, il sera possible de faire des approximations de la population.

Le choix de l'échantillon.

L'enjeux du choix de l'échantillon est déterminer quels unités doivent être prises en compte pour constituer un échantillon représentatif de la population.

Les échantillonnages non probabilistes

Les échantillons non probabilistes est un échantillon dans lequel le jugement de l'expérimateur, ou d'autres facteurs affecte le résultat de l'échantilon.

On trouvera parmi ces méthodes :

  • Les échantillons discrétionnaires. Ce sont des échantillons pour lequel l'expérimentateur estime qu'ils sont représentatifs de la population. Il est toutefois difficile d'estimer à quel point cette estimation est proche de la réalité. En effet la pertinence des résultats dépend de l'expérience de l'expérimentateur.
  • L'échantillon issu d'une participation volontaire est une autre méthode qui dépend de la volonté des personnes sondés, cea engendre un biai dépendant de l'intérêt des personnes sondés sur le sujet.
  • L'échantillon de commodité est également issu d'un échantillonage non probabiliste qui dépend par exemple de l'endroit d'où est réalisé le sondage. Par exemple devant un restaurant.

Les échantillonnages probabilistes

Une échantillon probabiliste est un échantillon pour lequel les chances de prélevé chaque élément est connu avant même le prélèvement de l'échantillon. On notera les techniques d'échantillonnage suivantes :

  • l'échantillonnage aléatoire simple : La probabilité de séelection de chaque membre d'une population a une chance égale d'être inclus à l'intérieur de l'échantillon
  • L'échantillonnage systématique: 'L'expérimentateur détermine un écart, ou un intervalle, systématique entre chaque unité sélectionnée. Par exemple toute les 25 pièces.
  • Echantillonnage stratifié : Il s'agit de divisé la popopluation en strates (regroupement par catégorie)distinctes. En fonction de l'importance relative de chaque catégorie les résultats sont pondérés. (Les bananes de groupe 1 représente 55% des bananes vendu en France, Le groupe 2 reprsésente 17%, le groupe 3...) Le prélèvement effectué sur les bananes de groupe1 seront d'avantge pondéré que celui du groupe 2.
  • l'échantillonnage en grappes; la population est là encore subdivisé en groupe. Par exemple, prenons le cas d'un contrôle qualité d'un lot de 1000 pièces organisé en plateaux de 20 pièces. Au lieu de prélevé 2 pièces dans chacun des 5 plateaux, le qualitaticien pourra prélever l'ensemble des pièces dans leplateaux n°10,n°13 n°27,n°30 ,n°43 ; soit un total de 100 pièces.

Exemple : Nombre de mots dans un livre

Par exemple si on prend la longueur des mots d'un livre, on sait que ces longueurs ne suivent pas une loi normale, par contre si on prend comme échantillon une page du livre, et qu l'on fait la même chos pour toutes les pages du livre on verra que les moyennes suivront une loi normale.

Etes-vous curieux ? Alors je vous conseille...

Livre très pratique pour faire des statistiques avec excel rapidement. Cette page a été inspirée de méthodes décrites dans ce livre.
Dans le top 10 des livres que je recommande !


Pour aller plus loin consulter également le site qui constitue une importante source de connaissance : http://onlinestatbook.com/

Partagez votre expérience avec moi pour améliorer le site : commentprogresser@gmail.com
Card image