Estimation de paramètres

La statistique - Enjeux

Démarche statistique

Les variables

Les tableaux

Les graphiques

Parametres statistiques

Probabilite

Distribution statistiques

Distribution normale

Distribution binomiale

Distribution de Poisson

Courbe de Gauss avec Excel

Echantillonnage

Estimation de paramètres

Théorème central limite

Tests statistiques

Estimation, estimateur, critère

On va voir dans ce dossier comment estimer la moyenne d'une population, un pourcentage de population et la variance d'une population. Bien sûr, ces estimations ne correspondront jamais aux valeurs exactes des paramètres de la population. Les erreurs sont inévitables lorsqu'il s'agit d'estimation, mais vous allez voir que l'importance de ces erreurs peut être évaluée et contrôlée.

Faire une estimation implique nécessairement d'accompagner une proposition d'un degré de confiance.

Une estimation : Une estimation est une valeur spécifique ou une quantité obtenue pour une statistique telle que la moyenne de l'échantillon, le pourcentage de l'échantillon, la variance de l'échantillon.

L'estimation est également un processus qui consiste à produire une estimation d'un paramètre de la population.

Un estimateur : Un estimateur est une statistique qui est utilisé pour estimer un paramètre.

Par exemple la moyenne de l'échantillon x est un estimateur de la moyenne μ. Voir tableau ci-dessous :

Correspondance	Population	Echantillon
Moyenne	μ	x
Variance	α²	s²
Ecart-type	α	s
Taille	N	n
Pourcentage	π	p

Estimationd e paramétres statistiques

Un estimateur sans biais : Un estimateur sans biais est un estimateur pour lequel la distribution d'échantillonnage a une moyenne qui est égale au paramètre de la population qui est estimé.

Les 2 types d'estimation

L'estimation ponctuelle

L'estimation ponctuelle est une estimation où l'estimateu est un simple nombre utilisé pour estimer un paramètre de population.

L'estimation par intervalle

L'estimation par intervalle est une estimation où l'estimateur est une étendue de valeur utilisée pour estimer un paramètre de population.

En effet, il est assez exceptionnel, par exemple, que la moyenne d'un échantillon soit exactement égale à la moyenne de la population.

Quel type d'estimation choisir ?

L'estimation ponctuelle le sera presque tout le temps fausse et surtout ne laissera pas présager de la précision de l'estimation. A la différence de l'estimation par intervalle qui donnera une étendue qui contiendra le paramètre de la population. Dans ce cas, l'erreur d'échantillonnage sera intégrée dans l'intervalle. La précision de l'estimation est donc quantifiée. Bien sûr, une estimation par intervalle peut être fausse, mais, à la différence de l'estimation ponctuelle le, la probabilité d'erreur de l'intervalle peut être déterminé.

Estimation par intervalle

La largeur de l'intervalle

Un intervalle de confiance est un intervalle de valeurs à l'intérieur duquel la valeur exacte se trouve probablement.
L'amplitude de l'intervalle caractérise la précision de l'estimation. Si l'on est, dans le cas où la taille d'échantillonnage est suffisamment grande pour que la distribution d'échantillonnage suive une loi normale, on peut affirmer que 95.4% des moyennes des échantillons se situeront à ±2σ_x de μ.

On peut également faire l'affirmation inverse, si nous avons un échantillon qui a une moyenne x alors la moyenne μ de la population sera se situera à ±2σ_x de x.

Responsive image

Fiabilité et précision

Prenons l'exemple suivant :

La population possédant une cafetière à capsule se situe entre 27% et 33% de la population avec un risque de 5%.

La fiabilité est représentée par le chiffre de (5%) soit 95%
La précision est représentée par l'intervalle (33%-27%) soit 6%

Estimation d'une moyenne inconnue

Pour estimer une moyenne inconnue, je vous invite à consulter notre dossier sur le théorème central limite qui explique de façon détaillée comment faire une telle estimation.

Le risque d'erreur consenti α

Par convention, jusqu'à présent, nous avons estimé les intervalles de confiance des moyennes à 95 %, c'est-à-dire un risque d'erreur de 5 %. On appelle risque d'erreur α. En fonction des situations, il est possible de choisir un risque d'erreur différent de 5 %.

Pour chaque valeur de risque α il existe une correspondance de la valeur Z

α	Z
5%	1.96
2%	2.33
1%	2.58
0.1%	3.3

Si nous choisissons un risque d'erreur plus faible, cela implique automatiquement en élargissement de l'intervalle de confiance et donc d'une estimation moins précise.

Détermination de la taille de l’échantillon

Précision d'une estimation

La précision d'une estimation dépend du risque alpha α et de la taille n de l'échantillon.

Influence du risque alpha

Plus de risque alpha et petit plus la valeur Z est grande et plus l'intervalle de confiance est grand.

Influence de la taille de l'échantillon

La taille de l'échantillon intervient dans la formule qui détermine l'écart-type de la moyenne.

Rappel du calcul de l'écart-type de la moyenne (Théorème central limite)

l'écart-type de la moyenne m est égal à l'écart-type des valeurs de l'échantillon population divisé par la racine carrée de la taille d'échantillon.
l'écart-type de la distribution d'échantillonnage est égale à l'écart-type de la population divisé par la racine carrée de la taille d'échantillon.

En conséquence, plus la taille de l'échantillon est grandes plus l'écart-type de la moyenne est petit, plus l'intervalle de confiance sera serré.

Cela permettra une plus grande précision.

Détermination de la taille de l'échantillon

Pour une estimation de moyenne

Afin de déterminer la taille de l'échantillon la formule suivante pourra être utilisée :

Z_αsera généralement égale à 1.96.

La variance σ² de la variable quantitative étudiée dans la population est souvent estimée d'après des études antérieures sur le même sujet.

La valeur i est la précision désirée, c'est-à-dire la moitié de l'intervalle de confiance.

Les lois statistiques

Des lois statistiques régissent les différents paramètres statistiques issus de l'échantillonnage telle que :

la loi de Student pour les moyennes
la loi du Chi2 pour les écarts type
la loi de Fisher pour le quotient de deux variances
la loi binomiale pour les proportions.

Choisir la loi qui convient pour traiter les résultats des échantillons est nécessaire mais dans certains cas il est possible d'utiliser des lois différentes Par exemple :

une loi normale à la place d'une loi de Student
une loi normale à la place d'une loi binomiale
une loi de Poisson à la place d'une loi binomiale
une loi normale à la place de la loi de Poisson

Autres dossiers sur l'analyse de données sur commentprogresser.com

🚀 Boostez Vos Compétences! 🚀

Découvrez nos micro-formations et conseils en:

Utilisation des outils qualité
Le contrôle qualité
Techniques de résolution de problèmes
Le tableaux de bord qualité
... et bien plus encore!

Formations sur mesure adaptées à VOS besoins, disponibles rapidement.

📩Écrivez-nous à: commentprogresser@gmail.com

Nicolas DEROBERT