Responsive image

Les parametres statistiques : Moyenne, Médiane, Ecart type...

Je veux voir l'essentiel de mes données

Mise à jour le 7 octobre 2018

Avant de commencer

Si vous êtes novice en statistique ou si vous voulez parfaire vos connaissances, vous trouverez sur ce site un programme complet vous permettant de vous approprier les notions fondamentales en statistique en suivants les liens suivant classés dans l'ordre logique d'apprentissage :


>> Ce qu'il faut retenir...
  • Les parametres statistique permettent de résumer la distribution d'une variable quantitative
  • Il y a 2 types de parametre : position et dispersion
  • parametre de position
    • Moyenne, Médiane...
  • parametre de dispersion
    • Ecart type...

Le fichier exemple

Télécharger le fichier exemple

Lien : parametretatistique.xlsx

Les parametres

les parametres élémentaires

Comptabiliser le nombre de valeurs

La première question que l'on peut se poser lorsque 'on a un jeu de données à analyser est de déterminer le nombre de valeurs.

Responsive image

Somme de valeurs

Un autre parametre utile est de connaître la somme de ces valeurs.

Responsive image

Valeurs extrêmes

Les valeurs extrêmes sont les valeurs minimum et maximum.

Responsive image

Les parametres de position

Tendance centrale

Ces parametres permettent de rendre de compte du point d'équlibre du jeu de donnée.

Moyenne

Responsive image

La moyenne se calcul en divisant la somme des valeurs par le nombre d'observations.

Responsive image

A retenir - Moyenne
  • le résumé le plus connu des informations

Ses propriétés

  • La moyenne des écarts à la moyenne est nulle
  • Peu sensible aux fluctuation d'échantillonnage
  • Sensible aux valeurs extrèmes
  • Mauvais résumé si la distribution est très dissymétrique
Mediane

Pour trouver la médiane, il faut classer les valeurs du plus petit au plus grand.

Il suffit de regarder ou se trouve le chiffre médian dans une distribution. Il y a autant de sujet inférieur à la médiane que supérieur à la médiane.

Il s'agit donc de la distribution qui la partage en deux parties égales.

Responsive image

A retenir - Médiane

Ses propriétés :

  • La médiane est peu sensible aux valeurs extrèmes
  • Ne se prête pas bien aux calculs mathématiques
Mode

Il s'agit de la valeur la plus fréquement retrouvé. Il s'agit de la valeur associée à la plus grande fréquence (absolue ou relative)

Responsive image

Responsive image

A retenir - Mode

Ses propriétés :

  • Il est possible d'avoir plusieurs mode
  • Les modes relatifs sont toutes les valeurs précédées ou suivies de valeurs de fréquences inférieures

Responsive image

Quantiles

Les quantiles divise la distribution en plusieurs secteurs d'intérêt

Quartiles

Les quantiles habituelement calculés sont les quartiles :

  • Q1: 25% des valeurs sont inférieures au premier quartiles
  • Q2 ou Médiane : 50% des valeurs sont inférieures au deuxième quartiles
  • Q1: 75% des valeurs sont inférieures au troisième quartiles

Responsive image

Responsive image

Responsive image

On interprête le graphique de façon suivante :

  • 25% des valeurs sont inférieures ou égale à 9
  • 50% des valeurs sont inférieures ou égale à 12
  • 75% des valeurs sont inférieures ou égale à 14

Il est possible de choisir d'autre quantiles tel que Deciles, les Centiles, ou des Percentiles particuliers (par exemple 5% ou 95%).

A retenir - Quantiles

Ses propriétés :

  • Il est possible de couper la distribution en
    • Quartiles
    • Deciles
    • Centiles
    • Percentiles particuliers

Les parametres de dispersion

Ces parametres rendent compte de l'étalement des données. Cela permet de montrer si les données sont éloigner ou proche de la moyenne.

Etendue

Il s'agit de différence entre les valeurs extrêmes de la distribution.

Responsive image

A retenir - Etendue

Ses propriétés :

  • Le plus facile à calculer
  • Très sensible aux valeurs extrêmes
  • Indépendant de la valeur de position
  • Ne tient pas compte des valeurs comprises entre les valeurs minimum et maximum

Intervalle Interquartile IQR

Il s'agit de la différence entre les valeurs du troisième et premier quartil.

Responsive image

IQR = 14 - 9 = 5

A retenir - IQR

Ses propriétés :

  • Peu sensible aux valeurs extrêmes
  • Indépendant de la valeur de position

Ecart à la moyenne

Il s'agit des écarts de chaque valeur par rapport à la moyenne.

Responsive image

A retenir - Ecart à la moyenne
  • On constate des écarts positifs et des écarts négatifs.
  • L'addition de tous ces écarts donne comme résultat une valeur égale. Cela ne permet pas de donner d'information sur la dispersion.
  • Il s'agit des valeurs absolues des écart à la moyenne

L'écart absolu moyen

Il s'agit de la moyenne arithmétique des valeurs absolues des écarts de chaque valeur par rapport à la moyenne.

Responsive image

Sur cette derniere ligne vous visualiser la moyenne calculé à partir des valeurs de cette même colonne.

A retenir - Ecart moyen absolu
  • Prend en compte toutes les observations et montre la dispersion des données autour de la moyenne.
  • Peu sensible aux valeurs extrèmes
  • Relativement simple à calculer et comprendre.
  • Il ne permet la réalisation de calculs ultérieurs car les signes algébrique sont ignorés

Variance

Il s'agit de la moyenne des carrés des écarts.
Il rend compte de l'éloignement de chaque valeur par rapport à la moyenne.

Responsive image

Responsive image

A retenir - Variance

Ses propriétés :

  • Toujours positif
  • Dépendant de la valeur de position
  • Pas d'unité du même ordre que la valeur étudié

Ecart type

Il s'agit de la racine carré de la variance

Responsive image

A retenir - écart type

Ses propriétés :

  • Mesure la dispersion autour de la moyenne
  • Toujours positif
  • De même unité que la moyenne
  • Il donne une idée de la distribution
  • Sensible aux valeurs extrêmes
  • C'est la mesure la plus fréquement utilisé

Si la distribution suit une loi normale, il est possible de dire que :

  • les 68% des valeurs sont comprises entre m - 1 écart type et m + 1 écart type.
  • les 95% des valeurs sont comprises entre m - 2 écart type et m + 2 écart type.

Responsive image

Vous trouverez un dossier complet sur ce sujet sur la page distribution normale .

Combinaison position/dispersion

Le coefficient de variation

Il combine les parametres de moyenne et d'écart type.

Il permet de comparer 2 variables de nature différentes

Responsive image

Etes-vous curieux ? Alors je vous conseille...

Livre très pratique pour faire des statistiques avec excel rapidement. Cette page a été inspirée de méthodes décrites dans ce livre.
Dans le top 10 des livres que je recommande !


Pour aller plus loin consulter également le site qui constitue une importante source de connaissance : http://onlinestatbook.com/

Partagez votre expérience avec moi pour améliorer le site : commentprogresser@gmail.com
Card image