Aller au contenu

Corrélation de Spearman

Un article de Wikipédia, l'encyclopédie libre.
Corrélation de Spearman
Relation parfaitement monotone mais non linéaire. Dans ce cas la corrélation de Spearman est de 1 mais la corrélation de Pearson (linéaire) n'est pas parfaite.
Type
Nommé en référence à
Formule
Voir et modifier les données sur Wikidata

En statistique, la corrélation de Spearman ou rho de Spearman, nommée d'après Charles Spearman (1863-1945) et souvent notée par la lettre grecque (rho) ou est une mesure de dépendance statistique non paramétrique entre deux variables.

La corrélation de Spearman est étudiée lorsque deux variables statistiques semblent corrélées sans que la relation entre les deux variables soit de type affine. Elle consiste à trouver un coefficient de corrélation, non pas entre les valeurs prises par les deux variables mais entre les rangs de ces valeurs. Elle estime à quel point la relation entre deux variables peut être décrite par une fonction monotone. S'il n'y a pas de données répétées, une corrélation de Spearman parfaite de +1 ou -1 est obtenue quand l'une des variables est une fonction monotone parfaite de l'autre.

Définition

[modifier | modifier le code]

Pour un échantillon de taille n, les variables de rang sont calculées à partir des données .

La corrélation de Spearman est définie par :

  • est la covariance de variables de rang,
  • et sont les écarts-types des variables de rang.

On constate que cette définition correspond à la corrélation de Pearson des variables de rang.

Interprétation

[modifier | modifier le code]

Le coefficient de Spearman permet de détecter des tendances monotones. Lorsque la tendance est affine, il se comporte de façon similaire au coefficient de Pearson. En revanche, il sera plus élevé que la corrélation de Pearson si la tendance est monotone mais non affine. Plus la tendance monotone est marquée, plus la valeur du coefficient est proche de 1 ou -1.

De façon similaire au coefficient de Pearson, le coefficient de Spearman aura une valeur positive lorsque la tendance est croissante et négative lorsqu'elle est décroissante.

Lorsque la tendance n'est pas monotone, il aura une valeur proche de 0.

Contrairement au coefficient de Pearson, le coefficient de Spearman est robuste : l'impact d'éventuelles données aberrantes sur sa valeur est limité.

Notes et références

[modifier | modifier le code]