📘 Corrélation et causalité
Deux variables peuvent évoluer ensemble (corrélation) sans que l’une cause l’autre. Distinguer corrélation et causalité est fondamental en sciences sociales pour éviter les erreurs d’interprétation.
📐 Corrélation
Deux variables sont corrélées si elles évoluent ensemble :
• Corrélation positive : quand l’une augmente, l’autre augmente (ex. : revenu et niveau de vie).
• Corrélation négative : quand l’une augmente, l’autre diminue (ex. : taux de chômage et PIB).
• Coefficient de corrélation r : compris entre −1 et +1. Plus |r| est proche de 1, plus la corrélation est forte.
📐 Causalité
Il y a causalité si l’une des variables est la cause de l’autre (relation asymétrique, temporelle, et vérifiée en maintenant les autres variables constantes — ceteris paribus).
Exemple : la pluie cause l’humidité du sol (et non l’inverse).
📐 Pièges classiques
- Variable cachée (confondante) : une troisième variable explique la corrélation apparente entre deux autres. Ex. : corrélation entre glaces vendues et noyades → cause commune = chaleur estivale.
- Causalité inverse : on confond cause et effet. Ex. : « les pays riches ont plus de médecins » → sont-ils riches parce qu’ils ont des médecins, ou ont-ils des médecins parce qu’ils sont riches ?
- Fausse corrélation (corrélation fallacieuse) : corrélation fortuite sans lien logique. Ex. : consommation de fromage et noyades dans la piscine.
📐 Méthodes pour établir la causalité
- Expériences naturelles et quasi-expériences.
- Méthode des différences en différences (DiD).
- Variables instrumentales.
- Randomisation (expériences contrôlées randomisées — RCT).
💡 À retenir
• Corrélation ≠ causalité.
• Variable confondante : troisième variable expliquant une fausse corrélation.
• Ceteris paribus : maintenir les autres variables constantes pour isoler un effet.
• RCT (randomisation) : méthode la plus solide pour établir la causalité.