COVARIANCE.PEARSON : Calculer la Covariance de Population en Excel
=COVARIANCE.PEARSON(matrice1; matrice2)La formule COVARIANCE.PEARSON est une fonction statistique avancée d'Excel permettant de mesurer la covariance entre deux séries de données en considérant l'ensemble comme une population complète. Contrairement à COVARIANCE.S qui traite les données comme un échantillon, COVARIANCE.PEARSON divise par n (nombre d'observations) plutôt que par n-1, ce qui en fait l'outil idéal pour analyser des populations entières ou des données exhaustives. Cette formule est particulièrement utile dans les domaines de la finance, de la recherche scientifique et de l'analyse de données, où il est crucial de comprendre comment deux variables évoluent ensemble. Elle répond à une question fondamentale : lorsqu'une variable augmente, l'autre augmente-t-elle aussi, diminue-t-elle, ou reste-t-elle indépendante ? La covariance quantifie cette relation de manière précise et mathématiquement robuste. Dans ce guide complet, vous découvrirez comment utiliser COVARIANCE.PEARSON efficacement, comment l'interpréter correctement, et comment l'intégrer dans vos analyses statistiques plus larges pour prendre des décisions basées sur les données.
Syntaxe et paramètres
La syntaxe de COVARIANCE.PEARSON est simple mais puissante : =COVARIANCE.PEARSON(matrice1; matrice2). Le premier paramètre, matrice1, représente la première plage de données (population) contenant les valeurs numériques de votre première variable. Le second paramètre, matrice2, contient les valeurs correspondantes de votre deuxième variable. Ces deux matrices DOIVENT avoir exactement le même nombre d'observations, sinon Excel retournera une erreur #REF! ou #VALUE!. Il est crucial de comprendre que COVARIANCE.PEARSON calcule la covariance de population, c'est-à-dire qu'elle suppose que vous disposez de toutes les données pertinentes et non d'un simple échantillon. La formule multiplie les écarts à la moyenne de chaque série, puis en calcule la moyenne. Un résultat positif indique une relation directe (les variables évoluent ensemble), un résultat négatif indique une relation inverse, et zéro signifie l'absence de relation linéaire. Lors de la saisie, assurez-vous que vos plages ne contiennent que des nombres. Les textes, les cellules vides ou les erreurs causeront des problèmes. Vous pouvez utiliser des références absolues ($A$1:$A$100) pour figer vos plages lors de copie de formules, ou des références mixtes selon vos besoins d'analyse.
array1array2Exemples pratiques
Analyse de Corrélation Ventes-Publicité
=COVARIANCE.PEARSON(B2:B13;C2:C13)B2:B13 contient les 12 mois de dépenses publicitaires, C2:C13 contient les ventes correspondantes. La covariance positive indique que les dépenses publicitaires et les ventes évoluent dans le même sens.
Étude Température-Consommation Énergétique
=COVARIANCE.PEARSON(D5:D28;E5:E28)D5:D28 contient les températures en degrés Celsius, E5:E28 contient la consommation en kWh. Une covariance négative révélerait que plus il fait froid, plus on consomme d'énergie.
Analyse Financière : Rendement Actions vs Indice Marché
=COVARIANCE.PEARSON(Rendements_Action;Rendements_Indice)Utilisation de plages nommées pour plus de clarté. La covariance mesure comment le rendement de l'action fluctue avec le marché global, essentiel pour évaluer le risque systématique.
Points clés à retenir
- COVARIANCE.PEARSON mesure la covariance de POPULATION en divisant par n, contrairement à COVARIANCE.S qui divise par n-1 pour les échantillons
- Une covariance positive indique une relation directe (les variables évoluent ensemble), négative indique une relation inverse, zéro indique l'indépendance linéaire
- Les deux matrices DOIVENT avoir exactement le même nombre d'observations, sinon la formule retourne une erreur #REF! ou #VALUE!
- Pour une interprétation plus facile, utilisez CORREL qui normalise la covariance en un coefficient entre -1 et 1, indépendant des unités de mesure
- Combinez COVARIANCE.PEARSON avec d'autres fonctions (VAR.P, STDEV.P, IF) pour créer des analyses statistiques avancées et des matrices de covariance complètes
Astuces de pro
Utilisez des noms de plages (Données > Définir un nom) pour rendre vos formules COVARIANCE.PEARSON plus lisibles et maintenables. Au lieu de =COVARIANCE.PEARSON(B2:B13;C2:C13), écrivez =COVARIANCE.PEARSON(Ventes_Mensuelles;Publicite_Mensuelle).
Impact : Améliore la clarté du code Excel, réduit les erreurs lors de modifications futures, et facilite la collaboration avec d'autres utilisateurs qui comprendront immédiatement ce que la formule mesure.
Toujours vérifier l'homogénéité de vos données avant d'appliquer COVARIANCE.PEARSON. Utilisez des graphiques de dispersion (scatter plots) pour visualiser la relation et détecter les valeurs aberrantes qui pourraient biaiser le résultat.
Impact : Évite les conclusions trompeuses basées sur des données de mauvaise qualité. Une seule valeur extrême peut drastiquement modifier la covariance calculée.
Combinez COVARIANCE.PEARSON avec IFERROR pour créer des tableaux de bord robustes : =IFERROR(COVARIANCE.PEARSON(B2:B13;C2:C13);"Données insuffisantes"). Cela gère gracieusement les erreurs au lieu de les afficher.
Impact : Crée des rapports professionnels et fiables qui ne se cassent pas si les données changent ou si des valeurs manquantes apparaissent.
Pour comparer la force des relations entre différentes paires de variables, utilisez plutôt CORREL (normalisé) que COVARIANCE.PEARSON (non normalisé), car les échelles différentes faussent la comparaison directe.
Impact : Permet des comparaisons valides entre différentes analyses, essentielles pour identifier les relations les plus importantes dans un ensemble complexe de variables.
Combinaisons utiles
Matrice de Covariance Complète pour Analyse Multi-Variables
=COVARIANCE.PEARSON($B$2:$B$13;C$2:C$13) copié en tableau pour créer une matrice 3x3 des covariancees entre 3 variablesEn combinant COVARIANCE.PEARSON avec des références mixtes ($B$2:$B$13 et C$2:C$13), vous pouvez créer une matrice de covariance complète en copiant la formule. Cela permet d'analyser simultanément les relations entre plusieurs variables (ex: rendement, volatilité, volume).
Ratio de Covariance Normalisée avec Coefficient de Variation
=COVARIANCE.PEARSON(B2:B13;C2:C13)/(STDEV.P(B2:B13)*STDEV.P(C2:C13))Cette combinaison reproduit essentiellement CORREL, en normalisant la covariance par le produit des écarts-types de population. Utile pour créer des versions personnalisées ou comprendre mathématiquement comment la corrélation se dérive de la covariance.
Analyse Conditionnelle de Covariance par Segment
=AVERAGEIF(Segment,"A",COVARIANCE.PEARSON(IF(Segment="A",Ventes),IF(Segment="A",Publicité)))En combinant COVARIANCE.PEARSON avec IF et AVERAGEIF, vous pouvez calculer des covariancees séparées pour différents segments (régions, produits, périodes). Cela permet une analyse granulaire révélant comment les relations varient selon le contexte.
Erreurs courantes
Cause : Les matrices contiennent des textes, des valeurs non numériques ou des cellules vides qui ne peuvent pas être traitées comme des nombres.
Solution : Vérifiez que toutes les cellules des deux plages contiennent uniquement des nombres. Utilisez la fonction NETTOYER() si nécessaire, ou supprimez les lignes avec données manquantes. Exemple : =COVARIANCE.PEARSON(IFERROR(B2:B13,NA());IFERROR(C2:C13,NA()))
Cause : Les deux matrices n'ont pas le même nombre d'observations. Par exemple, matrice1 contient 12 valeurs tandis que matrice2 en contient 11.
Solution : Comptez précisément le nombre de lignes dans chaque plage. Utilisez la fonction LIGNES() pour vérifier : =COVARIANCE.PEARSON(B2:B13;C2:C13) où LIGNES(B2:B13)=LIGNES(C2:C13). Ajustez les plages pour qu'elles aient la même taille.
Cause : Bien que rare, cette erreur peut survenir si une matrice contient une seule valeur ou si le calcul génère une division par zéro interne.
Solution : Assurez-vous que chaque matrice contient au moins 2 observations. Vérifiez qu'aucune des deux variables n'est constante (toutes les valeurs identiques). Exemple de test : =IF(VAR(B2:B13)=0;"Erreur: données constantes";COVARIANCE.PEARSON(B2:B13;C2:C13))
Checklist de dépannage
- 1.Vérifier que les deux matrices ont exactement le même nombre de lignes : utilisez =LIGNES(B2:B13)=LIGNES(C2:C13) pour confirmer
- 2.Confirmer que toutes les cellules contiennent des nombres (pas de texte, pas de symboles spéciaux) : sélectionnez les plages et vérifiez le format de cellule
- 3.Chercher les valeurs manquantes, erreurs ou cellules vides : utilisez Édition > Atteindre et Spécial pour les identifier rapidement
- 4.Vérifier que les plages de références sont correctes et ne contiennent pas d'en-têtes textes : ajustez B2:B13 au lieu de B1:B13 si la ligne 1 contient des labels
- 5.Tester la formule sur un petit sous-ensemble de données connu pour isoler les problèmes avant de l'appliquer à l'ensemble complet
- 6.Examiner le contexte statistique : une covariance très grande ou très petite peut être correcte si les unités de mesure sont très différentes
Cas particuliers
Une des deux variables est constante (toutes les valeurs identiques)
Comportement : COVARIANCE.PEARSON retourne 0, car il n'y a aucune variation pour que cette variable covariatise avec l'autre
Solution : Vérifiez d'abord que vos données contiennent réellement de la variation en utilisant VAR.P(). Si le résultat est 0, il n'y a pas de relation à mesurer.
Cela n'est pas techniquement une erreur, mais indique que l'analyse n'est pas pertinente pour cette variable
Les deux variables sont parfaitement corrélées (y = 2x + 5)
Comportement : COVARIANCE.PEARSON retourne une valeur positive très élevée (ou négative si la relation est inverse), reflétant la dépendance parfaite
Solution : Utilisez CORREL pour confirmer : le résultat devrait être exactement 1 (ou -1 pour une corrélation inverse parfaite)
Cela indique une relation déterministe, utile pour identifier les variables redondantes ou les erreurs de saisie
Les données contiennent des valeurs extrêmes (outliers) significatifs
Comportement : La covariance peut être fortement influencée par ces valeurs aberrantes, donnant une image déformée de la relation réelle
Solution : Visualisez d'abord les données avec un graphique de dispersion. Envisagez d'utiliser une analyse robuste ou d'exclure les outliers après justification statistique. Comparez les résultats avec CORREL pour évaluer l'impact.
La covariance est sensible aux outliers ; une seule valeur extrême peut inverser le signe du résultat
Limitations
- •COVARIANCE.PEARSON ne fonctionne qu'avec des relations LINÉAIRES. Si la relation entre vos variables est non-linéaire (exponentielle, logarithmique, polynomiale), la covariance ne la capturera pas correctement et pourrait même retourner 0.
- •La formule est sensible aux valeurs aberrantes (outliers). Une seule valeur extrême peut drastiquement modifier le résultat. Pour des données bruitées, envisagez des méthodes robustes ou un nettoyage préalable des données.
- •COVARIANCE.PEARSON ne mesure que la force de la relation linéaire, pas la causalité. Une covariance élevée ne signifie pas que l'une des variables CAUSE les changements de l'autre. Une analyse causale requiert des méthodes plus sophistiquées et une compréhension du contexte.
- •Les unités de mesure affectent directement la valeur de covariance, contrairement à la corrélation qui est normalisée. Une covariance de 1000 entre deux variables n'est pas comparable à une covariance de 10 entre d'autres variables sans normalisation préalable.
Alternatives
Calcule la covariance d'échantillon (divise par n-1) plutôt que de population, plus appropriée quand vos données représentent un échantillon statistique.
Quand : Utiliser COVARIANCE.S quand vous travaillez avec un sous-ensemble de données ou un échantillon prélevé d'une population plus large, ce qui est le cas dans la plupart des études scientifiques.
Retourne le coefficient de corrélation normalisé (-1 à 1), beaucoup plus facile à interpréter que la covariance brute et directement comparable entre différentes études.
Quand : Préférer CORREL pour une analyse rapide de la force et la direction de la relation entre deux variables, surtout dans les rapports ou présentations destinées à des non-statisticiens.
Fournit une équation linéaire complète (y = mx + b) permettant de prédire une variable à partir de l'autre, allant au-delà de la simple mesure de covariance.
Quand : Utiliser la régression quand vous avez besoin de prédictions ou d'une modélisation plus sophistiquée, pas seulement de mesurer la relation entre variables.
Compatibilité
✓ Excel
Depuis 2010
=COVARIANCE.PEARSON(matrice1;matrice2) - Disponible dans Excel 2010, 2013, 2016, 2019 et 365✓Google Sheets
=COVARIANCE(range1;range2) - Google Sheets utilise COVARIANCE au lieu de COVARIANCE.PEARSONLa fonction est équivalente mais le nom est différent. COVARIANCE dans Sheets calcule la covariance de population (identique à COVARIANCE.PEARSON d'Excel)
✓LibreOffice
=COVARIANCE(matrice1;matrice2) - LibreOffice Calc utilise COVARIANCE pour la covariance de population