Comment utiliser la formule COVARIANCE pour analyser les relations entre variables
=COVARIANCE(matrice1; matrice2)La formule COVARIANCE est un outil statistique puissant qui permet de mesurer le degré de relation linéaire entre deux séries de données. Elle est particulièrement utile en analyse financière, en gestion de portefeuille et en études de corrélation. Cette fonction calcule la covariance, c'est-à-dire comment deux variables évoluent ensemble : si elles augmentent simultanément, la covariance est positive ; si l'une augmente tandis que l'autre diminue, la covariance est négative. Dans Excel 2007 et 2010, COVARIANCE représente la version historique de cette fonction statistique. Il est important de noter que Microsoft a introduit deux variantes plus récentes : COVARIANCE.P (covariance de population) et COVARIANCE.S (covariance d'échantillon), qui offrent une meilleure clarté sur la nature des données analysées. Comprendre quand et comment utiliser COVARIANCE est essentiel pour les analystes de données, les statisticiens et les professionnels de la finance qui doivent évaluer les interdépendances entre variables.
Syntaxe et paramètres
La syntaxe de COVARIANCE est simple mais requiert une compréhension précise de ses paramètres. La formule s'écrit =COVARIANCE(matrice1; matrice2), où matrice1 et matrice2 sont deux plages de données obligatoires contenant les valeurs numériques à analyser. Le paramètre matrice1 représente la première série de données, tandis que matrice2 correspond à la deuxième série. Ces deux matrices doivent impérativement avoir le même nombre d'éléments, sinon Excel retournera une erreur #N/A. La fonction calcule la moyenne des produits des écarts de chaque valeur par rapport à sa moyenne respective. Techniquement, COVARIANCE utilise la formule : somme((x-moyenne_x) × (y-moyenne_y)) / nombre_d'éléments. Il est crucial de noter que COVARIANCE considère les données comme une population complète, contrairement à COVARIANCE.S qui traite les données comme un échantillon et applique la correction de Bessel (division par n-1 au lieu de n). Conseil pratique : assurez-vous que vos données sont numériques et exemptes de valeurs vides ou de texte, qui causeraient des erreurs. Les deux plages doivent être contiguës ou séparées, mais doivent correspondre exactement en taille.
array1array2Exemples pratiques
Analyse de corrélation entre ventes et dépenses publicitaires
=COVARIANCE(B2:B13;C2:C13)B2:B13 contient les dépenses publicitaires mensuelles (en euros) et C2:C13 contient les ventes correspondantes. Une covariance positive indiquerait que les augmentations de publicité sont associées à des augmentations de ventes.
Étude de relation entre température et consommation d'énergie
=COVARIANCE(D2:D31;E2:E31)D2:D31 représente les températures quotidiennes moyennes et E2:E31 la consommation d'énergie en kWh. Une covariance négative indiquerait qu'une baisse de température est associée à une augmentation de consommation.
Analyse de portefeuille d'investissement
=COVARIANCE(F2:F25;G2:G25)F2:F25 contient les rendements trimestriels de l'action A (en %) et G2:G25 ceux de l'action B. Cette covariance aide à déterminer si les actions évoluent ensemble (covariance positive) ou indépendamment.
Points clés à retenir
- COVARIANCE mesure comment deux variables évoluent ensemble, avec des valeurs positives indiquant une évolution conjointe et des valeurs négatives une évolution inverse
- Les deux matrices doivent avoir exactement le même nombre d'éléments ; sinon, Excel retourne une erreur #N/A
- Pour les données d'échantillon, privilégiez COVARIANCE.S au lieu de COVARIANCE afin d'appliquer la correction statistique appropriée
- La covariance seule ne mesure pas la force de la relation ; utilisez le coefficient de corrélation (PEARSON) pour une interprétation normalisée
- Combinez COVARIANCE avec d'autres fonctions statistiques pour une analyse multivariée complète et la création de matrices de covariance
Astuces de pro
Utilisez des références absolues ($) lors de la création de matrices de covariance pour éviter que les plages ne se décalent lors de la copie.
Impact : Économise du temps et élimine les erreurs de référence dans les analyses multivariées complexes.
Combinez COVARIANCE avec un graphique de dispersion pour visualiser la relation et valider le signe de la covariance calculée.
Impact : Permet une validation visuelle rapide et aide à identifier les valeurs aberrantes qui pourraient fausser le résultat.
Préférez COVARIANCE.S pour les données d'échantillon et documentez clairement votre choix dans vos rapports pour éviter les malentendus statistiques.
Impact : Assure la rigueur statistique et facilite la communication des résultats aux autres analystes ou décideurs.
Testez la sensibilité de votre covariance en recalculant après suppression de valeurs aberrantes pour évaluer leur impact sur l'analyse.
Impact : Identifie les points de données critiques et améliore la robustesse de votre analyse statistique.
Combinaisons utiles
Calcul du coefficient de corrélation à partir de la covariance
=COVARIANCE(A2:A50;B2:B50)/(ÉCART.TYPE(A2:A50)*ÉCART.TYPE(B2:B50))Cette combinaison normalise la covariance en divisant par le produit des écarts-types, produisant un coefficient de corrélation entre -1 et 1, beaucoup plus facile à interpréter.
Matrice de covariance pour analyse multivariée
=COVARIANCE($A$2:$A$100;B$2:B$100) avec copie en matriceCombinez COVARIANCE avec les références mixtes pour créer une matrice de covariance montrant les relations entre plusieurs variables. Utilisez Ctrl+Maj+Entrée pour les formules matricielles.
Détection d'anomalies basée sur la covariance
=SI(ABS(COVARIANCE(A:A;B:B))>MOYENNE(ABS(C:C));"Anomalie détectée";"Normal")Combinez COVARIANCE avec SI et MOYENNE pour identifier automatiquement les périodes où la relation entre deux variables s'écarte significativement de la normale.
Erreurs courantes
Cause : Les deux matrices n'ont pas le même nombre d'éléments. Par exemple, matrice1 contient 10 valeurs tandis que matrice2 en contient 12.
Solution : Vérifiez que B2:B11 et C2:C11 ont exactement le même nombre de cellules. Utilisez la fonction ROWS() pour comparer : =ROWS(B2:B11) doit égaler =ROWS(C2:C11)
Cause : L'une des matrices contient des valeurs non numériques (texte, dates mal formatées, ou cellules vides mélangées aux nombres).
Solution : Nettoyez vos données en supprimant les cellules vides et en convertissant le texte en nombres. Utilisez Données > Filtrer pour identifier les valeurs problématiques.
Cause : La plage de données référencée a été supprimée ou les coordonnées de cellules sont invalides après une opération de copie-collage.
Solution : Recalculez les références en utilisant le gestionnaire de noms (Formules > Gestionnaire de noms) ou réécrivez la formule avec les bonnes plages.
Checklist de dépannage
- 1.Vérifiez que les deux matrices contiennent exactement le même nombre de cellules (utilisez ROWS() pour comparer)
- 2.Assurez-vous que toutes les valeurs sont numériques et qu'il n'y a pas de texte caché ou d'espaces superflus
- 3.Confirmez que les cellules vides sont traitées correctement (Excel ignore les cellules vides, mais pas les zéros)
- 4.Validez que les références de plage sont correctes et n'ont pas été modifiées par des suppressions de lignes/colonnes récentes
- 5.Testez la formule sur un petit ensemble de données connu pour vérifier que le résultat est logique avant d'appliquer à un grand dataset
- 6.Vérifiez le format des cellules et convertissez les dates ou nombres formatés en tant que texte en véritables nombres
Cas particuliers
Une des deux matrices contient une seule valeur
Comportement : Excel retourne #DIV/0! car le calcul de covariance nécessite au minimum 2 points de données
Solution : Assurez-vous que chaque matrice contient au minimum 2 valeurs numériques
Mathématiquement, la covariance n'est pas définie avec un seul point de données
Les deux matrices contiennent des valeurs identiques (variance nulle)
Comportement : La covariance retourne 0, car il n'y a pas de variation dans les données
Solution : Vérifiez vos données source ; cette situation indique généralement une erreur de saisie ou de copie
Une covariance de 0 ne signifie pas nécessairement une absence de relation, mais plutôt une absence de variation
Les deux matrices contiennent des nombres extrêmement grands ou petits
Comportement : La covariance peut être très grande ou très petite, rendant l'interprétation difficile
Solution : Normalisez vos données en utilisant le coefficient de corrélation (PEARSON) ou en standardisant les variables avant le calcul
Utilisez la formule : (valeur - moyenne) / écart-type pour standardiser avant la covariance
Limitations
- •COVARIANCE traite les données comme une population complète (division par n), ce qui peut biaiser les résultats pour les échantillons ; utilisez COVARIANCE.S pour les données d'échantillon
- •La covariance dépend de l'échelle des données et ne peut pas être directement comparée entre différentes paires de variables ; normalisez avec le coefficient de corrélation pour la comparaison
- •COVARIANCE ne détecte que les relations linéaires ; elle ne capture pas les relations non-linéaires ou complexes entre les variables
- •La fonction est sensible aux valeurs aberrantes qui peuvent fausser significativement le résultat ; une analyse préalable des données est recommandée
Alternatives
Compatibilité
✓ Excel
Depuis Excel 2007
=COVARIANCE(matrice1; matrice2) - Disponible dans Excel 2007, 2010. Remplacée par COVARIANCE.P et COVARIANCE.S dans Excel 2013+✓Google Sheets
=COVARIANCE(array1; array2) - Syntaxe identique avec point-virgule comme séparateurGoogle Sheets supporte COVARIANCE avec la même syntaxe. Les deux variantes COVARIANCE.P et COVARIANCE.S sont également disponibles.
✓LibreOffice
=COVARIANCE(array1; array2) - Utilise le point-virgule comme séparateur d'arguments