LOI.HYPERGEOMETRIQUE.N : Calculer les Probabilités d'Échantillonnage sans Remise
=LOI.HYPERGEOMETRIQUE.N(succès_échantillon; nb_échantillon; succès_population; nb_population; cumulative)La formule LOI.HYPERGEOMETRIQUE.N est une fonction statistique avancée d'Excel qui permet de calculer la probabilité d'obtenir un nombre spécifique de succès lors d'un échantillonnage sans remise d'une population finie. Contrairement à la distribution binomiale qui suppose une probabilité constante, la loi hypergéométrique tient compte du fait que chaque tirage modifie les probabilités des tirages suivants, ce qui la rend essentielle pour les analyses de qualité, les audits et les études statistiques en environnement réel. Cette fonction est particulièrement utile en contrôle de qualité industriel, en audit financier et en recherche scientifique, où l'on doit évaluer la probabilité de détecter un certain nombre de défauts ou d'anomalies dans un lot limité. Elle permet de répondre à des questions comme : « Quelle est la probabilité de trouver exactement 3 produits défectueux dans un échantillon de 50 unités prélevées d'un lot de 500 contenant 25 défauts ? » Comprendre et maîtriser LOI.HYPERGEOMETRIQUE.N vous permettra de prendre des décisions statistiques plus robustes et d'interpréter correctement les résultats d'échantillonnage en situations réelles où les populations sont finies et les prélèvements sans remise.
Syntaxe et paramètres
La syntaxe complète de LOI.HYPERGEOMETRIQUE.N est : =LOI.HYPERGEOMETRIQUE.N(succès_échantillon; nb_échantillon; succès_population; nb_population; cumulative). Le premier paramètre « succès_échantillon » représente le nombre exact de succès que vous souhaitez observer dans votre échantillon. Le deuxième paramètre « nb_échantillon » est la taille totale de l'échantillon prélevé. Le troisième paramètre « succès_population » indique le nombre total de succès présents dans toute la population. Le quatrième paramètre « nb_population » représente la taille totale de la population source. Enfin, le paramètre « cumulative » est crucial : en mettant FAUX, vous obtenez la probabilité exacte (fonction de masse) ; en mettant VRAI, vous obtenez la probabilité cumulée jusqu'à ce nombre de succès. Tous les paramètres doivent être des entiers positifs, et les valeurs d'échantillon ne peuvent pas dépasser les valeurs de population correspondantes. Excel validera automatiquement ces conditions et retournera une erreur #NUM! si les contraintes ne sont pas respectées.
sample_snumber_samplepopulation_snumber_popcumulativeExemples pratiques
Contrôle de qualité dans une usine textile
=LOI.HYPERGEOMETRIQUE.N(3;50;30;500;FAUX)Cette formule calcule la probabilité exacte (non cumulée) de détecter précisément 3 défauts. Les paramètres indiquent : 3 succès recherchés dans un échantillon de 50, sachant que la population de 500 contient 30 défauts. Le résultat aide à valider si l'échantillon prélevé est représentatif.
Audit financier d'une banque
=LOI.HYPERGEOMETRIQUE.N(5;100;80;1000;VRAI)En utilisant VRAI pour le paramètre cumulative, cette formule retourne la probabilité cumulée de trouver 0, 1, 2, 3, 4 ou 5 anomalies. C'est utile pour établir des seuils d'acceptation : si cette probabilité est très faible, cela indiquerait un audit insuffisant.
Étude de satisfaction client dans un restaurant
=LOI.HYPERGEOMETRIQUE.N(20;30;120;200;FAUX)Cette formule évalue la probabilité que exactement 20 clients satisfaits soient présents dans l'échantillon de 30. Elle permet de valider si le taux de satisfaction observé est cohérent avec les données historiques.
Points clés à retenir
- LOI.HYPERGEOMETRIQUE.N calcule les probabilités d'échantillonnage sans remise dans les populations finies, contrairement à LOI.BINOMIALE.N qui suppose une remise.
- Le paramètre 'cumulative' est crucial : FAUX donne la probabilité exacte, VRAI donne la probabilité cumulée jusqu'au nombre spécifié.
- Tous les paramètres doivent être des entiers positifs avec des relations cohérentes (succès ≤ population, échantillon ≤ population).
- Cette formule est essentielle en contrôle qualité, audit financier et recherche scientifique pour évaluer les risques d'échantillonnage.
- Pour les très grandes populations, LOI.HYPERGEOMETRIQUE.N converge vers LOI.BINOMIALE.N, permettant une optimisation des calculs sans perte de précision.
Astuces de pro
Utilisez le paramètre cumulative=VRAI pour créer des intervalles de confiance. Calculez P(X≤k) et P(X≤k-1), puis soustrayez pour obtenir P(X=k).
Impact : Cela permet de construire des tests d'hypothèse robustes et de définir des régions d'acceptation statistiquement valides pour vos contrôles qualité.
Pour les grandes populations (>10000), comparez les résultats de LOI.HYPERGEOMETRIQUE.N avec LOI.BINOMIALE.N. Si les différences sont négligeables (<0.1%), utilisez LOI.BINOMIALE.N pour plus de performance.
Impact : Cela optimise vos feuilles de calcul complexes sans sacrifier la précision statistique, particulièrement important pour les modèles financiers volumineux.
Créez une fonction personnalisée VBA si vous devez appliquer LOI.HYPERGEOMETRIQUE.N sur des plages entières : Function HyperGeo(plage1, plage2, ...) pour éviter les entrées répétitives.
Impact : Réduit les erreurs de saisie et améliore la maintenabilité de vos modèles, surtout dans les audits et contrôles qualité répétitifs.
Documentez toujours vos hypothèses (définition de 'succès', taille réelle de la population, méthode d'échantillonnage) dans les commentaires de cellule pour éviter les mauvaises interprétations.
Impact : Garantit la traçabilité et la conformité réglementaire, essentielle dans les audits financiers et les certifications ISO.
Combinaisons utiles
Analyse de sensibilité avec tableau de données
=LOI.HYPERGEOMETRIQUE.N($A$2;$B$2;C$1;$D$2;FAUX) en tableau croisé dynamiqueCréez un tableau de données bidimensionnel où vous faites varier le nombre de succès dans la population (C$1) et observez comment la probabilité change. Utilisez les références mixtes ($A$2 pour fixer, C$1 pour varier) pour explorer différents scénarios.
Détermination de seuils d'acceptation avec SOMME
=SOMME(LOI.HYPERGEOMETRIQUE.N(LIGNE(INDIRECT("1:"&A1));A2;A3;A4;FAUX))Calculez la probabilité cumulée de trouver entre 0 et N succès en sommant les probabilités individuelles. Cela permet de définir des critères d'acceptation/rejet pour les contrôles de qualité.
Comparaison avec distribution binomiale
=LOI.HYPERGEOMETRIQUE.N(A1;A2;A3;A4;FAUX)-LOI.BINOMIALE.N(A1;A2;A3/A4;FAUX)Mesurez l'écart entre la distribution hypergéométrique et binomiale pour évaluer l'impact du tirage sans remise. Un écart faible indique que LOI.BINOMIALE.N aurait suffi.
Erreurs courantes
Cause : Les paramètres violent les contraintes mathématiques : succès_échantillon > nb_échantillon, ou succès_population > nb_population, ou succès_échantillon > succès_population, ou (nb_échantillon - succès_échantillon) > (nb_population - succès_population).
Solution : Vérifiez que : succès_échantillon ≤ min(nb_échantillon, succès_population) et que nb_échantillon ≤ nb_population. Par exemple, ne pas chercher 10 succès dans un échantillon de 5 unités.
Cause : Un ou plusieurs paramètres ne sont pas des nombres entiers, ou contiennent du texte, ou font référence à des cellules vides.
Solution : Assurez-vous que tous les paramètres sont des entiers positifs. Utilisez INT() pour convertir les décimales : =LOI.HYPERGEOMETRIQUE.N(INT(A1);INT(A2);INT(A3);INT(A4);FAUX)
Cause : Une référence de cellule utilisée dans la formule pointe vers une cellule supprimée ou un classeur fermé.
Solution : Vérifiez toutes les références de cellules. Recalculez les références manuellement ou utilisez l'outil de suivi des formules (Formules > Évaluer la formule) pour identifier la source du problème.
Checklist de dépannage
- 1.Vérifiez que succès_échantillon est un entier ≥ 0 et ≤ min(nb_échantillon, succès_population)
- 2.Assurez-vous que nb_échantillon ≤ nb_population et que succès_population ≤ nb_population
- 3.Confirmez que le paramètre cumulative est soit VRAI/1, soit FAUX/0 (pas de texte)
- 4.Vérifiez que toutes les références de cellules sont valides et que les cellules ne sont pas vides
- 5.Testez avec des valeurs simples connues (ex: 1 succès sur 1 tiré d'une population de 2 avec 1 succès = 0.5)
- 6.Utilisez l'outil 'Évaluer la formule' (Formules > Évaluer la formule) pour identifier précisément où se produit l'erreur
Cas particuliers
Population très petite (nb_population < 10) avec échantillon important
Comportement : Les probabilités deviennent très sensibles aux changements de paramètres. Par exemple, si nb_population=5 et nb_échantillon=4, il n'existe que 5 configurations possibles.
Solution : Vérifiez manuellement les résultats avec de petites populations. Envisagez d'énumérer toutes les combinaisons possibles pour valider.
Les petites populations rendent la loi hypergéométrique très discrète et non approximable par une distribution normale.
Tous les éléments de la population sont des succès (succès_population = nb_population)
Comportement : La formule retourne 1 (probabilité certaine) si succès_échantillon = nb_échantillon, et 0 sinon.
Solution : C'est un comportement mathématiquement correct. Assurez-vous que votre modèle métier reflète cette situation (ex: tous les produits sont conformes).
Ce cas extrême valide que la formule fonctionne correctement aux limites.
Aucun succès dans la population (succès_population = 0)
Comportement : La formule retourne 1 si succès_échantillon = 0, et 0 sinon. Aucun succès ne peut être trouvé dans l'échantillon.
Solution : Vérifiez vos données d'entrée. Ce cas peut indiquer un problème de définition des 'succès' ou une population entièrement défectueuse.
Similaire au cas précédent, c'est un comportement attendu aux limites mathématiques.
Limitations
- •LOI.HYPERGEOMETRIQUE.N ne fonctionne que pour les populations finies bien définies. Elle ne peut pas être utilisée pour les populations infinies ou continues.
- •Tous les paramètres doivent être des entiers. Les données décimales doivent être arrondies ou tronquées, ce qui peut introduire des biais statistiques mineurs.
- •La formule suppose un échantillonnage véritablement aléatoire et sans remise. Les biais d'échantillonnage ou les corrélations entre éléments ne sont pas pris en compte.
- •Pour les très grandes populations (>100000), les calculs peuvent être numériquement instables. Dans ces cas, LOI.BINOMIALE.N ou une approximation normale sont préférables pour la stabilité numérique.
Alternatives
Offre une flexibilité maximale et permet de comprendre la mathématique sous-jacente : =COMBIN(succès_pop;succès_éch)*COMBIN(nb_pop-succès_pop;nb_éch-succès_éch)/COMBIN(nb_pop;nb_éch)
Quand : Utilisez cette approche pour des calculs personnalisés ou quand vous travaillez dans une version Excel très ancienne sans LOI.HYPERGEOMETRIQUE.N.
Compatibilité
✓ Excel
Depuis Excel 2010
=LOI.HYPERGEOMETRIQUE.N(succès_échantillon; nb_échantillon; succès_population; nb_population; cumulative)✓Google Sheets
=HYPGEOM.DIST(succès_échantillon; nb_échantillon; succès_population; nb_population; cumulative) en anglais, ou implémenter manuellement avec COMBIN()Google Sheets utilise la syntaxe anglaise HYPGEOM.DIST(). La fonction LOI.HYPERGEOMETRIQUE.N n'existe pas. Pour la version française, utilisez la formule mathématique manuelle.
✓LibreOffice
=HYPGEOM(succès_échantillon; nb_population; succès_population; nb_échantillon; cumulative) - Attention : l'ordre des paramètres est différent!