Comment Utiliser Supprimer les doublons dans PUISSANCE Query
Apprenez à supprimer efficacement les lignes en double de vos ensembles de données à l'aide de la fonction Supprimer les doublons de Power Query. Ce tutoriel couvre l'accès à l'outil, la sélection des colonnes à analyser et l'application de la déduplication.
Pourquoi c'est important
Supprimer les doublons est essentiel pour l'intégrité des données et l'analyse précise; Power Query automatise cette tâche sur de grands ensembles de données.
Prérequis
- •Excel 2016 ou version ultérieure (Excel 365 recommandé)
- •Compréhension de base du chargement de données dans Power Query
- •Accès à l'interface de l'éditeur Power Query
Instructions étape par étape
Charger vos données dans Power Query
Sélectionnez votre plage de données et accédez à Données > Obtenir et transformer des données > À partir du tableau/plage pour ouvrir l'éditeur Power Query.
Accéder à la fonction Supprimer les doublons
Dans l'éditeur Power Query, allez à l'onglet Accueil et cliquez sur Supprimer les lignes > Supprimer les doublons dans le ruban.
Sélectionner les colonnes pour la détection des doublons
Une boîte de dialogue s'affiche; choisissez les colonnes à vérifier pour les doublons (laissez tout sélectionné pour supprimer les lignes identiques).
Examiner les résultats de suppression des doublons
Power Query affiche un aperçu montrant combien de lignes seront supprimées; confirmez l'opération avant de continuer.
Fermer et charger les données nettoyées
Cliquez sur Fermer et charger ou Fermer et charger dans pour terminer; Power Query retournera vos données dédupliquées à une feuille de calcul.
Méthodes alternatives
Utiliser l'onglet Données (méthode héritée)
Dans le ruban principal d'Excel, sélectionnez Données > Outils de données > Supprimer les doublons pour les anciennes versions Excel.
Filtrer et supprimer manuellement
Utilisez le Filtre avancé avec les enregistrements uniques uniquement, puis supprimez les lignes en double manuellement.
Utiliser des formules avec mise en forme conditionnelle
Combinez COUNTIF et des colonnes d'aide pour identifier les doublons, puis filtrez et supprimez les lignes visuellement.
Astuces et conseils
- ✓Créez toujours une sauvegarde avant de supprimer les doublons pour éviter la perte accidentelle de données.
- ✓Triez vos données avant la déduplication pour examiner les lignes à supprimer.
- ✓Utilisez la déduplication spécifique aux colonnes si vous souhaitez faire correspondre uniquement certains champs.
Astuces avancées
- ★Combinez Supprimer les doublons avec d'autres transformations Power Query dans une seule requête pour une efficacité maximale.
- ★Conservez les données originales dans un tableau séparé et utilisez Power Query pour créer une version dédupliquée.
- ★Documentez les colonnes utilisées pour la détection des doublons pour maintenir les normes de gouvernance des données.
Résolution de problèmes
Assurez-vous que vous avez sélectionné des données dans l'éditeur Power Query; la fonctionnalité nécessite une sélection active.
Vérifiez les espaces blancs, la sensibilité à la casse ou les différences de formatage; Power Query effectue des correspondances exactes.
Vérifiez votre sélection de colonnes dans la boîte de dialogue Supprimer les doublons; vous avez peut-être inclus des colonnes à exclure.
Formules Excel associées
Questions fréquentes
Supprimer les doublons dans Power Query préserve-t-il les données originales?
Puis-je annuler Supprimer les doublons après la fermeture de la requête?
Que se passe-t-il pour les données dans les colonnes masquées lors de l'utilisation de Supprimer les doublons?
Puis-je supprimer les doublons en fonction de plusieurs critères?
C'etait une tache. ElyxAI en gere des centaines.
S'inscrire