ElyxAI
data manipulation

Comment Utiliser Supprimer les doublons dans PUISSANCE Query

Excel 2016Excel 2019Excel 365

Apprenez à supprimer efficacement les lignes en double de vos ensembles de données à l'aide de la fonction Supprimer les doublons de Power Query. Ce tutoriel couvre l'accès à l'outil, la sélection des colonnes à analyser et l'application de la déduplication.

Pourquoi c'est important

Supprimer les doublons est essentiel pour l'intégrité des données et l'analyse précise; Power Query automatise cette tâche sur de grands ensembles de données.

Prérequis

  • Excel 2016 ou version ultérieure (Excel 365 recommandé)
  • Compréhension de base du chargement de données dans Power Query
  • Accès à l'interface de l'éditeur Power Query

Instructions étape par étape

1

Charger vos données dans Power Query

Sélectionnez votre plage de données et accédez à Données > Obtenir et transformer des données > À partir du tableau/plage pour ouvrir l'éditeur Power Query.

2

Accéder à la fonction Supprimer les doublons

Dans l'éditeur Power Query, allez à l'onglet Accueil et cliquez sur Supprimer les lignes > Supprimer les doublons dans le ruban.

3

Sélectionner les colonnes pour la détection des doublons

Une boîte de dialogue s'affiche; choisissez les colonnes à vérifier pour les doublons (laissez tout sélectionné pour supprimer les lignes identiques).

4

Examiner les résultats de suppression des doublons

Power Query affiche un aperçu montrant combien de lignes seront supprimées; confirmez l'opération avant de continuer.

5

Fermer et charger les données nettoyées

Cliquez sur Fermer et charger ou Fermer et charger dans pour terminer; Power Query retournera vos données dédupliquées à une feuille de calcul.

Méthodes alternatives

Utiliser l'onglet Données (méthode héritée)

Dans le ruban principal d'Excel, sélectionnez Données > Outils de données > Supprimer les doublons pour les anciennes versions Excel.

Filtrer et supprimer manuellement

Utilisez le Filtre avancé avec les enregistrements uniques uniquement, puis supprimez les lignes en double manuellement.

Utiliser des formules avec mise en forme conditionnelle

Combinez COUNTIF et des colonnes d'aide pour identifier les doublons, puis filtrez et supprimez les lignes visuellement.

Astuces et conseils

  • Créez toujours une sauvegarde avant de supprimer les doublons pour éviter la perte accidentelle de données.
  • Triez vos données avant la déduplication pour examiner les lignes à supprimer.
  • Utilisez la déduplication spécifique aux colonnes si vous souhaitez faire correspondre uniquement certains champs.

Astuces avancées

  • Combinez Supprimer les doublons avec d'autres transformations Power Query dans une seule requête pour une efficacité maximale.
  • Conservez les données originales dans un tableau séparé et utilisez Power Query pour créer une version dédupliquée.
  • Documentez les colonnes utilisées pour la détection des doublons pour maintenir les normes de gouvernance des données.

Résolution de problèmes

Le bouton Supprimer les doublons est grisé

Assurez-vous que vous avez sélectionné des données dans l'éditeur Power Query; la fonctionnalité nécessite une sélection active.

Les lignes en double apparaissent toujours après la suppression

Vérifiez les espaces blancs, la sensibilité à la casse ou les différences de formatage; Power Query effectue des correspondances exactes.

Trop de lignes ont été supprimées de manière inattendue

Vérifiez votre sélection de colonnes dans la boîte de dialogue Supprimer les doublons; vous avez peut-être inclus des colonnes à exclure.

Formules Excel associées

Questions fréquentes

Supprimer les doublons dans Power Query préserve-t-il les données originales?
Non, Supprimer les doublons modifie votre résultat de requête; le tableau Excel original reste inchangé. Conservez toujours une sauvegarde ou utilisez une feuille séparée.
Puis-je annuler Supprimer les doublons après la fermeture de la requête?
Non, une fois que vous fermez et chargez les données dédupliquées, vous ne pouvez pas annuler l'opération. Cependant, vous pouvez rouvrir la requête originale si elle est disponible.
Que se passe-t-il pour les données dans les colonnes masquées lors de l'utilisation de Supprimer les doublons?
Les colonnes masquées sont toujours prises en compte dans la détection des doublons; seules les colonnes visibles sont analysées dans Power Query.
Puis-je supprimer les doublons en fonction de plusieurs critères?
Oui, vous pouvez sélectionner plusieurs colonnes dans la boîte de dialogue Supprimer les doublons; Power Query considérera une ligne comme doublon si toutes les colonnes sélectionnées correspondent exactement.

C'etait une tache. ElyxAI en gere des centaines.

S'inscrire