Repérer, Gérer Et Supprimer Les Doublons Excel Facilement

minutes de lecture

avril 22, 2021

0

Text Only 03

Les doublons Excel sont des redondances des données qui peuvent être à l'origine de plusieurs erreurs.

Ils sont le plus souvent issus d’erreurs de saisie ou d'une fausse manipulation.

Dans les deux cas on se retrouve souvent amené à devoir gérer les doublons de façons différentes selon nos besoins et selon la nature des données.

Heureusement, Excel met à notre disposition plusieurs fonctionnalités pratiques et simples à mettre en application pour isoler, comptabiliser, analyser ou tout simplement se débarrasser de ces doublons.

Cet article vous présente les différentes méthodes permettant de gérer les doublons Excel et vous donne des astuces pour éviter certaines erreurs de manipulation et d’interprétation.

Qu’est ce qu’un doublon Excel ?

Un doublon Excel est la répétition ou la redondance d’une même valeur textuelle ou numérique une ou plusieurs fois sur une ou plusieurs colonnes.

Prenons l’exemple du tableau suivant et considérons la colonne "I" correspondant au champ « Client ».

supprimer les doublons Excel

Sur cette colonne, on note régulièrement les fournisseurs relatifs à chaque commande et il est tout à fait normal de recourir au même fournisseur plusieurs fois.

Si cette colonne contient 65 lignes, cela ne veut pas dire pour autant que nous avons 65 fournisseurs, ces valeurs renferment donc certainement des doublons. 

Gérer les doublons Excel

Cacher ou supprimer les doublons Excel sont les tâches les plus fréquentes dans la gestion de ce type de redondance de données.

Et pour répondre aux différents besoins de saisie ou d'analyse, il est fréquent de procéder par plusieurs manières.

Si par exemple nous avons juste besoin de repérer les valeurs uniques sur une colonne on peut recourir à un filtre.

Pour cela (en utilisant toujours le même exemple):

  • Sélectionner la première ligne.
  • Cliquez sur l'onglet "Données".
  • Appuyez sur le raccourci "Filtrer".
supprimer les doublons Excel

Pour visualiser les données de la colonne sans doublons, il suffit de cliquer sur la petite flèche qui apparaît sur l’entête de chaque colonne comme suit :

supprimer les doublons Excel

Nous pouvons, selon les besoins, avoir besoin soit de définitivement supprimer les doublons Excel, soit les masquer momentanément pour ne pas perdre les données.

Nous allons donc, dans ce qui suit, découvrir comment procéder pour gérer tous les doublons d'une feuille.

Trouver les doublons Excel sur une Même colonne

Avant de supprimer les doublons Excel, nous devons d'abord les trouver.

Nous pouvons y parvenir à l’aide d’une formule.

Prenons l’exemple d’une base de données contenant une colonne où l'on note régulièrement nos clients, ces données sont donc susceptibles de contenir des doublons.

Pour les repérer, voici ce qu'il faut faire :

  • Commençons par insérer une colonne vide qu'on nommera "Doublons" pour y afficher les valeurs qui se répètent ( ce qui équivaut aux doublons).
  • En second lieu, insérer la formule suivante dans la première ligne de la nouvelle colonne : =SI(NB.SI($I$5 :I5 ;I5)>1 ; " doublon " ; " " ).                     Cette formule va permettre d’afficher le mot « doublon » si la valeur de la colonne client n’apparait pas pour la première fois.
supprimer les doublons Excel

En appliquant la formule, tous les doublons seront marqués de la façon suivante:

supprimer les doublons Excel

Trouver les doublons Excel sur plusieurs colonnes

Reprenons l’exemple précédent et essayons cette fois ci de repérer les doublons sur deux colonnes.

Nous allons considérer comme doublon la ligne où les valeurs des 2 colonnes n’apparaissent pas pour la première fois.

Voilà comment procéder :

  • Commençons tout d’abord par insérer une colonne qui nous permettra de combiner les valeurs des 2 colonnes et de les afficher sur une seule et même colonne (soit les valeurs de la colonne H et celles de la colonne I).                     Nous allons utiliser la formule suivante : =H5&I5
supprimer les doublons Excel

Les données des 2 colonnes seront donc affichées comme suit :

supprimer les doublons Excel

Pour afficher les doublons, nous allons appliquer la formule suivante sur la colonne intitulée "Doublons" (auparavant créée) :

=SI(NB.SI($J$5 :J5 ;J5)>1 ; " doublon " ; " " )

L'explication de cette formule est relativement simple.

la condition soumise à l'instruction SI consiste à vérifier si le même nom de client se trouve plus d'une fois dans la même colonne grâce à l'instruction NB.SI.

Si c'est le cas, la mention "Doublon" s'affiche sur la ligne de la redondance sinon la cellule reste vide.

supprimer les doublons Excel

Dans notre cas, on constate qu’il n’y a aucun doublon sur les 2 colonnes :

supprimer les doublons Excel

Pour vérifier l'existence de doublons sur plusieurs colonnes en même temps, il suffit juste de répéter la même procédure mais en combinant toutes les colonnes sur une seule et même colonne avec la formule colonne1&colonne2&colonne3...

Mettre en évidence les doublons Excel 

Afin de mettre en évidence les doublons sur une colonne donnée, on peut tout simplement recourir à la mise en forme conditionnelle.

Pour avoir une idée complète sur la mise en forme conditionnelle, référez-vous à notre tuto complet sur le sujet :

Savez-Vous Réellement Utiliser La Mise En Forme Conditionnelle Excel?

Reprenons l’exemple de tout à l’heure, la procédure complète consiste à :

  •  Sélectionner la colonne concernée puis activer l’onglet « Accueil »
  • Choisir ensuite la commande « Mise en forme conditionnelle » puis « Règles de mise en surbrillance des cellules » et enfin « Valeurs en double ».
supprimer les doublons Excel

Dans la Fenêtre qui s'affiche, sélectionner « en double » sur le premier menu défilant.

Sur le deuxième menu, choisir la mise en forme (couleur et remplissage) souhaitée pour les appliquer sur les cellules contenant les doublons.

supprimer les doublons Excel

Voici le résultat :

supprimer les doublons Excel

Masquer les doublons Excel

On pourrait éventuellement avoir besoin de masquer momentanément les doublons.

Pour y arriver, nous allons premier temps procéder de la même manière que précédemment expliqué et appliquer une mise en forme conditionnelle sur les doublons de la colonne D.

Nous obtiendrons le résultat suivant :

supprimer les doublons Excel

La seconde étape est celle qui masquera les doublons

Pour cela :

  • Nous devons sélectionner une cellule qui ne constitue pas un doublon.
  • Cliquez ensuite sur le bouton droit de votre souris puis sur « Filtrer » et enfin sur « Filtrer par la couleur de la cellule sélectionnée ».
supprimer les doublons Excel

C’est ainsi que seules les valeurs uniques seront affichées :

supprimer les doublons Excel

Pour réafficher les doublons, il suffit de sélectionner notre colonne et de cliquer sur « Filtre » puis sur « Effacer ». 

supprimer les doublons Excel

Toutes nos données seront ainsi réaffichées :

supprimer les doublons Excel

Extraire les données d’une feuille Excel sans doublons

Excel nous donne aussi une autre possibilité de gérer les doublons.

Il s’agit de celle d'exclure les doublons des données d'une feuille ( Il ne s'agit pas de supprimer les doublons Excel mais bien de les exclure).

Toujours en utilisant le même classeur Excel, voici comment procéder :

  • Sélectionnez la colonne concernée puis cliquez sur l'onglet « Données ». 
  • Activer ensuite la commande « Trier et filtrer » ainsi que l'option « Avancé » 
supprimer les doublons Excel

Sur la nouvelle fenêtre qui apparaît, il suffit de cocher « Filtrer la liste sur place », de redéfinir les plages (la colonne en question) et enfin de cocher « Extraction sans doublons ».

Validez et vous aurez un affichage sans redondances :

Afficher le nombre de doublons Excel

Une autre façon intéressante de gérer les doublons est de pouvoir en calculer le nombre pour des besoins d’analyses et de statistiques.

Si on reprend l’exemple précédent, et que l'on souhaite calculer le nombre de doublons pour chaque client, nous pouvons le faire à l’aide de la formule suivante : =NB.SI ($I$5:$I$73;I5)

Il suffit de l'introduire dans la première cellule de la colonne intitulée Nombre de doublons.

On obtient ainsi le nombre d'occurrence de chaque client sur cette colonne :

Supprimer les doublons Excel d’une feuille

Si on a besoin de garder uniquement les valeurs uniques, Excel nous donne aussi la possibilité de supprimer facilement les doublons.

Dans un souci de récupération, il serait préférable de copier nos données sur une autre feuille afin d'éviter de supprimer définitivement des données qui pourraient s'avérer utiles. 

Voici en quoi consiste la procédure :

  • Commençons par sélectionner les données puis aller à l'onglet « Accueil » dans la partie « Outils de données ». 
  • Cliquez ensuite sur l’icône « Supprimer les doublons » comme suit :

Sur la nouvelle fenêtre, cochez « Continuer la sélection en cours » puis cliquez sur « Supprimer les doublons » :

Une nouvelle fenêtre apparaît, il suffit de valider pour avoir le résultat :

Nous obtenons donc nos valeurs uniques sans doublons :

Interdire La Saisie Des Doublons Excel

Si nous considérons les doublons comme des erreurs de saisie, il serait très pratique de pouvoir les interdire et garantir des données plus fiables et plus faciles à exploiter.

Pour interdire la saisie des doublons:

  • Sélectionnez la colonne en question puis aller sous l’onglet « Données ».
  • Cliquez ensuite sur la commande « Outils de données » et enfin sur l'option « Validation des données » : 

Sur la nouvelle fenêtre, sous l’onglet « Options » et dans la partie « Autorisé », choisissez l'option « Personnalisé ».

Notez que la case « Ignorer si vide » sera coché par défaut .

Dans la zone de texte Formule, insérez la formule suivante :

=NB.SI ($A$3:$A$18;A3)=1

Ce qui veut dire que chaque fois qu'une cellule recevra une valeur redondante, il y aura un message d'erreur que nous allons configurer par la suite.

Sous l’onglet « Alerte d’erreur », nous pouvons définir le style, le titre et le message d’erreur à afficher lorsqu'un doublon Excel est saisi.

Voici ce que ça donne en pratique :

Quelques Consignes à Adopter

Pour gérer les doublons Excel de la manière la plus efficace possible, il y a des erreurs à éviter et pour ce fait il faut prendre en considération les points suivants :

Eviter La suppression définitive des données

Il faut être vigilent lors de la manipulation et de la gestion des doublons.

C'est pour cela qu'il est impératif de toujours garder une copie de la version originale de nos données.

C'est d'autant plus plausible si on on découvre que les doublons sont parfois justifiés et qu'ils ne sont pas toujours à l’origine d’erreurs de saisie.

D’un autre côté, nos besoins en termes d’analyse et d’exploitation des données sont le plus souvent susceptibles de changer et la suppression définitive des doublons peut avoir des conséquences irréversibles sur la fiabilité de nos résultats.

Excel ne tient pas compte de la casse

Il faut également savoir que pour rechercher des doublons, Excel ne tient pas compte de la casse c'est-à-dire qu’il ne tient pas compte des majuscules.

Donc, même s’il s’agit de la même valeur mais contenant des majuscules, Excel la comptabilisera tout de même comme un doublon ce qui pourrait peut-être fausser nos résultats.

Excel ne tient pas compte du format

De la même façon, Excel ne tient pas compte des différents formats pour repérer les doublons.

En effet, des valeurs identiques saisies avec des formats distincts sont considérées comme des doublons.

Conclusion

Les bases de données volumineuses ne peuvent rester à l’abri des doublons qui peuvent être ou non à l’origine d’erreurs de saisie.

Comme vous avez pu le constater tout au long de cet article, il existe différentes manières toutes aussi intéressantes que pratiques pour pouvoir gérer les doublons Excel.

Il reste toutefois indispensable d’opter pour la méthode la plus adaptée à nos besoins et de manipuler les doublons avec précaution afin d’éviter de perdre des données qui peuvent s’avérer pertinentes ou de nous baser sur des résultats faussés.

{"email":"Email address invalid","url":"Website address invalid","required":"Required field missing"}
>