Nettoyer vos données Excel avant l'import CRM
Vous avez fait l'audit, vous savez ce que vous voulez migrer. Mais avant de tout envoyer dans le CRM, il reste une étape cruciale : nettoyer les données. Sauter cette étape, c'est garantir que votre nouveau CRM sera inutilisable dans 6 mois. Ce chapitre vous donne le protocole de nettoyage, les pièges terrain et les techniques pour gagner du temps.
Pourquoi nettoyer avant d'importer est obligatoire
La règle universelle en data : garbage in, garbage out. Vous pouvez avoir le CRM le plus sophistiqué du monde, si vous l'alimentez avec des données pourries, il ne fera que rendre vos problèmes plus visibles, pas les résoudre.
Chez un cabinet de conseil de 15 personnes que j'ai accompagné, nous avons importé le fichier Excel sans le nettoyer en amont (urgence client). Résultat 3 semaines plus tard : 4 200 contacts dans Pipedrive dont 38 % étaient des doublons et 22 % avaient des emails invalides. L'équipe a perdu confiance dans l'outil. On a dû tout purger et recommencer.
La leçon est claire : mieux vaut prendre 3 jours de nettoyage que réparer 3 mois plus tard.
Les 5 problèmes à régler avant l'import
1. Les doublons de contacts
Les doublons représentent en moyenne 15 à 40 % des contacts dans un Excel commercial mal entretenu. Ils peuvent être évidents (2 lignes strictement identiques) ou subtils (Jean Dupont vs J. Dupont vs jean.dupont@ex.com).
Méthodes de détection :
- Par email exact : fonction "Supprimer les doublons" d'Excel sur la colonne email
- Par nom + entreprise : CONCATENATE(Nom, Entreprise) puis NB.SI pour trouver les occurrences > 1
- Par domaine email : attention aux 3 personnes de la même entreprise qui sont bien 3 contacts distincts, pas un doublon
- Outils dédiés : Dropcontact, OpenRefine (gratuit), ou un script Python si vous êtes à l'aise
2. Les formats incohérents
Excel accepte tout. Un même champ "Téléphone" peut contenir 06 12 34 56 78, +33 6 12 34 56 78, 0612345678, 06.12.34.56.78 — et c'est un problème pour le CRM qui va chercher une correspondance exacte.
Champs à standardiser avant import
- Téléphones : format international +33 6 XX XX XX XX (recommandé)
- Emails : tout en minuscules, sans espaces
- Noms et prénoms : première lettre en majuscule, reste en minuscule
- Nom d'entreprise : standardiser les suffixes (SARL, SAS, EI...) ou les retirer
- Pays : codes ISO 2 lettres (FR, BE, CH) ou libellé complet uniforme
- Montants : un seul format, sans espace, séparateur décimal cohérent
- Dates : format ISO (YYYY-MM-DD) pour éviter les confusions avec les imports US
3. Les emails invalides
Les emails invalides viennent de plusieurs sources : saisie manuelle incorrecte, email obsolète (personne partie de l'entreprise), ou domaine qui n'existe plus. Les importer pollue votre base et risque de nuire à votre délivrabilité email plus tard.
Outils pour vérifier en masse :
- ZeroBounce (payant, ~5 €/1000 emails vérifiés) — le standard de marché
- NeverBounce — alternative équivalente
- Hunter.io Email Verifier (crédits gratuits mensuels)
- Dropcontact (français, vérifie email + enrichit en même temps)
Règle : avant l'import, supprimez ou marquez comme "obsolète" tous les emails avec un score de délivrabilité < 70%.
4. Les contacts orphelins
Un contact sans entreprise, sans historique d'échange, sans deal associé : c'est un contact orphelin. Il ne sert à rien dans un CRM moderne qui est structuré autour des relations contact ↔ organisation ↔ deal.
Chez Guilbert Signalétique, nous avons identifié 780 contacts orphelins sur 3 100 (25 %). Après analyse, la majorité venait de salons d'il y a plus de 2 ans, sans aucun follow-up derrière. Décision : archivage hors CRM, pas migration.
5. Les données non structurées dans des cases libres
C'est le pire cauchemar du migrateur. Dans la case "Notes", vous avez : « Appelé le 12 mars, pas dispo, doit nous recontacter semaine prochaine. Budget 30K mais à valider avec Pascal, son N+1. Secteur restauration, 8 établissements. »
Ces notes contiennent en réalité 4 informations distinctes qui devraient être des champs structurés :
- Date de dernière interaction
- Budget estimé
- Contact décisionnaire (Pascal)
- Secteur et nombre d'établissements
Extraire manuellement ces données sur 3 000 contacts est impossible. Claude (ou GPT-4) peut le faire en masse via un prompt bien structuré, en quelques minutes.
💡 Le prompt Claude pour extraire de la donnée structurée
« Voici des notes commerciales en texte libre. Pour chaque note, extrais en JSON : date_dernier_contact, budget_estime, decisionnaire, secteur. Si une info est absente, mets null. »
Testé sur 2 500 contacts chez Cabinet Amerha : 94% de précision d'extraction, 40 minutes de temps de traitement au total contre une semaine de ressaisie manuelle.
Le protocole de nettoyage en 7 étapes
- Sauvegarder l'original avant toute manipulation (duplicate du fichier, daté)
- Dédoublonner par email exact puis par nom+entreprise
- Standardiser les formats (téléphone, nom, entreprise, dates)
- Vérifier les emails avec un outil dédié et marquer les invalides
- Extraire les données structurées des champs libres (IA recommandée)
- Enrichir les contacts prioritaires (SIRET, taille, secteur) avec Dropcontact/Clay
- Valider échantillon : 50 contacts au hasard, corrigés à la main, vérifiés OK
Combien de temps pour cette étape ?
Ordre de grandeur réaliste, basé sur mes missions :
| Volume de contacts | Temps de nettoyage estimé | Budget outils recommandés |
|---|---|---|
| Jusqu'à 500 contacts | 2-4 heures | Gratuit (Excel + Hunter free tier) |
| 500 à 2 000 contacts | 1-2 jours | ~50 € (ZeroBounce + Dropcontact starter) |
| 2 000 à 10 000 contacts | 3-5 jours | ~200-400 € (ZeroBounce + Clay + Claude API) |
| 10 000+ contacts | 1-2 semaines, prestation recommandée | ~800 € + prestation |
⚠️ Le piège du nettoyage "parfait"
Vous n'arriverez jamais à 100 % de données propres. Acceptez 85-90 % et avancez. Le CRM une fois en place permettra de nettoyer progressivement le reste au fil de l'usage. La perfection tue la migration.
Ce que vous devez faire maintenant
- Bloquez un ou deux jours dédiés pour le nettoyage (pas en parallèle d'autres tâches)
- Choisissez l'outil de vérification email adapté à votre volume
- Si vous avez des champs libres denses, préparez un prompt Claude pour extraire
- Passez au chapitre 4 pour choisir le bon CRM pour votre taille
Besoin d'aide pour cette étape ?
J'accompagne les PME françaises sur leur migration Excel → CRM. Premier échange gratuit de 30 minutes.
Se faire rappeler →