Scraping
Extraire des listes de prospects qualifiés de manière fiable et légale
⏱️ En bref : Scraper, c'est extraire programmatiquement des données publiques. En 2026, il faut le faire proprement : outils stables, respect du RGPD, rythme contrôlé pour éviter les blocages.
Scraping légal : ce qu'il faut savoir en 2026
Le scraping B2B reste légal en Europe tant que : les données sont publiques, vous respectez le RGPD (finalité prospection B2B, droit d'opposition), vous respectez les CGU des plateformes scrapées.
Ce qui reste interdit : scraper des données personnelles (emails privés, téléphones perso), contourner techniquement des protections, stocker massivement sans finalité claire.
Les 3 sources principales de scraping B2B
Source 1 — LinkedIn Sales Navigator
La source la plus riche. Recherches ultra-ciblées. Scraping via PhantomBuster, Captain Data, Evaboot.
Limite : LinkedIn détecte les comportements anormaux. Respecter les quotas (300-500 actions/jour max), pauses aléatoires.
Source 2 — Bases françaises publiques
Pappers, Sirene API : accès légal aux données d'entreprises françaises (SIREN, SIRET, dirigeants, CA, effectifs). Qualité excellente sur les critères firmographiques.
Source 3 — Apollo, Lusha, Kaspr
Plateformes d'achat de contacts B2B. Gain de temps, mais qualité variable (15-40% d'emails invalides). Toujours vérifier avant envoi.
Les outils de scraping recommandés
PhantomBuster
Couteau suisse du scraping LinkedIn. 30+ "phantoms". Coût : 70-150€/mois.
Evaboot
Spécialisé Sales Navigator. Nettoie et enrichit automatiquement les exports. Idéal pour des listes propres en 1 clic. 30-80€/mois.
Captain Data
Plus puissant que PhantomBuster, orienté automatisation. Workflows complexes. 200-500€/mois.
Clay (pour l'enrichissement post-scraping)
Après scraping brut, Clay enrichit chaque ligne avec 15+ sources. Pas un outil de scraping direct mais l'étape d'après.
💡 La stack scraping simplifiée
Pour 80% des cas d'usage PME : Sales Navigator + Evaboot + Clay. Budget mensuel : 200€. 1000-2000 prospects enrichis/mois, qualité pro.
La méthode pour un scraping propre
Étape 1 — Requête Sales Navigator précise
Avant de scraper, construire la requête avec les bons filtres. Tester manuellement les 20 premiers résultats : correspondent-ils à l'ICP ? Si non, affiner avant scraping.
Étape 2 — Scraping contrôlé
Paramètres safe : 300 profils max par session, rotation des user-agents, pauses de 10-30 secondes. Mieux vaut 3 jours à 300 profils qu'1 jour à 900 avec le risque de blocage.
Étape 3 — Nettoyage systématique
Toute liste scrapée contient 10-20% de déchets. Nettoyage obligatoire avant enrichissement.
Étape 4 — Enrichissement
Ajout des champs manquants : emails (waterfall Dropcontact + Hunter), données firmographiques, vérification bounce.
Étape 5 — Validation finale
Avant push en séquence : NeverBounce, cross-check avec DNC, vérification qu'il y a un champ de personnalisation exploitable.
Les pièges classiques du scraping
⚠️ Piège 1 — Scraper trop vite
Scraper 2000 profils LinkedIn en 2 heures = compte bloqué garanti. Respecter les quotas natifs des outils.
⚠️ Piège 2 — Utiliser son compte LinkedIn perso
Si bloqué, vous perdez aussi vos connexions personnelles. Investir dans un compte LinkedIn dédié au scraping.
⚠️ Piège 3 — Oublier le RGPD
Même en B2B : finalité claire, droit d'opposition, suppression si demandé. Mention RGPD dans vos emails ("STOP pour vous désinscrire").
Le scraping n'est qu'un moyen
Ne tombez pas dans l'obsession du scraping massif. Le but n'est pas "le plus de contacts possible" mais d'alimenter votre machine avec les bons contacts.
500 prospects parfaitement ciblés battent 5000 vaguement ciblés. Toujours.
📚 Pour aller plus loin
Prochaine étape : l'enrichissement des données.