Chapitre 3/10 • 15 min de lecture

Scraping

Extraire des listes de prospects qualifiés de manière fiable et légale

⏱️ En bref : Scraper, c'est extraire programmatiquement des données publiques. En 2026, il faut le faire proprement : outils stables, respect du RGPD, rythme contrôlé pour éviter les blocages.

Scraping légal : ce qu'il faut savoir en 2026

Le scraping B2B reste légal en Europe tant que : les données sont publiques, vous respectez le RGPD (finalité prospection B2B, droit d'opposition), vous respectez les CGU des plateformes scrapées.

Ce qui reste interdit : scraper des données personnelles (emails privés, téléphones perso), contourner techniquement des protections, stocker massivement sans finalité claire.

Les 3 sources principales de scraping B2B

Source 1 — LinkedIn Sales Navigator

La source la plus riche. Recherches ultra-ciblées. Scraping via PhantomBuster, Captain Data, Evaboot.

Limite : LinkedIn détecte les comportements anormaux. Respecter les quotas (300-500 actions/jour max), pauses aléatoires.

Source 2 — Bases françaises publiques

Pappers, Sirene API : accès légal aux données d'entreprises françaises (SIREN, SIRET, dirigeants, CA, effectifs). Qualité excellente sur les critères firmographiques.

Source 3 — Apollo, Lusha, Kaspr

Plateformes d'achat de contacts B2B. Gain de temps, mais qualité variable (15-40% d'emails invalides). Toujours vérifier avant envoi.

Les outils de scraping recommandés

PhantomBuster

Couteau suisse du scraping LinkedIn. 30+ "phantoms". Coût : 70-150€/mois.

Evaboot

Spécialisé Sales Navigator. Nettoie et enrichit automatiquement les exports. Idéal pour des listes propres en 1 clic. 30-80€/mois.

Captain Data

Plus puissant que PhantomBuster, orienté automatisation. Workflows complexes. 200-500€/mois.

Clay (pour l'enrichissement post-scraping)

Après scraping brut, Clay enrichit chaque ligne avec 15+ sources. Pas un outil de scraping direct mais l'étape d'après.

💡 La stack scraping simplifiée

Pour 80% des cas d'usage PME : Sales Navigator + Evaboot + Clay. Budget mensuel : 200€. 1000-2000 prospects enrichis/mois, qualité pro.

La méthode pour un scraping propre

Étape 1 — Requête Sales Navigator précise

Avant de scraper, construire la requête avec les bons filtres. Tester manuellement les 20 premiers résultats : correspondent-ils à l'ICP ? Si non, affiner avant scraping.

Étape 2 — Scraping contrôlé

Paramètres safe : 300 profils max par session, rotation des user-agents, pauses de 10-30 secondes. Mieux vaut 3 jours à 300 profils qu'1 jour à 900 avec le risque de blocage.

Étape 3 — Nettoyage systématique

Toute liste scrapée contient 10-20% de déchets. Nettoyage obligatoire avant enrichissement.

Étape 4 — Enrichissement

Ajout des champs manquants : emails (waterfall Dropcontact + Hunter), données firmographiques, vérification bounce.

Étape 5 — Validation finale

Avant push en séquence : NeverBounce, cross-check avec DNC, vérification qu'il y a un champ de personnalisation exploitable.

Les pièges classiques du scraping

⚠️ Piège 1 — Scraper trop vite

Scraper 2000 profils LinkedIn en 2 heures = compte bloqué garanti. Respecter les quotas natifs des outils.

⚠️ Piège 2 — Utiliser son compte LinkedIn perso

Si bloqué, vous perdez aussi vos connexions personnelles. Investir dans un compte LinkedIn dédié au scraping.

⚠️ Piège 3 — Oublier le RGPD

Même en B2B : finalité claire, droit d'opposition, suppression si demandé. Mention RGPD dans vos emails ("STOP pour vous désinscrire").

Le scraping n'est qu'un moyen

Ne tombez pas dans l'obsession du scraping massif. Le but n'est pas "le plus de contacts possible" mais d'alimenter votre machine avec les bons contacts.

500 prospects parfaitement ciblés battent 5000 vaguement ciblés. Toujours.

📚 Pour aller plus loin

Prochaine étape : l'enrichissement des données.