“Est-ce que je peux scraper ce site ?” C'est une des questions les plus fréquentes quand on parle d'automatisation de données. La réponse n'est pas simple — elle dépend du type de données, de l'utilisation prévue et des conditions du site ciblé. Voici un guide pratique sur le scraping web légal en 2026 : ce que vous pouvez faire, ce que vous ne pouvez pas, et les zones grises à connaître.
Ce que dit le droit en France
En France, il n'existe pas de loi qui interdit explicitement le web scraping. Mais plusieurs cadres légaux s'appliquent selon les cas.
Le RGPD (données personnelles)
C'est le cadre le plus important. Dès que vous scrapez des données qui permettent d'identifier une personne (nom, email, numéro de téléphone, profil LinkedIn), le RGPD s'applique. Vous devez avoir une base légale pour collecter ces données et les traiter.
Concrètement : scraper des données B2B (nom d'entreprise, secteur, chiffre d'affaires) pour de la prospection est généralement acceptable si vous avez un intérêt légitime documenté. Scraper des données personnelles pour les revendre ou les utiliser sans base légale : c'est une infraction RGPD.
Les conditions générales d'utilisation
La plupart des sites web interdisent le scraping dans leurs CGU. Techniquement, cette interdiction n'a pas toujours de valeur légale contraignante — mais elle peut servir de base à une action pour violation contractuelle, notamment si vous avez un compte sur la plateforme.
La règle pratique : ne jamais scraper en étant connecté avec un compte personnel ou professionnel. Si vous scrapez en anonyme des données publiques, le risque légal est limité. Si vous scraper en utilisant un compte, vous avez accepté les CGU qui l'interdisent.
La directive sur la base de données (sui generis)
En Europe, les bases de données bénéficient d'une protection spécifique si leur constitution a nécessité un investissement substantiel. Scraper une grande partie d'une telle base peut constituer une extraction illicite — même si les données individuelles sont publiques.
Ce que vous pouvez faire sans risque majeur
Scraper vos propres données
Vos propres données depuis des plateformes qui ne proposent pas d'export facile. Votre historique de commandes, vos métriques de performance, votre catalogue produits — c'est clairement dans vos droits.
Données publiques B2B pour la prospection
Les informations publiques sur les entreprises (raison sociale, secteur, dirigeants, depuis des registres officiels comme le RNCS) sont généralement scrapables légalement avec une base légale d'intérêt légitime pour la prospection B2B.
Veille de prix et de marché
Surveiller les prix de vos concurrents sur des sites d'e-commerce publics est une pratique courante et généralement acceptée. Les CGU de certains sites l'interdisent explicitement — mais sans mécanisme d'identification (compte), le risque légal est limité.
Agrégation de contenus publics
Agréger des contenus publics (articles de presse, publications officielles, offres d'emploi) pour de la veille ou de l'analyse est généralement légal, dans la limite du droit d'auteur (pas de reproduction intégrale de contenu protégé).
Ce qu'il faut éviter
- Scraper des données personnelles sensibles : emails, numéros de téléphone, données de santé
- Surcharger les serveurs : des requêtes trop fréquentes peuvent être assimilées à une attaque DoS
- Contourner des mesures de protection technique : captchas, authentification — c'est illégal en droit européen
- Revendre des données scrapées sans vérifier les droits associés
- Scraper des plateformes avec un compte en violation des CGU
Les bonnes pratiques techniques
Si vous scrapez légalement, appliquez ces règles pour réduire les risques et le bruit :
- Respectez le fichier
robots.txtdu site (il indique les pages à ne pas crawler) - Espacez vos requêtes (1 à 2 secondes minimum entre chaque)
- Identifiez votre bot dans le User-Agent (si pertinent)
- Préférez l'API officielle quand elle existe
- Stockez le minimum de données nécessaire, pas tout ce que vous pouvez obtenir
En résumé
Le scraping web est un outil puissant — et comme tout outil puissant, il demande une utilisation réfléchie. Les cas d'usage légaux et utiles sont nombreux ; les zones grises existent mais sont navigables avec le bon conseil.
Consultez notre guide complet sur le web scraping ou discutez de votre projet de scraping avec nous pour avoir une analyse de votre cas spécifique.