Jump to content

FR:Web scraping: Difference between revisions

No edit summary
Line 4: Line 4:
Par exemple, dans le cadre d'Openfoodfacts, le scraping consiste à prendre les informations sur des produits, la liste d'ingrédient, les images, les informations nutritionnelles, etc. d'une source externe comme une e-boutique ou une enseigne de grande distribution pour les rendre disponibles sur Openfoodfacts.
Par exemple, dans le cadre d'Openfoodfacts, le scraping consiste à prendre les informations sur des produits, la liste d'ingrédient, les images, les informations nutritionnelles, etc. d'une source externe comme une e-boutique ou une enseigne de grande distribution pour les rendre disponibles sur Openfoodfacts.
=== Position d'Openfoodfacts ===
=== Position d'Openfoodfacts ===
MĂȘme si scraper des donnĂ©es permettrai Ă  Openfoodfacts d'augmenter plus rapidement la taille de sa base de donnĂ©es, '''le scraping est interdit''' et pour plusieurs raisons :
MĂȘme si scraper des donnĂ©es permettrait Ă  Openfoodfacts d'augmenter plus rapidement la taille de sa base de donnĂ©es, '''le scraping est interdit''' et pour plusieurs raisons :
* Les listes sont souvent sous une licence ne permettant pas l'extraction des données. Openfoodfacts partage ses données sous [http://fr.openfoodfacts.org/mentions-legales licence libre], ainsi, si Openfoodfacts scrapait des données soumises à la propriété intellectuelle, elle s'exposerait à des problÚmes juridiques.
* Les listes sont souvent sous une licence ne permettant pas l'extraction des données. Openfoodfacts partage ses données sous [http://fr.openfoodfacts.org/mentions-legales licence libre], ainsi, si Openfoodfacts scrapait des données soumises à la propriété intellectuelle, elle s'exposerait à des problÚmes juridiques.
*Les informations partagées sur les sites externes sont trÚs difficiles à vérifier. En effet, contrairement à Openfoodfacts, rare sont les sites à afficher les images permettant d'avoir confiance dans les informations affichées.
*Les informations partagées sur les sites externes sont trÚs difficiles à vérifier. En effet, contrairement à Openfoodfacts, rare sont les sites à afficher les images permettant d'avoir confiance dans les informations affichées.
*Les informations sont souvent inexactes. D'expérience, les sites externes sont souvent truffés de fautes. Et à cause du point précédent, il n'y a pas de moyen de vérifier et corriger les données.
*Les informations sont souvent inexactes. D'expérience, les sites externes sont souvent truffés de fautes. Et à cause du point précédent, il n'y a pas de moyen de vérifier et corriger les données.
*Le scraping est mal vu. Prendre des informations, mĂȘme disponibles gratuitement, sans le consentement de leur propriĂ©taire peut ĂȘtre mal vu et Openfoodfacts cherche a avoir bonne rĂ©putation.
*Le scraping est mal vu. Prendre des informations, mĂȘme disponibles gratuitement, sans le consentement de leur propriĂ©taire peut ĂȘtre mal vu et Openfoodfacts cherche a avoir bonne rĂ©putation.
=== Demandes de scraping ===
=== Demandes de scraping ===
Openfoodfacts ne fait pas et n'autorise pas Ă  faire de demandes de scraping en son nom, car :
Openfoodfacts ne fait pas et n'autorise pas Ă  faire de demandes de scraping en son nom, car :