FR:Web scraping: Difference between revisions

From Open Food Facts wiki
(Page créée avec « === Definition du scraping === Le [https://fr.wikipedia.org/wiki/Web_scraping web scraping] est l'action de récolter automatiquement des données d'un site web pour les u... »)
 
No edit summary
 
(5 intermediate revisions by 3 users not shown)
Line 1: Line 1:
=== Definition du scraping ===
=== DĂ©finition du scraping ===
Le [https://fr.wikipedia.org/wiki/Web_scraping web scraping] est l'action de récolter automatiquement des données d'un site web pour les utiliser d'une autre maniÚre que sur le site original.
Le [https://fr.wikipedia.org/wiki/Web_scraping web scraping] est l'action de récolter automatiquement des données d'un site web pour les utiliser d'une autre maniÚre que sur le site original.


Par exemple, dans le cadre d'Openfoodfacts, le scraping consiste à prendre les informations sur des produits, la liste d'ingrédient, les images, les informations nutritionnelles, etc. d'une source externe comme une e-boutique ou une enseigne de grande distribution pour les rendre disponibles sur Openfoodfacts.
Par exemple, dans le cadre d'Openfoodfacts, le scraping consiste à prendre les informations sur des produits, la liste d'ingrédient, les images, les informations nutritionnelles, etc. d'une source externe comme une e-boutique ou une enseigne de grande distribution pour les rendre disponibles sur Openfoodfacts.
=== Position d'Openfoodfacts ===
=== Position d'Openfoodfacts ===
MĂȘme si scraper des donnĂ©es permettrai Ă  Openfoodfacts d'augmenter plus rapidement la taille de sa base de donnĂ©es, '''le scraping est interdit''' et pour plusieurs raisons :
MĂȘme si scraper des donnĂ©es permettrait Ă  Openfoodfacts d'augmenter plus rapidement la taille de sa base de donnĂ©es, '''le scraping est interdit''' et pour plusieurs raisons :
* Les listes sont souvent sous une licence ne permettant pas l'extraction des données. Openfoodfacts partage ses données sous [http://fr.openfoodfacts.org/mentions-legales licence libre], ainsi, si Openfoodfacts scrapait des données soumises à la propriété intellectuelle, elle s'exposerait à des problÚmes juridiques.
* Les listes sont souvent sous une licence ne permettant pas l'extraction des données. Openfoodfacts partage ses données sous [http://fr.openfoodfacts.org/mentions-legales licence libre], ainsi, si Openfoodfacts scrapait des données soumises à la propriété intellectuelle, elle s'exposerait à des problÚmes juridiques.
*Les informations partagées sur les sites externes sont trÚs difficiles à vérifier. En effet, contrairement à Openfoodfacts, rare sont les sites à afficher les images permettant d'avoir confiance dans les informations affichées.
*Les informations partagées sur les sites externes sont trÚs difficiles à vérifier. En effet, contrairement à Openfoodfacts, rare sont les sites à afficher les images permettant d'avoir confiance dans les informations affichées.
*Les informations sont souvent inexactes. D'expérience, les sites externes sont souvent truffés de fautes. Et à cause du point précédent, il n'y a pas de moyen de vérifier et corriger les données.
*Les informations sont souvent inexactes. D'expérience, les sites externes sont souvent truffés de fautes. Et à cause du point précédent, il n'y a pas de moyen de vérifier et corriger les données.
*Le scraping est mal vu. Prendre des informations, mĂȘme disponibles gratuitement, sans le consentement de leur propriĂ©taire peut ĂȘtre mal vu et Openfoodfacts cherche a avoir bonne rĂ©putation.
*Le scraping est mal vu. Prendre des informations, mĂȘme disponibles gratuitement, sans le consentement de leur propriĂ©taire peut ĂȘtre mal vu et Openfoodfacts cherche a avoir bonne rĂ©putation.
=== Demandes de scraping ===
=== Demandes de scraping ===
Openfoodfacts ne fait pas et n'autorise pas Ă  faire de demandes de scraping en son nom, car :
Openfoodfacts ne fait pas et n'autorise pas Ă  faire de demandes de scraping en son nom, car :
* Beaucoup d'entreprises ne souhaitent pas apparaitre avec Openfoodfacts. Cela pourrait nuire Ă  leur image par exemple en affichant des informations nutritionnelles sur leurs produits qui ne sont pas en leur avantage.
* Beaucoup d'entreprises ne souhaitent pas apparaĂźtre avec Openfoodfacts. Cela pourrait nuire Ă  leur image par exemple en affichant des informations nutritionnelles sur leurs produits qui ne sont pas en leur avantage.
* Le premier contact avec une entreprise doit se faire pour une raison d'intĂ©rĂȘt commun et ainsi ne pas laisser une mauvaise trace en cas de refus.
* Le premier contact avec une entreprise doit se faire pour une raison d'intĂ©rĂȘt commun et ainsi ne pas laisser une mauvaise trace en cas de refus.
* Pour les raisons de qualité et de contrÎle expliquées plus haut.
* Pour les raisons de qualité et de contrÎle expliquées plus haut.
=== Données offertes à Openfoodfacts ===
=== Données offertes à Openfoodfacts ===
Néanmoins, si une entreprise ou une personne possédant une base de données souhaite la partager, Openfoodfacts accepte avec plaisir de la mettre à disposition sous licence libre sur son site. Pour ce genre de demande, contactez [http://mailto:contact@openfoodfacts.org contact@openfoodfacts.org].
Néanmoins, si une entreprise ou une personne possédant une base de données souhaite la partager, Openfoodfacts accepte avec plaisir de la mettre à disposition sous licence libre sur son site. Pour ce genre de demande, contactez [http://mailto:contact@openfoodfacts.org contact@openfoodfacts.org].
[[Category:FR:Policy]]
[[Category:To review]]
[[Category:Policies]]

Latest revision as of 16:02, 9 August 2024

DĂ©finition du scraping

Le web scraping est l'action de récolter automatiquement des données d'un site web pour les utiliser d'une autre maniÚre que sur le site original.

Par exemple, dans le cadre d'Openfoodfacts, le scraping consiste à prendre les informations sur des produits, la liste d'ingrédient, les images, les informations nutritionnelles, etc. d'une source externe comme une e-boutique ou une enseigne de grande distribution pour les rendre disponibles sur Openfoodfacts.

Position d'Openfoodfacts

MĂȘme si scraper des donnĂ©es permettrait Ă  Openfoodfacts d'augmenter plus rapidement la taille de sa base de donnĂ©es, le scraping est interdit et pour plusieurs raisons :

  • Les listes sont souvent sous une licence ne permettant pas l'extraction des donnĂ©es. Openfoodfacts partage ses donnĂ©es sous licence libre, ainsi, si Openfoodfacts scrapait des donnĂ©es soumises Ă  la propriĂ©tĂ© intellectuelle, elle s'exposerait Ă  des problĂšmes juridiques.
  • Les informations partagĂ©es sur les sites externes sont trĂšs difficiles Ă  vĂ©rifier. En effet, contrairement Ă  Openfoodfacts, rare sont les sites Ă  afficher les images permettant d'avoir confiance dans les informations affichĂ©es.
  • Les informations sont souvent inexactes. D'expĂ©rience, les sites externes sont souvent truffĂ©s de fautes. Et Ă  cause du point prĂ©cĂ©dent, il n'y a pas de moyen de vĂ©rifier et corriger les donnĂ©es.
  • Le scraping est mal vu. Prendre des informations, mĂȘme disponibles gratuitement, sans le consentement de leur propriĂ©taire peut ĂȘtre mal vu et Openfoodfacts cherche a avoir bonne rĂ©putation.

Demandes de scraping

Openfoodfacts ne fait pas et n'autorise pas Ă  faire de demandes de scraping en son nom, car :

  • Beaucoup d'entreprises ne souhaitent pas apparaĂźtre avec Openfoodfacts. Cela pourrait nuire Ă  leur image par exemple en affichant des informations nutritionnelles sur leurs produits qui ne sont pas en leur avantage.
  • Le premier contact avec une entreprise doit se faire pour une raison d'intĂ©rĂȘt commun et ainsi ne pas laisser une mauvaise trace en cas de refus.
  • Pour les raisons de qualitĂ© et de contrĂŽle expliquĂ©es plus haut.

Données offertes à Openfoodfacts

Néanmoins, si une entreprise ou une personne possédant une base de données souhaite la partager, Openfoodfacts accepte avec plaisir de la mettre à disposition sous licence libre sur son site. Pour ce genre de demande, contactez contact@openfoodfacts.org.