FR:Web scraping: Difference between revisions
No edit summary |
No edit summary  |
||
(4 intermediate revisions by 2 users not shown) | |||
Line 4: | Line 4: | ||
Par exemple, dans le cadre d'Openfoodfacts, le scraping consiste à prendre les informations sur des produits, la liste d'ingrédient, les images, les informations nutritionnelles, etc. d'une source externe comme une e-boutique ou une enseigne de grande distribution pour les rendre disponibles sur Openfoodfacts. | Par exemple, dans le cadre d'Openfoodfacts, le scraping consiste à prendre les informations sur des produits, la liste d'ingrédient, les images, les informations nutritionnelles, etc. d'une source externe comme une e-boutique ou une enseigne de grande distribution pour les rendre disponibles sur Openfoodfacts. | ||
=== Position d'Openfoodfacts === | === Position d'Openfoodfacts === | ||
MĂȘme si scraper des donnĂ©es | MĂȘme si scraper des donnĂ©es permettrait Ă Openfoodfacts d'augmenter plus rapidement la taille de sa base de donnĂ©es, '''le scraping est interdit''' et pour plusieurs raisons : | ||
* Les listes sont souvent sous une licence ne permettant pas l'extraction des données. Openfoodfacts partage ses données sous [http://fr.openfoodfacts.org/mentions-legales licence libre], ainsi, si Openfoodfacts scrapait des données soumises à la propriété intellectuelle, elle s'exposerait à des problÚmes juridiques. | * Les listes sont souvent sous une licence ne permettant pas l'extraction des données. Openfoodfacts partage ses données sous [http://fr.openfoodfacts.org/mentions-legales licence libre], ainsi, si Openfoodfacts scrapait des données soumises à la propriété intellectuelle, elle s'exposerait à des problÚmes juridiques. | ||
*Les informations partagées sur les sites externes sont trÚs difficiles à vérifier. En effet, contrairement à Openfoodfacts, rare sont les sites à afficher les images permettant d'avoir confiance dans les informations affichées. | *Les informations partagées sur les sites externes sont trÚs difficiles à vérifier. En effet, contrairement à Openfoodfacts, rare sont les sites à afficher les images permettant d'avoir confiance dans les informations affichées. | ||
*Les informations sont souvent inexactes. D'expérience, les sites externes sont souvent truffés de fautes. Et à cause du point précédent, il n'y a pas de moyen de vérifier et corriger les données. | *Les informations sont souvent inexactes. D'expérience, les sites externes sont souvent truffés de fautes. Et à cause du point précédent, il n'y a pas de moyen de vérifier et corriger les données. | ||
*Le scraping est mal vu. Prendre des informations, mĂȘme disponibles gratuitement, sans le consentement de leur propriĂ©taire peut ĂȘtre mal vu et Openfoodfacts cherche a avoir bonne rĂ©putation. | *Le scraping est mal vu. Prendre des informations, mĂȘme disponibles gratuitement, sans le consentement de leur propriĂ©taire peut ĂȘtre mal vu et Openfoodfacts cherche a avoir bonne rĂ©putation. | ||
=== Demandes de scraping === | === Demandes de scraping === | ||
Openfoodfacts ne fait pas et n'autorise pas Ă faire de demandes de scraping en son nom, car : | Openfoodfacts ne fait pas et n'autorise pas Ă faire de demandes de scraping en son nom, car : | ||
Line 16: | Line 17: | ||
=== Données offertes à Openfoodfacts === | === Données offertes à Openfoodfacts === | ||
Néanmoins, si une entreprise ou une personne possédant une base de données souhaite la partager, Openfoodfacts accepte avec plaisir de la mettre à disposition sous licence libre sur son site. Pour ce genre de demande, contactez [http://mailto:contact@openfoodfacts.org contact@openfoodfacts.org]. | Néanmoins, si une entreprise ou une personne possédant une base de données souhaite la partager, Openfoodfacts accepte avec plaisir de la mettre à disposition sous licence libre sur son site. Pour ce genre de demande, contactez [http://mailto:contact@openfoodfacts.org contact@openfoodfacts.org]. | ||
[[Category:FR:Policy]] | |||
[[Category:To review]] | |||
[[Category:Policies]] |
Latest revision as of 16:02, 9 August 2024
DĂ©finition du scraping
Le web scraping est l'action de récolter automatiquement des données d'un site web pour les utiliser d'une autre maniÚre que sur le site original.
Par exemple, dans le cadre d'Openfoodfacts, le scraping consiste à prendre les informations sur des produits, la liste d'ingrédient, les images, les informations nutritionnelles, etc. d'une source externe comme une e-boutique ou une enseigne de grande distribution pour les rendre disponibles sur Openfoodfacts.
Position d'Openfoodfacts
MĂȘme si scraper des donnĂ©es permettrait Ă Openfoodfacts d'augmenter plus rapidement la taille de sa base de donnĂ©es, le scraping est interdit et pour plusieurs raisons :
- Les listes sont souvent sous une licence ne permettant pas l'extraction des données. Openfoodfacts partage ses données sous licence libre, ainsi, si Openfoodfacts scrapait des données soumises à la propriété intellectuelle, elle s'exposerait à des problÚmes juridiques.
- Les informations partagées sur les sites externes sont trÚs difficiles à vérifier. En effet, contrairement à Openfoodfacts, rare sont les sites à afficher les images permettant d'avoir confiance dans les informations affichées.
- Les informations sont souvent inexactes. D'expérience, les sites externes sont souvent truffés de fautes. Et à cause du point précédent, il n'y a pas de moyen de vérifier et corriger les données.
- Le scraping est mal vu. Prendre des informations, mĂȘme disponibles gratuitement, sans le consentement de leur propriĂ©taire peut ĂȘtre mal vu et Openfoodfacts cherche a avoir bonne rĂ©putation.
Demandes de scraping
Openfoodfacts ne fait pas et n'autorise pas Ă faire de demandes de scraping en son nom, car :
- Beaucoup d'entreprises ne souhaitent pas apparaĂźtre avec Openfoodfacts. Cela pourrait nuire Ă leur image par exemple en affichant des informations nutritionnelles sur leurs produits qui ne sont pas en leur avantage.
- Le premier contact avec une entreprise doit se faire pour une raison d'intĂ©rĂȘt commun et ainsi ne pas laisser une mauvaise trace en cas de refus.
- Pour les raisons de qualité et de contrÎle expliquées plus haut.
Données offertes à Openfoodfacts
Néanmoins, si une entreprise ou une personne possédant une base de données souhaite la partager, Openfoodfacts accepte avec plaisir de la mettre à disposition sous licence libre sur son site. Pour ce genre de demande, contactez contact@openfoodfacts.org.