DataForGood-2023: Difference between revisions
Raphael0202 (talk | contribs) (Created page with "== Data For Good 2023 == Open Food Facts participe à la saison 11 de Data For Good, avec comme thématique la détection automatique des ingrédients à partir des images de...") |
No edit summary |
||
(4 intermediate revisions by 2 users not shown) | |||
Line 4: | Line 4: | ||
Une description détaillée du projet est disponible sur le [https://dataforgood.notion.site/Open-Food-Facts-6c50c8b8b41b4cca88cfae416ffc7f07 Notion de Data For Good]. | Une description détaillée du projet est disponible sur le [https://dataforgood.notion.site/Open-Food-Facts-6c50c8b8b41b4cca88cfae416ffc7f07 Notion de Data For Good]. | ||
=== Communication === | |||
On a un chan '''#dataforgood-ingredients''' sur notre slack (utiliser [https://join.slack.com/t/openfoodfacts/shared_invite/zt-1rt2n6ms6-Cl3FWBHGTjS4rb7I1L2PLg ce lien d'invitation]) | |||
Notes de meeting: https://docs.google.com/document/d/1du2iUqgNyEN1RckBIlWnczl9jVl_GeT0jPMx6Dz08_w/edit?usp=sharing | |||
== Get in touch == | |||
{{Box | |||
| 1 = Slack channel | |||
| 2 = [https://openfoodfacts.slack.com/messages/C0516K0TVHP/ #dataforgood-ingredients] | |||
}} | |||
=== Introduction === | === Introduction === | ||
Line 9: | Line 22: | ||
Pour détecter la zone de l'image où se trouve la liste d'ingrédients, une approche possible est de détecter les mots sur la photo correspondant à des ingrédients, puis de trouver la zone dans la photo où la densité d'ingrédients est suffisamment élevée pour que celle-ci corresponde à la zone d'ingrédients. | Pour détecter la zone de l'image où se trouve la liste d'ingrédients, une approche possible est de détecter les mots sur la photo correspondant à des ingrédients, puis de trouver la zone dans la photo où la densité d'ingrédients est suffisamment élevée pour que celle-ci corresponde à la zone d'ingrédients. | ||
[https://gist.github.com/raphael0202/7bc50ee50e86fdc9ba10cac2c145ebf8 Ce gist] montre comment utiliser Robotoff pour extraire les ingrédients et la position des mots associés dans l'image. | [https://gist.github.com/raphael0202/7bc50ee50e86fdc9ba10cac2c145ebf8 Ce gist] montre comment utiliser Robotoff pour extraire les ingrédients et la position des mots associés dans l'image. | ||
Une campagne d'annotation d'image de liste d'ingrédients [https://annotate.openfoodfacts.org/projects/3/data?tab=5 a été démarrée ici] : elle permettra d'avoir des données ground-truth pour évaluer la fiabilité du système de croping des listes d'ingrédients. | Une campagne d'annotation d'image de liste d'ingrédients [https://annotate.openfoodfacts.org/projects/3/data?tab=5 a été démarrée ici] : elle permettra d'avoir des données ground-truth pour évaluer la fiabilité du système de croping des listes d'ingrédients. | ||
Line 17: | Line 30: | ||
* [https://openfoodfacts.github.io/openfoodfacts-server/api/how-to-download-images/ Comment générer les URLs des photos de produits sur Open Food Facts à partir des métadonnées produit] | * [https://openfoodfacts.github.io/openfoodfacts-server/api/how-to-download-images/ Comment générer les URLs des photos de produits sur Open Food Facts à partir des métadonnées produit] | ||
* [[OCR|Comment l'OCR est utilisé à Open Food Facts, et comment récupérer le jeu de données d'OCR]] | * [[OCR|Comment l'OCR est utilisé à Open Food Facts, et comment récupérer le jeu de données d'OCR]] | ||
* [https://openfoodfacts.github.io/robotoff/ Documentation Robotoff] | * [https://openfoodfacts.github.io/robotoff/ Documentation Robotoff] dont [https://openfoodfacts.github.io/robotoff/how-to-guides/deployment/dev-install/ installation] | ||
* Comprendre les [[Global taxonomies|Taxonomy]] dont celle des [https://github.com/openfoodfacts/openfoodfacts-server/blob/main/taxonomies/ingredients.txt ingredients] (téléchargeable aussi [https://static.openfoodfacts.net/data/taxonomies/ingredients.full.json sous forme json]) | |||
[[Category:DataForGood]] |
Latest revision as of 14:54, 9 August 2024
Data For Good 2023
Open Food Facts participe à la saison 11 de Data For Good, avec comme thématique la détection automatique des ingrédients à partir des images des produits.
Une description détaillée du projet est disponible sur le Notion de Data For Good.
Communication
On a un chan #dataforgood-ingredients sur notre slack (utiliser ce lien d'invitation)
Notes de meeting: https://docs.google.com/document/d/1du2iUqgNyEN1RckBIlWnczl9jVl_GeT0jPMx6Dz08_w/edit?usp=sharing
Get in touch
|
---|
Introduction
Pour détecter la zone de l'image où se trouve la liste d'ingrédients, une approche possible est de détecter les mots sur la photo correspondant à des ingrédients, puis de trouver la zone dans la photo où la densité d'ingrédients est suffisamment élevée pour que celle-ci corresponde à la zone d'ingrédients.
Ce gist montre comment utiliser Robotoff pour extraire les ingrédients et la position des mots associés dans l'image.
Une campagne d'annotation d'image de liste d'ingrédients a été démarrée ici : elle permettra d'avoir des données ground-truth pour évaluer la fiabilité du système de croping des listes d'ingrédients.
Resources utiles
- Comment générer les URLs des photos de produits sur Open Food Facts à partir des métadonnées produit
- Comment l'OCR est utilisé à Open Food Facts, et comment récupérer le jeu de données d'OCR
- Documentation Robotoff dont installation
- Comprendre les Taxonomy dont celle des ingredients (téléchargeable aussi sous forme json)