DataForGood-2023: Difference between revisions

From Open Food Facts wiki
(Created page with "== Data For Good 2023 == Open Food Facts participe à la saison 11 de Data For Good, avec comme thématique la détection automatique des ingrédients à partir des images de...")
 
(Added link to taxonomy and robotoff installation.)
Line 9: Line 9:
Pour détecter la zone de l'image où se trouve la liste d'ingrédients, une approche possible est de détecter les mots sur la photo correspondant à des ingrédients, puis de trouver la zone dans la photo où la densité d'ingrédients est suffisamment élevée pour que celle-ci corresponde à la zone d'ingrédients.
Pour détecter la zone de l'image où se trouve la liste d'ingrédients, une approche possible est de détecter les mots sur la photo correspondant à des ingrédients, puis de trouver la zone dans la photo où la densité d'ingrédients est suffisamment élevée pour que celle-ci corresponde à la zone d'ingrédients.


[https://gist.github.com/raphael0202/7bc50ee50e86fdc9ba10cac2c145ebf8 Ce gist] montre comment utiliser Robotoff pour extraire les ingrédients et la position des mots associés dans l'image.  
[https://gist.github.com/raphael0202/7bc50ee50e86fdc9ba10cac2c145ebf8 Ce gist] montre comment utiliser Robotoff pour extraire les ingrédients et la position des mots associés dans l'image.


Une campagne d'annotation d'image de liste d'ingrédients [https://annotate.openfoodfacts.org/projects/3/data?tab=5 a été démarrée ici] : elle permettra d'avoir des données ground-truth pour évaluer la fiabilité du système de croping des listes d'ingrédients.
Une campagne d'annotation d'image de liste d'ingrédients [https://annotate.openfoodfacts.org/projects/3/data?tab=5 a été démarrée ici] : elle permettra d'avoir des données ground-truth pour évaluer la fiabilité du système de croping des listes d'ingrédients.
Line 17: Line 17:
* [https://openfoodfacts.github.io/openfoodfacts-server/api/how-to-download-images/ Comment générer les URLs des photos de produits sur Open Food Facts à partir des métadonnées produit]
* [https://openfoodfacts.github.io/openfoodfacts-server/api/how-to-download-images/ Comment générer les URLs des photos de produits sur Open Food Facts à partir des métadonnées produit]
* [[OCR|Comment l'OCR est utilisé à Open Food Facts, et comment récupérer le jeu de données d'OCR]]
* [[OCR|Comment l'OCR est utilisé à Open Food Facts, et comment récupérer le jeu de données d'OCR]]
* [https://openfoodfacts.github.io/robotoff/ Documentation Robotoff]
* [https://openfoodfacts.github.io/robotoff/ Documentation Robotoff] dont [https://openfoodfacts.github.io/robotoff/how-to-guides/deployment/dev-install/ installation]
* Comprendre les [[Global taxonomies|Taxonomy]] dont celle des [https://github.com/openfoodfacts/openfoodfacts-server/blob/main/taxonomies/ingredients.txt ingredients] (téléchargeable aussi [https://static.openfoodfacts.net/data/taxonomies/ingredients.full.json sous forme json])

Revision as of 09:35, 28 March 2023

Data For Good 2023

Open Food Facts participe à la saison 11 de Data For Good, avec comme thématique la détection automatique des ingrédients à partir des images des produits.

Une description détaillée du projet est disponible sur le Notion de Data For Good.

Introduction

Pour détecter la zone de l'image où se trouve la liste d'ingrédients, une approche possible est de détecter les mots sur la photo correspondant à des ingrédients, puis de trouver la zone dans la photo où la densité d'ingrédients est suffisamment élevée pour que celle-ci corresponde à la zone d'ingrédients.

Ce gist montre comment utiliser Robotoff pour extraire les ingrédients et la position des mots associés dans l'image.

Une campagne d'annotation d'image de liste d'ingrédients a été démarrée ici : elle permettra d'avoir des données ground-truth pour évaluer la fiabilité du système de croping des listes d'ingrédients.

Resources utiles