FR:Détection des erreurs potentielles
Objectifs
- Détecter les erreurs potentielles pour pouvoir les corriger
- Ne pas prendre en compte des produits dont les informations sont douteuses dans les calculs de moyennes
Pistes pour détecter automatiquement les produits qui contiennent des erreurs de saisie des informations
Ingrédients et nutrition
- Somme des éléments du tableau nutritionnel bien supérieure à 100g
- Somme des ingrédients bien supérieure à 100g (détection ainsi des produits compliqués)
- confusion entre le 'l' (lettre L en minuscule) et 1 (chiffre un) dans la liste des ingrédients à cause de l'OCR, ce qui donne : nom_de_l'ingrédient l5%
- Somme des "dont sucre/amidon/etc." supérieure à glucides (et même chose pour les lipides etc.)
- Energie supérieure à 4000 kJ
- Taille de la portion supérieure à la taille du paquet
- "Empreinte carbone / émissions de CO2" supérieure à 3 000g
- Nombre d'additifs supérieur à 12
- Quantité de 'sucres' supérieure à la quantité de 'glucides'
- Somme des acides gras supérieure à la quantité de 'lipides'
- etc
Magasins
- Producteur: Leader Price ou Picard / Magasin: un autre (hormis Franprix qui revend des produits LeaderPrice)
Remarque
Chaque piste (chaque règle) doit avoir un numéro unique clairement associé : Une fois qu'une méthode précise de détection d'erreur est traduite informatiquement (est implémentée), alors cette méthode devient une règle. Le numéro associé automatiquement à cette règle permet, aux contributeurs, de désigner sans ambiguïté celle-ci.