FR:Internationalisation
Le classement actuel des produits par langue est loin d'ĂȘtre parfait. Un prochain gros chantier va ĂȘtre de repenser la gestion des langues et des pays dans Open Food Facts. Cette page a pour but d'Ă©laborer les spĂ©cifications de la prochaine gestion des langues et des pays.
A compléter.
Les problĂšmes actuels
- Les produits sont mélangés : sur la version espagnole, on trouve aussi bien des produits vendus en Espagne que des produits vendus en Amérique Latine
- c'est un problÚme pour les utilisateurs qui cherchent des produits de leur pays, mais aussi pour les contributeurs : on ne peut pas aujourd'hui afficher une courbe de progression des produits de Belgique, du Québec etc.
- Certains produits n'ont pas de langue principale : les produits Cora on souvent une face française et l'autre face en néerlandais
- de l'appli iOS si on est pas enregistré les scan de code barre semblent disparaitre... En tant qu'utilisateur francophone, enregristré sur le fr.off et habitant en Angleterre et donc scannant pour l'anglais je perd mes scans (et photos) des fois (note: à faire: reproduire le problÚme et donner instructions pas à pas pur reproduire le pb).
- scanner des produits de l'etranger (quelle que soit la définition d'étranger) soulÚve des problÚmes du meme genre.
- Ă noter, si on scan et ajoute des photos via l'app sans ĂȘtre identifiĂ©, c'est la 1Ăšre personne qui modifie ensuite le produit qui devient "l'ajouteur". -- StĂ©phane
- Ce qui m'est arrivĂ© c'est que je croyais ĂȘtre enregistrĂ©. j'ai scannĂ© quelques produits et je m'attendais Ă les retrouver sur ma page, et donc Ă pouvoir les complĂ©ter. J'imagine que l'app s'est mise Ă jour (mĂȘme si je ne me souviens pas de ca) et qu'elle a perdu le mdp et je n'ai pas retrouvĂ© les scans (et photos) ni dans la partie fr ni dans en (dans les derniers produits ajoutĂ©s), du coup j'ai abandonnĂ© -- BenoĂźt
- Ă noter, si on scan et ajoute des photos via l'app sans ĂȘtre identifiĂ©, c'est la 1Ăšre personne qui modifie ensuite le produit qui devient "l'ajouteur". -- StĂ©phane
- scanner des produits de l'etranger (quelle que soit la définition d'étranger) soulÚve des problÚmes du meme genre.
- les noms des composĂ©s (par ex sel, eau, acide ascorbique...) devraient ĂȘtre dans un dictionnaire sĂ©parĂ© et non pas par pays. Un utilisateur Francophone regardant un produit russe devrait pouvoir afficher les composĂ©s dans sa langue prĂ©fĂ©rĂ©e.
- La recherche est limitée à un sous-ensemble de produits (aujourd'hui par langue, demain par pays de distribution)
- Il faudrait permettre d'étendre la recherche à tous les produits, dire "nous n'avons pas trouvé de résultats parmi les produits largement distribués en France, mais voici les résultats d'autres pays"
Ce qu'on veut pouvoir faire
- Lister les produits par "marché" (pays ou région de distribution) plutÎt que par langue.
- Pourquoi est-il besoin de recréer une autre division ? Pourquoi pas des pages de disambiguation s'il y a ambiguité ?
- En fait justement, je souhaite enlever la division actuelle (par langue) et la remplacer par des "visions" : des vues. Pas tellement pour les pages individuelles des produits, mais plus pour les ensembles de produits accessibles Ă un utilisateurs. Un utilisateur quĂ©bĂ©cois qui tape "yaourt" dans le moteur de recherche sera intĂ©ressĂ© par les produits qui sont vendus au QuĂ©bec, ce sont ceux lĂ qu'il faut lui retourner en prioritĂ©. Et c'est la mĂȘme chose pour les moyennes nutritionnelles des catĂ©gories, les graphiques etc. : c'est je pense plus pertinent par marchĂ© que par langue. -- StĂ©phane
- Pourquoi est-il besoin de recréer une autre division ? Pourquoi pas des pages de disambiguation s'il y a ambiguité ?
- Avoir une hiérarchie internationale des catégories, traduite dans toutes les langues
- idem pour les labels, les marques etc.
- Afficher la fiche d'un produit dans toutes les langues : toutes celles qui figurent sur le paquet, mais aussi toutes les autres
- Afficher des photos spécifiques à la langue choisie par l'utilisateur (ingrédients en particulier)
- Rechercher des produits dans toute la base, avec possibilité de présenter les résultats par sections : produits vendus dans un pays précis, produits vendus dans des pays limitrophes (ou "proches" culturellement), produits dont la langue principale est xyz, produit dont les ingrédients figurent aussi dans la langue xyz etc.
- ...
Cas à gérer
- 1 mĂȘme produit vendu dans plusieurs marchĂ©s
- Les produits de Marks and Spencer, vendus en France, avec des codes-barres spécifiques
- Les produits distributeurs vendus dans plusieurs pays (parfois des bouteilles espagnoles de soda carrefour)
- 1 produit avec des versions différentes dans différents marchés
- mĂȘme code barre ou non
- 1 produit avec plusieurs langues sur l'emballage
- en particulier ingrédients
- possibilité de sélectionner les diverses langues, et de valider le produit avec la plus rapide
- en particulier ingrédients
- ...
Conception
Hiérarchies
- Une seule hiérarchie internationale pour chacun des types de champs (catégories, marques, labels etc.)
- Traduction du nom de la catégorie (ou marques etc.) dans chaque langue
- Synonymes du nom de la catégorie dans chaque langue
FR:Exemple de définition d'une hiérarchie
FR:Transformation de la hiérarchie des catégories francophone dans le nouveau format
Cas spécifique des ingrédients
Les ingrĂ©dients doivent Ă©galement ĂȘtre traduits dans toutes les langues. Cela pourrait ĂȘtre trĂšs intĂ©ressant d'en profiter pour faire aussi une hiĂ©rarchie des ingrĂ©dients qui permettrait de trouver facilement les produits qui contiennent de la viande, du gluten etc. mĂȘme si l'ingrĂ©dient est "cuisses de canard" ou "farine de blĂ©".
Pays
Sous-sites de pays
Aujourd'hui OFF est structuré par langues : la page fr.openfoodfacts.org liste tous les produits dont la "langue principale" est le français. Mais pour chaque utilisateur, c'est plus intéressant de lister les produits disponibles dans son pays (les produits vendus en Argentine ou en Espagne plutÎt que tous les produits dont la langue principale est l'espagnol).
- le problĂšme ici est de dĂ©finir "pays"... On fait quoi de Jersey? La guadeloupe? La nouvelle CalĂ©donie? Le Groenland? Puerto Rico? Les Britanniques retraitĂ©s qui vivent en France mais font leur course en ligne au Royaume Uni car l'euro est trop cher pour eux? Les Irlandais qui vont faire leurs courses en Irlande du Nord? Comm suggĂ©rĂ© ailleurs dans le document peut-ĂȘtre afficher par dĂ©faut le pays choisi et lister les autres endroits oĂč le produit a Ă©tĂ© trouvĂ© (et scannĂ© peut etre? L'appli mobile qui ajoute des meta donnĂ©s Ă chaque scan grace a geoip?))
L'idée est donc de changer la structure du site et des sous-sites :
nomdupays.openfoodfacts.org
Exemples : france.openfoodfacts.org, italia.openfoodfacts.org
- Liste de tous les produits vendus dans un pays.
- Liste de marques, de labels, d'additifs etc. pour les produits vendus dans le pays
- Valeurs nutritionnelles moyennes etc. calculées pour les produits vendus dans le pays
A noter, pour les produits oĂč on parle plusieurs langues, on peut avoir des sous-domaines diffĂ©rents : belgique.openfoodfacts.org et belgie.openfoodfacts.org. Les produits listĂ©s sont les mĂȘmes, mais la langue de l'interface, et du contenu, est diffĂ©rente.
initialesdelalangue.openfoodfacts.org
Exemples : fr.openfoodfacts.org, en.openfoodfacts.org
- Pages individuelles pour chacun des produits, dans chacune des langues. Un mĂȘme produit est accessible avec n'importe quelle langue, et ce qu'on arrive Ă traduire est traduit.
Recherche et listes de produits Ă©tendues Ă d'autres pays et langues
Aujourd'hui la recherche, les listes des produits d'une catĂ©gorie etc. sont restreintes aux produits d'une langue. Avec la nouvelle organisation, la restriction sera par pays de vente (avec pays au pluriel : un produit pourra ĂȘtre marquĂ© comme largement distribuĂ© dans plusieurs pays).
Les rĂ©sultats de recherche pourront ĂȘtre Ă©tendus Ă tous les produits, et on pourra les prĂ©senter par sections :
- les produits marqués comme largement distribués dans le pays cible
- les produits distribués dans les pays "proches" (géographiquement et/ou culturellement : les pays dont les produits sont souvent importés dans le pays cible)
- les produits dont la langue principale est parlée dans le pays cible
- les produits dont les ingrédients figurent aussi dans l'une des langues du pays cible
- les autres résultats
En particulier, quand il n'y a pas de résultat dans le pays cible, on peut étendre automatiquement la recherche ("nous n'avons pas trouvé de résultats dans le pays XYZ mais voici les résultats des autres pays").
Une alternative au "saucissonnage" des résultats de recherche est de calculer un score pour chaque résultat pour les ordonner et de prendre en compte les pays de distribution et les langues dans le calcul du score.
Valeurs du champ Pays
Pour pouvoir choisir d'afficher un produit dans le sous-site d'un pays, il faut que le champ Pays (ajouté le 6/11/13) soit renseigné.
Nouveaux produits
On peut proposer par défaut une valeur pour le champ pays correspondant à l'emplacement de l'utilisateur :
- via l'adresse IP
- en demandant explicitement la position (niveau pays) pour les applis mobiles
Anciens produits
12000 produits ajoutés avant l'ajout du champ Pays n'ont pas le champ Pays renseigné.
On peut essayer d'attribuer automatiquement un ou plusieurs valeurs en fonction d'autres champs :
- la personne qui a ajouté le produit (quasiment tous les produits que j'ai ajouté viennent de France, pour quelqu'un qui habite en Belgique, ça sera la Belgique)
- la marque, en particulier les marques de distributeurs (Cora = France + Belgique ?)
- le champ "ville ou pays d'achat"
On pourrait ainsi attribuer une valeur Ă la plupart des produits, et ensuite essayer de trouver les faux positifs (par marque par exemple).
Nouveaux et anciens produits
On pourrait essayer d'ajouter plus ou moins automatiquement des pays :
- en se servant de la position des personnes qui scannent un code barre
- en croisant les données avec celles d'autres bases (API de magasins en ligne par exemple), il faudra vérifier alors que ce n'est pas interdit par les conditions d'utilisations des bases ou sites externes