FR:Internationalisation

From Open Food Facts wiki

Le classement actuel des produits par langue est loin d'ĂȘtre parfait. Un prochain gros chantier va ĂȘtre de repenser la gestion des langues et des pays dans Open Food Facts. Cette page a pour but d'Ă©laborer les spĂ©cifications de la prochaine gestion des langues et des pays.

A compléter.


Les problĂšmes actuels

  • Les produits sont mĂ©langĂ©s : sur la version espagnole, on trouve aussi bien des produits vendus en Espagne que des produits vendus en AmĂ©rique Latine
    • c'est un problĂšme pour les utilisateurs qui cherchent des produits de leur pays, mais aussi pour les contributeurs : on ne peut pas aujourd'hui afficher une courbe de progression des produits de Belgique, du QuĂ©bec etc.
  • Certains produits n'ont pas de langue principale : les produits Cora on souvent une face française et l'autre face en nĂ©erlandais
  • de l'appli iOS si on est pas enregistrĂ© les scan de code barre semblent disparaitre... En tant qu'utilisateur francophone, enregristrĂ© sur le fr.off et habitant en Angleterre et donc scannant pour l'anglais je perd mes scans (et photos) des fois (note: Ă  faire: reproduire le problĂšme et donner instructions pas Ă  pas pur reproduire le pb).
    • scanner des produits de l'etranger (quelle que soit la dĂ©finition d'Ă©tranger) soulĂšve des problĂšmes du meme genre.
      • Ă  noter, si on scan et ajoute des photos via l'app sans ĂȘtre identifiĂ©, c'est la 1Ăšre personne qui modifie ensuite le produit qui devient "l'ajouteur". -- StĂ©phane
        • Ce qui m'est arrivĂ© c'est que je croyais ĂȘtre enregistrĂ©. j'ai scannĂ© quelques produits et je m'attendais Ă  les retrouver sur ma page, et donc Ă  pouvoir les complĂ©ter. J'imagine que l'app s'est mise Ă  jour (mĂȘme si je ne me souviens pas de ca) et qu'elle a perdu le mdp et je n'ai pas retrouvĂ© les scans (et photos) ni dans la partie fr ni dans en (dans les derniers produits ajoutĂ©s), du coup j'ai abandonnĂ© -- BenoĂźt
  • les noms des composĂ©s (par ex sel, eau, acide ascorbique...) devraient ĂȘtre dans un dictionnaire sĂ©parĂ© et non pas par pays. Un utilisateur Francophone regardant un produit russe devrait pouvoir afficher les composĂ©s dans sa langue prĂ©fĂ©rĂ©e.
  • La recherche est limitĂ©e Ă  un sous-ensemble de produits (aujourd'hui par langue, demain par pays de distribution)
    • Il faudrait permettre d'Ă©tendre la recherche Ă  tous les produits, dire "nous n'avons pas trouvĂ© de rĂ©sultats parmi les produits largement distribuĂ©s en France, mais voici les rĂ©sultats d'autres pays"

Ce qu'on veut pouvoir faire

  • Lister les produits par "marchĂ©" (pays ou rĂ©gion de distribution) plutĂŽt que par langue.
    • Pourquoi est-il besoin de recrĂ©er une autre division ? Pourquoi pas des pages de disambiguation s'il y a ambiguité ?
      • En fait justement, je souhaite enlever la division actuelle (par langue) et la remplacer par des "visions" : des vues. Pas tellement pour les pages individuelles des produits, mais plus pour les ensembles de produits accessibles Ă  un utilisateurs. Un utilisateur quĂ©bĂ©cois qui tape "yaourt" dans le moteur de recherche sera intĂ©ressĂ© par les produits qui sont vendus au QuĂ©bec, ce sont ceux lĂ  qu'il faut lui retourner en prioritĂ©. Et c'est la mĂȘme chose pour les moyennes nutritionnelles des catĂ©gories, les graphiques etc. : c'est je pense plus pertinent par marchĂ© que par langue. -- StĂ©phane
  • Avoir une hiĂ©rarchie internationale des catĂ©gories, traduite dans toutes les langues
    • idem pour les labels, les marques etc.
  • Afficher la fiche d'un produit dans toutes les langues : toutes celles qui figurent sur le paquet, mais aussi toutes les autres
    • Afficher des photos spĂ©cifiques Ă  la langue choisie par l'utilisateur (ingrĂ©dients en particulier)
  • Rechercher des produits dans toute la base, avec possibilitĂ© de prĂ©senter les rĂ©sultats par sections : produits vendus dans un pays prĂ©cis, produits vendus dans des pays limitrophes (ou "proches" culturellement), produits dont la langue principale est xyz, produit dont les ingrĂ©dients figurent aussi dans la langue xyz etc.
  • ...

Cas à gérer

  • 1 mĂȘme produit vendu dans plusieurs marchĂ©s
    • Les produits de Marks and Spencer, vendus en France, avec des codes-barres spĂ©cifiques
    • Les produits distributeurs vendus dans plusieurs pays (parfois des bouteilles espagnoles de soda carrefour)
  • 1 produit avec des versions diffĂ©rentes dans diffĂ©rents marchĂ©s
    • mĂȘme code barre ou non
  • 1 produit avec plusieurs langues sur l'emballage
    • en particulier ingrĂ©dients
      • possibilitĂ© de sĂ©lectionner les diverses langues, et de valider le produit avec la plus rapide
  • ...

Conception

Hiérarchies

  • Une seule hiĂ©rarchie internationale pour chacun des types de champs (catĂ©gories, marques, labels etc.)
  • Traduction du nom de la catĂ©gorie (ou marques etc.) dans chaque langue
  • Synonymes du nom de la catĂ©gorie dans chaque langue

FR:Exemple de définition d'une hiérarchie

FR:Transformation de la hiérarchie des catégories francophone dans le nouveau format

Cas spécifique des ingrédients

Les ingrĂ©dients doivent Ă©galement ĂȘtre traduits dans toutes les langues. Cela pourrait ĂȘtre trĂšs intĂ©ressant d'en profiter pour faire aussi une hiĂ©rarchie des ingrĂ©dients qui permettrait de trouver facilement les produits qui contiennent de la viande, du gluten etc. mĂȘme si l'ingrĂ©dient est "cuisses de canard" ou "farine de blĂ©".

Pays

Sous-sites de pays

Aujourd'hui OFF est structuré par langues : la page fr.openfoodfacts.org liste tous les produits dont la "langue principale" est le français. Mais pour chaque utilisateur, c'est plus intéressant de lister les produits disponibles dans son pays (les produits vendus en Argentine ou en Espagne plutÎt que tous les produits dont la langue principale est l'espagnol).

  • le problĂšme ici est de dĂ©finir "pays"... On fait quoi de Jersey? La guadeloupe? La nouvelle CalĂ©donie? Le Groenland? Puerto Rico? Les Britanniques retraitĂ©s qui vivent en France mais font leur course en ligne au Royaume Uni car l'euro est trop cher pour eux? Les Irlandais qui vont faire leurs courses en Irlande du Nord? Comm suggĂ©rĂ© ailleurs dans le document peut-ĂȘtre afficher par dĂ©faut le pays choisi et lister les autres endroits oĂč le produit a Ă©tĂ© trouvĂ© (et scannĂ© peut etre? L'appli mobile qui ajoute des meta donnĂ©s Ă  chaque scan grace a geoip?))

L'idée est donc de changer la structure du site et des sous-sites :

nomdupays.openfoodfacts.org

Exemples : france.openfoodfacts.org, italia.openfoodfacts.org

  • Liste de tous les produits vendus dans un pays.
  • Liste de marques, de labels, d'additifs etc. pour les produits vendus dans le pays
  • Valeurs nutritionnelles moyennes etc. calculĂ©es pour les produits vendus dans le pays

A noter, pour les produits oĂč on parle plusieurs langues, on peut avoir des sous-domaines diffĂ©rents : belgique.openfoodfacts.org et belgie.openfoodfacts.org. Les produits listĂ©s sont les mĂȘmes, mais la langue de l'interface, et du contenu, est diffĂ©rente.

initialesdelalangue.openfoodfacts.org

Exemples : fr.openfoodfacts.org, en.openfoodfacts.org

  • Pages individuelles pour chacun des produits, dans chacune des langues. Un mĂȘme produit est accessible avec n'importe quelle langue, et ce qu'on arrive Ă  traduire est traduit.

Recherche et listes de produits Ă©tendues Ă  d'autres pays et langues

Aujourd'hui la recherche, les listes des produits d'une catĂ©gorie etc. sont restreintes aux produits d'une langue. Avec la nouvelle organisation, la restriction sera par pays de vente (avec pays au pluriel : un produit pourra ĂȘtre marquĂ© comme largement distribuĂ© dans plusieurs pays).

Les rĂ©sultats de recherche pourront ĂȘtre Ă©tendus Ă  tous les produits, et on pourra les prĂ©senter par sections :

  • les produits marquĂ©s comme largement distribuĂ©s dans le pays cible
  • les produits distribuĂ©s dans les pays "proches" (gĂ©ographiquement et/ou culturellement : les pays dont les produits sont souvent importĂ©s dans le pays cible)
  • les produits dont la langue principale est parlĂ©e dans le pays cible
  • les produits dont les ingrĂ©dients figurent aussi dans l'une des langues du pays cible
  • les autres rĂ©sultats

En particulier, quand il n'y a pas de résultat dans le pays cible, on peut étendre automatiquement la recherche ("nous n'avons pas trouvé de résultats dans le pays XYZ mais voici les résultats des autres pays").

Une alternative au "saucissonnage" des résultats de recherche est de calculer un score pour chaque résultat pour les ordonner et de prendre en compte les pays de distribution et les langues dans le calcul du score.


Valeurs du champ Pays

Pour pouvoir choisir d'afficher un produit dans le sous-site d'un pays, il faut que le champ Pays (ajouté le 6/11/13) soit renseigné.

Nouveaux produits

On peut proposer par défaut une valeur pour le champ pays correspondant à l'emplacement de l'utilisateur :

  • via l'adresse IP
  • en demandant explicitement la position (niveau pays) pour les applis mobiles

Anciens produits

12000 produits ajoutés avant l'ajout du champ Pays n'ont pas le champ Pays renseigné.

On peut essayer d'attribuer automatiquement un ou plusieurs valeurs en fonction d'autres champs :

  • la personne qui a ajoutĂ© le produit (quasiment tous les produits que j'ai ajoutĂ© viennent de France, pour quelqu'un qui habite en Belgique, ça sera la Belgique)
  • la marque, en particulier les marques de distributeurs (Cora = France + Belgique ?)
  • le champ "ville ou pays d'achat"

On pourrait ainsi attribuer une valeur Ă  la plupart des produits, et ensuite essayer de trouver les faux positifs (par marque par exemple).

Nouveaux et anciens produits

On pourrait essayer d'ajouter plus ou moins automatiquement des pays :

  • en se servant de la position des personnes qui scannent un code barre
  • en croisant les donnĂ©es avec celles d'autres bases (API de magasins en ligne par exemple), il faudra vĂ©rifier alors que ce n'est pas interdit par les conditions d'utilisations des bases ou sites externes