Ingredients list cutting: after phrases: Difference between revisions

From Open Food Facts wiki
(Created page with "The phrases used to find the end of an ingredients list (situation 14 Oct 2023). This is used for Ingredients List Cutting.")
 
No edit summary
 
Line 1: Line 1:
The phrases used to find the end of an ingredients list (situation 14 Oct 2023). This is used for [[/wiki.openfoodfacts.org/Ingredients List Cutting|Ingredients List Cutting]].
The phrases used to find the end of an ingredients list (situation 14 Oct 2023). These can be found in ingredients.pm under <code>%phrases_after_ingredients_list.</code> This is used for [[Ingredients List Cutting]].
 
<code>bg => [</code>
 
<code>'да се съхранява (в закрити|на сухо)',    # store in ...</code>
 
<code>],</code>
 
<code>cs => ['doporučeny způsob přípravy', 'V(ý|y)(ž|z)ivov(e|é) (ú|u)daje ve 100 g',],</code>
 
<code>da => [</code>
 
<code>'(?:gennemsnitlig )?n(æ|ae)rings(?:indhold|værdi|deklaration)',</code>
 
<code>'tilberedning(?:svejledning)?',</code>
 
<code>'holdbarhed efter åbning',</code>
 
<code>'opbevar(?:ing|res)?',</code>
 
<code>'(?:for )?allergener',</code>
 
<code>'produceret af',</code>
 
<code>'beskyttes', 'nettovægt', 'åbnet',</code>
 
<code>],</code>
 
<code>de => [</code>
 
<code>'Ern(â|a|ä)hrungswerte',</code>
 
<code>'Mindestens altbar bis',</code>
 
<code>'Mindestens haltbar bis',</code>
 
<code>'davon ges(â|a|ä)tigte Fettsäuren',</code>
 
<code>'davon Zuckerarten',</code>
 
<code>'davon ges(â|a|ä)ttigte',</code>
 
<code>'Durchschnittlich enthalten 100 (ml|g)',</code>
 
<code>'Durchschnittliche N(â|a|ä)hrwerte',</code>
 
<code>'DURCHSCHNITTLICHE NÄHRWERTE',</code>
 
<code>'Durchschnittliche N(â|a|ä)hrwert(angaben|angabe)',</code>
 
<code>'Kakao: \d\d\s?% mindestens.',</code>
 
<code>'N(â|a|ä)hrwert(angaben|angabe|information|tabelle)',    #Nährwertangaben pro 100g</code>
 
<code>'N(â|a|ä)hrwerte je',</code>
 
<code>'Nâhrwerte',</code>
 
<code>'(Ungeöffnet )?mindestens',</code>
 
<code>'(k[uü]hl|bei Zimmertemperatur) und trocken lagern',</code>
 
<code>'Rinde nicht zum Verzehr geeignet.',</code>
 
<code>'Vor W(â|a|ä)rme und Feuchtigkeit sch(u|ü)tzen',</code>
 
<code>'Unge(ö|o)ffnet bei max.',</code>
 
<code>'Unter Schutzatmosphäre verpackt',</code>
 
<code>'verbrauchen bis',</code>
 
<code>'Vor Wärme geschützt (und trocken )?lagern',</code>
 
<code>'Vorbereitung Tipps',</code>
 
<code>'zu verbrauchen bis',</code>
 
<code>'100 (ml|g) enthalten durchschnittlich',</code>
 
<code>'\d\d\d\sg\s\w*\swerden aus\s\d\d\d\sg\s\w*\shergestellt'</code>
 
<code>,    # 100 g Salami werden aus 120 g Schweinefleisch hergestellt.</code>
 
<code>],</code>
 
<code>el => [</code>
 
<code>'ΔΙΑΘΡΕΠΤΙΚΗ ΕΠΙΣΗΜΑΝΣΗ',    #Nutritional labelling</code>
 
<code>'ΔΙΤΡΟΦΙΚΕΣ ΠΗΡΟΦΟΡΙΕΣ',</code>
 
<code>],</code>
 
<code>en => [</code>
 
<code>'adds a trivial amount',    # e.g. adds a trivial amount of added sugars per serving</code>
 
<code>'after opening',</code>
 
<code>#'Best before',</code>
 
<code>'nutrition(al)? (as sold|facts|information|typical|value[s]?)',</code>
 
<code># "nutrition advice" seems to appear before ingredients rather than after.</code>
 
<code># "nutritional" on its own would match the ingredient "nutritional yeast" etc.</code>
 
<code>'of whlch saturates',</code>
 
<code>'of which saturates',</code>
 
<code>'of which saturated fat',</code>
 
<code>'((\d+)(\s?)kJ\s+)?(\d+)(\s?)kcal',</code>
 
<code>'once opened[,]? (consume|keep|refrigerate|store|use)',</code>
 
<code>'(Storage( instructions)?[: ]+)?Store in a cool[,]? dry place',</code>
 
<code>'(dist(\.)?|distributed|sold)(\&|and|sold| )* (by|exclusively)',</code>
 
<code>#'See bottom of tin',</code>
 
<code>],</code>
 
<code>es => [</code>
 
<code>'valores nutricionales',</code>
 
<code>'modo de preparacion',</code>
 
<code>'informaci(o|ô)n nutricional',</code>
 
<code>'valor energ(e|é)tico',</code>
 
<code>'condiciones de conservaci(o|ó)n',</code>
 
<code>#'pa(i|í)s de transformaci(o|ó)n',</code>
 
<code>'cons[eé]rv(ar|ese) en( un)? lug[ae]r (fresco y seco|seco y fresco)',</code>
 
<code>'de los cuates az(u|ü)cares',</code>
 
<code>'de las cuales saturadas',</code>
 
<code>'protegido de la luz',</code>
 
<code>'conser(y|v)ar entre',</code>
 
<code>'una vez abierto',</code>
 
<code>'conservaci(o|ó)n:',</code>
 
<code>'consumi preferentemente antes del',</code>
 
<code>'consumir preferentemente antes del',</code>
 
<code>#Envasado por:</code>
 
<code>],</code>
 
<code>et => [</code>
 
<code>'parim enne',    # best before</code>
 
<code>],</code>
 
<code>fi => [</code>
 
<code>'100 g:aan tuotetta käytetään',</code>
 
<code>'Kypsennys',</code>
 
<code>'Makeisten sekoitussuhde voi vaihdella',</code>
 
<code>'Pakattu suojakaasuun',</code>
 
<code>'Parasta ennen',</code>
 
<code>'Viimeinen käyttöpäivä',</code>
 
<code>'(?:Keskimääräinen )?Ravinto(?:arvo|sisältö)',</code>
 
<code>'Sisältää aluspaperin',</code>
 
<code>'Suositellaan säilytettäväksi',</code>
 
<code>'Säily(?:tettävä|tetään|tys|y)',</code>
 
<code>'Tämä tuote on tehty ihmisille',</code>
 
<code>'Valmist(?:aja:|us)',</code>
 
<code>],</code>
 
<code>fr => [</code>
 
<code>'valeur(s?) (e|é)nerg(e|é)tique',</code>
 
<code>'valeur(s?) nutritives',</code>
 
<code>'valeur nutritive',</code>
 
<code>'valeurs mo(y|v)ennes',</code>
 
<code>'valeurs nutritionelles moyennes',</code>
 
<code>'valeur nutritionnelle mo(y|v)enne',</code>
 
<code>'valeur nutritionnelle',</code>
 
<code>'(va(l|t)eurs|informations|d(e|é)claration|analyse|rep(e|è)res) (nutritionnel)(s|le|les)?',</code>
 
<code>'(a|à) consommer de pr[ée]f[ée]rence',</code>
 
<code>'(a|à) consommer de',</code>
 
<code>'(a|à) cons.de préférence avant',</code>
 
<code>'(a|à) consommer (cuit|rapidement|dans|jusqu)',</code>
 
<code>'(a|à)[ ]?conserver (entre|dans|de|au|a|à)',</code>
 
<code>'Allergènes: voir les ingrédients en gras',</code>
 
<code>'Attention: les enfants en bas âge risquent de',</code>
 
<code>'apr(e|è)s (ouverture|achat)',</code>
 
<code>'apport de r(e|é)ference pour un adulte type',</code>
 
<code>'caractéristiques nu(t|f)ritionnelles',</code>
 
<code>'Conditionné sous vide',</code>
 
<code>'(conseil|conseils) de pr(e|é)paration',</code>
 
<code>'(conditions|conseils) de conservation',</code>
 
<code>'conseil d\'utilisation',</code>
 
<code>'conservation[ ]?:',</code>
 
<code>'Croûte en matière plastique non comestible',</code>
 
<code>'dans le compartiment (a|à) gla(c|ç)ons',</code>
 
<code>'de préférence avant le',</code>
 
<code>'dont sucres',</code>
 
<code>'dont acides (gras|ras) satur(e|é)s',</code>
 
<code>'Fabriquee à partir de fruits entiers',</code>
 
<code>'Fabriqué dans un atelier qui utilise',</code>
 
<code>'information nutritionnelle',</code>
 
<code>'((\d+)(\s?)kJ\s+)?(\d+)(\s?)kcal',</code>
 
<code>'la pr(e|é)sence de vide',    # La présence de vide au fond du pot est due au procédé de fabrication.</code>
 
<code>'Modes de pr(e|é)paration',</code>
 
<code>'Mode de pr(e|é)paration',</code>
 
<code>'moyennes pour 100(g|ml)',</code>
 
<code>'Naturellement riche en fibres',</code>
 
<code>'ne jamais recongeler un produit décongelé',</code>
 
<code>'nutritionnelles mo(y|v)ennes'</code>
 
<code>,    # in case of ocr issue on the first word "valeurs" v in case the y is cut halfway</code>
 
<code>'nutritionnelles pour 100(g|ml)',    #Arôme Valeum nutritionnelles pour 100g: Energie</code>
 
<code>'Nutrition pour 100 (g|ml)',</code>
 
<code>'pensez au tri',</code>
 
<code>'Peux contenir des morceaux de noyaux',</code>
 
<code>'pr(e|é)paration au four',</code>
 
<code>'Prépar(e|é)e? avec',</code>
 
<code>'(produit )?(a|à) protéger de ',    # humidité, chaleur, lumière etc.</code>
 
<code>'(produit )?conditionn(e|é) sous atmosph(e|è)re protectrice',</code>
 
<code>'N(o|ò)us vous conseillons',</code>
 
<code>'Non ouvert,',</code>
 
<code>'Sans conservateur',</code>
 
<code>'(Utilisation: |Préparation: )?Servir frais',</code>
 
<code>'Temps de Cuisson',</code>
 
<code>'tenir à l\'abri',</code>
 
<code>'Teneur en matière grasse',</code>
 
<code>'(Chocolat: )?teneur en cacao',</code>
 
<code>'Teneur totale en sucres',</code>
 
<code># Belgian products often mix languages and thus can have ending phrases in dutch</code>
 
<code>'Gemiddelde voedingswaarde',</code>
 
<code>#'Pour votre santé',</code>
 
<code>#'La certification Fairtrade assure',</code>
 
<code>#Préparation:</code>
 
<code>#'ne pas laisser les enfants' # Ne pas laisser les enfants de moins de 36 mols sans surveillance avec le bouchon dévissable. BT Daonan ar</code>
 
<code>#`etten/Matières grasses`, # (Vetten mais j'avais Netten/Matières grasses)</code>
 
<code>#'dont sucres',</code>
 
<code>#'dontSUcres',</code>
 
<code>#'waarvan suikers/</code>
 
<code>#`verzadigde vetzuren/ acides gras saturés`,</code>
 
<code>#`Conditionné par`,</code>
 
<code>],</code>
 
<code>hr => [</code>
 
<code>'bez konzervans',    # without preservatives</code>
 
<code>'Čuvati na (hladnom|sobnoj temperaturi|suhom|temperaturi)',    # store in...</code>
 
<code>'Čuvati zatvoreno na',</code>
 
<code>'Čuvati pri sobnoj temperaturi',</code>
 
<code>'izvor dijetalnih vlakana',    # source of proteins</code>
 
<code>'najbolje upotrijebiti do',    # best before</code>
 
<code>'nakon otvaranja',    # after opening</code>
 
<code>'pakirano u (kontroliranoj|zaštitnoj) atmosferi',    # packed in a ... atmosphere</code>
 
<code>'proizvod je termički obrađen-pasteriziran',    # pasteurized</code>
 
<code>'proizvođač',    # producer</code>
 
<code>'prosječn(a|e) (hranjiva|hranjive|nutritivne) (vrijednost|vrijednosti)',    # Average nutritional value</code>
 
<code>'protresti prije otvaranja',    # shake before opening</code>
 
<code>'upotrijebiti do datuma',    # valid until</code>
 
<code>'upozorenje',    # warning</code>
 
<code>'uputa',    # instructions</code>
 
<code>'uvjeti čuvanja',    # storage conditions</code>
 
<code>'uvoznik za',    # importer</code>
 
<code>'vakuumirana',    # Vacuumed</code>
 
<code>'vrijeme kuhanja',    # Cooking time</code>
 
<code>'zaštićena oznaka zemljopisnog podrijetla',    # ZOI/PDO</code>
 
<code>'zbog (mutan|prisutnosti)',    # Due to ...</code>
 
<code>'zemlja (porijekla|podrijetla|porekla)',    # country of origin</code>
 
<code>],</code>
 
<code>hu => [</code>
 
<code>'Atlagos tápérték 100g termékben',</code>
 
<code>'((száraz|hűvös|(közvetlen )?napfénytől védett)[, ]*)+helyen tárolandó',    # store in cool/dry/etc</code>
 
<code>],</code>
 
<code>is => ['n(æ|ae)ringargildi', 'geymi(st|ð) á', 'eftir opnum', 'aðferð',],</code>
 
<code>it => [</code>
 
<code>'valori nutrizionali',</code>
 
<code>'consigli per la preparazione',</code>
 
<code>'di cui zuccheri',</code>
 
<code>'Valori nutritivi',</code>
 
<code>'Conservare in luogo fresco e asciutto',</code>
 
<code>'MODALITA D\'USO',</code>
 
<code>'MODALITA DI CONSERVAZIONE',</code>
 
<code>'Preparazione:',</code>
 
<code>'Una volta aperto',    # once opened...</code>
 
<code>'Da consumarsi preferibilmente entro',    # best before</code>
 
<code>],</code>
 
<code>ja => [</code>
 
<code>'栄養価',    # nutritional value</code>
 
<code>'内容量',    # weight</code>
 
<code>'賞味期限',    # best before</code>
 
<code>],</code>
 
<code>lt => [</code>
 
<code>'geriausias iki',    # best before</code>
 
<code>],</code>
 
<code>nb => ['netto(?:innhold|vekt)', 'oppbevar(?:ing|es)', 'næringsinnhold', 'kjølevare',],</code>
 
<code>nl => [</code>
 
<code>'Beter Leven keurmerk 1 ster.',</code>
 
<code>'Beter Leven keurmerk 3 sterren',</code>
 
<code>'Bewaren bij kamertemperatuur',</code>
 
<code>'Cacao: ten minste ',</code>
 
<code>'Droog bewaren',</code>
 
<code>'E = door EU goedgekeurde hulpstof',</code>
 
<code>'E door EU goedgekeurde hulpstoffen',</code>
 
<code>'"E"-nummers zijn door de EU goedgekeurde hulpstoffen',</code>
 
<code>'gemiddelde voedingswaarden',</code>
 
<code>'Gemiddeldevoedingswaardel',</code>
 
<code>'gemiddelde voedingswaarde per 100 g',</code>
 
<code>'Na openen beperkt houdbaar',</code>
 
<code>'Ongeopend, ten minste houdbaar tot:',</code>
 
<code>'o.a.',</code>
 
<code>'ten minste',</code>
 
<code>'ten minste houdbaar tot',</code>
 
<code>'Van nature rijk aan vezels',</code>
 
<code>'Verpakt onder beschermende atmosfeer',</code>
 
<code>'voedingswaarden',</code>
 
<code>'voedingswaarde',</code>
 
<code>'Voor allergenen: zie ingrediëntenlijst, in vet gemarkeerd',</code>
 
<code>'voorbereidingstips',</code>
 
<code>#'waarvan suikers',</code>
 
<code>'Witte chocolade: ten minste',</code>
 
<code>],</code>
 
<code>pl => [</code>
 
<code>'przechowywać w chlodnym i ciemnym miejscu',    #keep in a dry and dark place</code>
 
<code>'n(a|o)jlepiej spożyć przed',    #Best before</code>
 
<code>'Przechowywanie',</code>
 
<code>'pakowan(o|y|e) w atmosferze ochronnej',    # Packaged in protective environment</code>
 
<code>],</code>
 
<code>pt => [</code>
 
<code>'conservar em local (seco e )?fresco',</code>
 
<code>'conservar em lugar fresco',</code>
 
<code>'dos quais a(ç|c)(u|ü)ares',</code>
 
<code>'dos quais a(ç|c)(u|ü)cares',</code>
 
<code>'informa(ç|c)(a|ã)o nutricional',</code>
 
<code>'modo de prepara(ç|c)(a|ã)o',</code>
 
<code>'a consumir de prefer(e|ê)ncia antes do',</code>
 
<code>'consumir de prefer(e|ê)ncia antes do',</code>
 
<code>],</code>
 
<code>ro => [</code>
 
<code>'declaratie nutritional(a|ă)',</code>
 
<code>'a si pastra la frigider dup(a|ă) deschidere',</code>
 
<code>'a se agita inainte de deschidere',</code>
 
<code>'Valori nutritionale medii',</code>
 
<code>'a se p[ăa]stra la',    # store in...</code>
 
<code>],</code>
 
<code>sv => [</code>
 
<code>'närings(?:deklaration|innehåll|värde)', '(?:bör )?förvar(?:ing|as?)',</code>
 
<code>'till(?:agning|redning)', 'produkten innehåller',</code>
 
<code>'serveringsförslag', 'produkterna bör',</code>
 
<code>'bruksanvisning', 'källsortering',</code>
 
<code>'anvisningar', 'skyddas mot',</code>
 
<code>'uppvärmning', 'återvinning',</code>
 
<code>'hållbarhet', 'producerad',</code>
 
<code>'upptining', 'o?öppnad',</code>
 
<code>'bevaras', 'kylvara',</code>
 
<code>'tappat',</code>
 
<code>],</code>
 
<code>vi => ['GI(Á|A) TR(Ị|I) DINH D(Ư|U)(Ỡ|O)NG (TRONG|TRÊN)',],</code>

Latest revision as of 11:53, 14 October 2023

The phrases used to find the end of an ingredients list (situation 14 Oct 2023). These can be found in ingredients.pm under %phrases_after_ingredients_list. This is used for Ingredients List Cutting.

bg => [

'да се съхранява (в закрити|на сухо)',    # store in ...

],

cs => ['doporučeny způsob přípravy', 'V(ý|y)(ž|z)ivov(e|é) (ú|u)daje ve 100 g',],

da => [

'(?:gennemsnitlig )?n(æ|ae)rings(?:indhold|værdi|deklaration)',

'tilberedning(?:svejledning)?',

'holdbarhed efter åbning',

'opbevar(?:ing|res)?',

'(?:for )?allergener',

'produceret af',

'beskyttes', 'nettovægt', 'åbnet',

],

de => [

'Ern(â|a|ä)hrungswerte',

'Mindestens altbar bis',

'Mindestens haltbar bis',

'davon ges(â|a|ä)tigte Fettsäuren',

'davon Zuckerarten',

'davon ges(â|a|ä)ttigte',

'Durchschnittlich enthalten 100 (ml|g)',

'Durchschnittliche N(â|a|ä)hrwerte',

'DURCHSCHNITTLICHE NÄHRWERTE',

'Durchschnittliche N(â|a|ä)hrwert(angaben|angabe)',

'Kakao: \d\d\s?% mindestens.',

'N(â|a|ä)hrwert(angaben|angabe|information|tabelle)',    #Nährwertangaben pro 100g

'N(â|a|ä)hrwerte je',

'Nâhrwerte',

'(Ungeöffnet )?mindestens',

'(k[uü]hl|bei Zimmertemperatur) und trocken lagern',

'Rinde nicht zum Verzehr geeignet.',

'Vor W(â|a|ä)rme und Feuchtigkeit sch(u|ü)tzen',

'Unge(ö|o)ffnet bei max.',

'Unter Schutzatmosphäre verpackt',

'verbrauchen bis',

'Vor Wärme geschützt (und trocken )?lagern',

'Vorbereitung Tipps',

'zu verbrauchen bis',

'100 (ml|g) enthalten durchschnittlich',

'\d\d\d\sg\s\w*\swerden aus\s\d\d\d\sg\s\w*\shergestellt'

,    # 100 g Salami werden aus 120 g Schweinefleisch hergestellt.

],

el => [

'ΔΙΑΘΡΕΠΤΙΚΗ ΕΠΙΣΗΜΑΝΣΗ',    #Nutritional labelling

'ΔΙΤΡΟΦΙΚΕΣ ΠΗΡΟΦΟΡΙΕΣ',

],

en => [

'adds a trivial amount',    # e.g. adds a trivial amount of added sugars per serving

'after opening',

#'Best before',

'nutrition(al)? (as sold|facts|information|typical|value[s]?)',

# "nutrition advice" seems to appear before ingredients rather than after.

# "nutritional" on its own would match the ingredient "nutritional yeast" etc.

'of whlch saturates',

'of which saturates',

'of which saturated fat',

'((\d+)(\s?)kJ\s+)?(\d+)(\s?)kcal',

'once opened[,]? (consume|keep|refrigerate|store|use)',

'(Storage( instructions)?[: ]+)?Store in a cool[,]? dry place',

'(dist(\.)?|distributed|sold)(\&|and|sold| )* (by|exclusively)',

#'See bottom of tin',

],

es => [

'valores nutricionales',

'modo de preparacion',

'informaci(o|ô)n nutricional',

'valor energ(e|é)tico',

'condiciones de conservaci(o|ó)n',

#'pa(i|í)s de transformaci(o|ó)n',

'cons[eé]rv(ar|ese) en( un)? lug[ae]r (fresco y seco|seco y fresco)',

'de los cuates az(u|ü)cares',

'de las cuales saturadas',

'protegido de la luz',

'conser(y|v)ar entre',

'una vez abierto',

'conservaci(o|ó)n:',

'consumi preferentemente antes del',

'consumir preferentemente antes del',

#Envasado por:

],

et => [

'parim enne',    # best before

],

fi => [

'100 g:aan tuotetta käytetään',

'Kypsennys',

'Makeisten sekoitussuhde voi vaihdella',

'Pakattu suojakaasuun',

'Parasta ennen',

'Viimeinen käyttöpäivä',

'(?:Keskimääräinen )?Ravinto(?:arvo|sisältö)',

'Sisältää aluspaperin',

'Suositellaan säilytettäväksi',

'Säily(?:tettävä|tetään|tys|y)',

'Tämä tuote on tehty ihmisille',

'Valmist(?:aja:|us)',

],

fr => [

'valeur(s?) (e|é)nerg(e|é)tique',

'valeur(s?) nutritives',

'valeur nutritive',

'valeurs mo(y|v)ennes',

'valeurs nutritionelles moyennes',

'valeur nutritionnelle mo(y|v)enne',

'valeur nutritionnelle',

'(va(l|t)eurs|informations|d(e|é)claration|analyse|rep(e|è)res) (nutritionnel)(s|le|les)?',

'(a|à) consommer de pr[ée]f[ée]rence',

'(a|à) consommer de',

'(a|à) cons.de préférence avant',

'(a|à) consommer (cuit|rapidement|dans|jusqu)',

'(a|à)[ ]?conserver (entre|dans|de|au|a|à)',

'Allergènes: voir les ingrédients en gras',

'Attention: les enfants en bas âge risquent de',

'apr(e|è)s (ouverture|achat)',

'apport de r(e|é)ference pour un adulte type',

'caractéristiques nu(t|f)ritionnelles',

'Conditionné sous vide',

'(conseil|conseils) de pr(e|é)paration',

'(conditions|conseils) de conservation',

'conseil d\'utilisation',

'conservation[ ]?:',

'Croûte en matière plastique non comestible',

'dans le compartiment (a|à) gla(c|ç)ons',

'de préférence avant le',

'dont sucres',

'dont acides (gras|ras) satur(e|é)s',

'Fabriquee à partir de fruits entiers',

'Fabriqué dans un atelier qui utilise',

'information nutritionnelle',

'((\d+)(\s?)kJ\s+)?(\d+)(\s?)kcal',

'la pr(e|é)sence de vide',    # La présence de vide au fond du pot est due au procédé de fabrication.

'Modes de pr(e|é)paration',

'Mode de pr(e|é)paration',

'moyennes pour 100(g|ml)',

'Naturellement riche en fibres',

'ne jamais recongeler un produit décongelé',

'nutritionnelles mo(y|v)ennes'

,    # in case of ocr issue on the first word "valeurs" v in case the y is cut halfway

'nutritionnelles pour 100(g|ml)',    #Arôme Valeum nutritionnelles pour 100g: Energie

'Nutrition pour 100 (g|ml)',

'pensez au tri',

'Peux contenir des morceaux de noyaux',

'pr(e|é)paration au four',

'Prépar(e|é)e? avec',

'(produit )?(a|à) protéger de ',    # humidité, chaleur, lumière etc.

'(produit )?conditionn(e|é) sous atmosph(e|è)re protectrice',

'N(o|ò)us vous conseillons',

'Non ouvert,',

'Sans conservateur',

'(Utilisation: |Préparation: )?Servir frais',

'Temps de Cuisson',

'tenir à l\'abri',

'Teneur en matière grasse',

'(Chocolat: )?teneur en cacao',

'Teneur totale en sucres',

# Belgian products often mix languages and thus can have ending phrases in dutch

'Gemiddelde voedingswaarde',

#'Pour votre santé',

#'La certification Fairtrade assure',

#Préparation:

#'ne pas laisser les enfants' # Ne pas laisser les enfants de moins de 36 mols sans surveillance avec le bouchon dévissable. BT Daonan ar

#`etten/Matières grasses`, # (Vetten mais j'avais Netten/Matières grasses)

#'dont sucres',

#'dontSUcres',

#'waarvan suikers/

#`verzadigde vetzuren/ acides gras saturés`,

#`Conditionné par`,

],

hr => [

'bez konzervans',    # without preservatives

'Čuvati na (hladnom|sobnoj temperaturi|suhom|temperaturi)',    # store in...

'Čuvati zatvoreno na',

'Čuvati pri sobnoj temperaturi',

'izvor dijetalnih vlakana',    # source of proteins

'najbolje upotrijebiti do',    # best before

'nakon otvaranja',    # after opening

'pakirano u (kontroliranoj|zaštitnoj) atmosferi',    # packed in a ... atmosphere

'proizvod je termički obrađen-pasteriziran',    # pasteurized

'proizvođač',    # producer

'prosječn(a|e) (hranjiva|hranjive|nutritivne) (vrijednost|vrijednosti)',    # Average nutritional value

'protresti prije otvaranja',    # shake before opening

'upotrijebiti do datuma',    # valid until

'upozorenje',    # warning

'uputa',    # instructions

'uvjeti čuvanja',    # storage conditions

'uvoznik za',    # importer

'vakuumirana',    # Vacuumed

'vrijeme kuhanja',    # Cooking time

'zaštićena oznaka zemljopisnog podrijetla',    # ZOI/PDO

'zbog (mutan|prisutnosti)',    # Due to ...

'zemlja (porijekla|podrijetla|porekla)',    # country of origin

],

hu => [

'Atlagos tápérték 100g termékben',

'((száraz|hűvös|(közvetlen )?napfénytől védett)[, ]*)+helyen tárolandó',    # store in cool/dry/etc

],

is => ['n(æ|ae)ringargildi', 'geymi(st|ð) á', 'eftir opnum', 'aðferð',],

it => [

'valori nutrizionali',

'consigli per la preparazione',

'di cui zuccheri',

'Valori nutritivi',

'Conservare in luogo fresco e asciutto',

'MODALITA D\'USO',

'MODALITA DI CONSERVAZIONE',

'Preparazione:',

'Una volta aperto',    # once opened...

'Da consumarsi preferibilmente entro',    # best before

],

ja => [

'栄養価',    # nutritional value

'内容量',    # weight

'賞味期限',    # best before

],

lt => [

'geriausias iki',    # best before

],

nb => ['netto(?:innhold|vekt)', 'oppbevar(?:ing|es)', 'næringsinnhold', 'kjølevare',],

nl => [

'Beter Leven keurmerk 1 ster.',

'Beter Leven keurmerk 3 sterren',

'Bewaren bij kamertemperatuur',

'Cacao: ten minste ',

'Droog bewaren',

'E = door EU goedgekeurde hulpstof',

'E door EU goedgekeurde hulpstoffen',

'"E"-nummers zijn door de EU goedgekeurde hulpstoffen',

'gemiddelde voedingswaarden',

'Gemiddeldevoedingswaardel',

'gemiddelde voedingswaarde per 100 g',

'Na openen beperkt houdbaar',

'Ongeopend, ten minste houdbaar tot:',

'o.a.',

'ten minste',

'ten minste houdbaar tot',

'Van nature rijk aan vezels',

'Verpakt onder beschermende atmosfeer',

'voedingswaarden',

'voedingswaarde',

'Voor allergenen: zie ingrediëntenlijst, in vet gemarkeerd',

'voorbereidingstips',

#'waarvan suikers',

'Witte chocolade: ten minste',

],

pl => [

'przechowywać w chlodnym i ciemnym miejscu',    #keep in a dry and dark place

'n(a|o)jlepiej spożyć przed',    #Best before

'Przechowywanie',

'pakowan(o|y|e) w atmosferze ochronnej',    # Packaged in protective environment

],

pt => [

'conservar em local (seco e )?fresco',

'conservar em lugar fresco',

'dos quais a(ç|c)(u|ü)ares',

'dos quais a(ç|c)(u|ü)cares',

'informa(ç|c)(a|ã)o nutricional',

'modo de prepara(ç|c)(a|ã)o',

'a consumir de prefer(e|ê)ncia antes do',

'consumir de prefer(e|ê)ncia antes do',

],

ro => [

'declaratie nutritional(a|ă)',

'a si pastra la frigider dup(a|ă) deschidere',

'a se agita inainte de deschidere',

'Valori nutritionale medii',

'a se p[ăa]stra la',    # store in...

],

sv => [

'närings(?:deklaration|innehåll|värde)', '(?:bör )?förvar(?:ing|as?)',

'till(?:agning|redning)', 'produkten innehåller',

'serveringsförslag', 'produkterna bör',

'bruksanvisning', 'källsortering',

'anvisningar', 'skyddas mot',

'uppvärmning', 'återvinning',

'hållbarhet', 'producerad',

'upptining', 'o?öppnad',

'bevaras', 'kylvara',

'tappat',

],

vi => ['GI(Á|A) TR(Ị|I) DINH D(Ư|U)(Ỡ|O)NG (TRONG|TRÊN)',],