La traduction automatique sur mesures

Transcription

La traduction automatique sur mesures
– Lingua et Machina –
L’écrit multilingue dans l’entreprise
La traduction automatique sur mesures
Fiche produit Libellex
Présentation
Notre plateforme Libellex met en œuvre une traduction automatique statistique spécialisée supervisée :




automatique car la traduction ne requiert aucune intervention humaine ;
statistique car elle s’appuie sur un entraînement à partir d’un corpus de textes déjà traduits ;
spécialisée car un corpus d’entraînement dédié est utilisé pour chaque cas d’usage (automobile,
cosmétique, cuisine, e-commerce, finance, informatique, nucléaire, etc.) ;
supervisée car chaque corpus est modifié et augmenté au fil du temps par nos linguistes, de façon à
faire progresser la qualité des traductions.
C’est un processus auto-apprenant, le coût décroît au fur et à mesure que s’accumulent les traductions.
La borne haute de coût se situe entre 4 et 7 centimes par mot quand la traduction automatique doit être postéditée pour un résultat de qualité éditoriale, par exemple pour une note interne ou un communiqué de presse.
(Le coût moyen pour une traduction humaine traditionnelle en agence est de l’ordre de 15 centimes par mot.)
La borne basse de coût est de l’ordre de 0,5 centime par mot quand la qualité de la traduction automatique brute
est jugée suffisante, par exemple pour des échanges internes en courriel ou tchat en réseau social d’entreprise.
0,20 €
Agence en traduction humaine
90%
Traduction humaine
0,12 €
0,08 €
Post-édition de traduction automatique Libellex
0,04 €
Qualité de la traduction
Coût moyen du mot traduit
0,16 €
100%
Libellex en traduction automatique
80%
70%
60%
Internet en traduction automatique
Traduction automatique
0,00 €
50%
0
100
200
300
400
Nombre de pages traduites
500
600
0
100
200
300
400
500
600
Nombre de pages traduites
Chaque intervention de post-édition a pour effet secondaire d’améliorer le corpus d’entraînement et donc la
qualité de la traduction automatique ultérieure.
Un travail sur de très grands volumes présente ainsi deux avantages : d’une part la qualité de traduction
automatique augmente, d’autre part le coût de la post-édition baisse.
Bénéfices
Les avantages utilisateur sont les suivants :




une réponse immédiate ;
un coût contrôlé en fonction des objectifs et fortement réduit pour les grands volumes ;
une traduction plus précise que ne le fait une traduction automatique générique ;
une totale confidentialité, que n’apportent pas les traducteurs gratuits en ligne sur Internet.
Lingua et Machina, L’écrit multilingue dans l’entreprise
Siège et R&D : Laval Mayenne Technopole, 6, rue Léonard de Vinci, BP 0102, 53001 Laval Cedex
Administration et commercial : c/o Inria, Domaine de Voluceau, Rocquencourt, BP 105, 78153 Le Chesnay Cedex
[email protected] – www.lingua-et-machina.com
SAS au capital de 708 870 € – SIRET LAVAL 443 074 729 00023 – TVA intracommunautaire : FR 25 443 074 729
Lingua et Machina
Ce mode de traduction s’applique à quatre cas d’usages :




les très grands stocks de textes dont la traduction humaine ne serait économiquement pas
envisageable, notamment les bases de données ou les référentiels de connaissances ;
les réseaux sociaux d’entreprise (RSE) où les volumes échangés sont importants et la durée de vie
de l’information est courte ;
l’aide aux collaborateurs pour la lecture ou la rédaction d’un document en langue étrangère ;
la post-édition par traducteur professionnel quand les documents à traduire nécessitent une qualité
irréprochable et que les volumes traités justifient un effort concerté pour réduire les coûts ou garantir
l’homogénéité terminologique.
Mode de fonctionnement
Nous mettons en place un moteur de traduction pour chaque application et chaque sens de langue.
Chaque moteur de traduction est entraîné par des données spécifiques qui peuvent être des dictionnaires
bilingues spécialisés, des textes déjà traduits, des mémoires de traduction issues des agences de traduction du
client. Quand ces données, que nous appelons des ressources linguistiques, ne sont pas disponibles chez le
client, nous lançons une campagne d’acquisition de ces ressources linguistiques sur Internet. Cela prend de
l’ordre de la semaine. Voici un exemple de données acquises à partir d’un rapport annuel et de sa traduction :
Texte source
Texte cible
net operating expenses
charges d’exploitation nettes
net operating income
produit net bancaire
net operating income before loan impairment charges and
other credit risk provisions
produit net bancaire avant dépréciation de créances et autres
provisions pour risques de crédit
net positions
positions nettes
net profit of discontinued operations
résultat net d’impôts des activités cédées
Les traductions peuvent alors démarrer. Leur qualité est variable en fonction des ressources linguistiques
accumulées. Nos linguistes améliorent cette qualité avec le temps en sélectionnant une partie du matériel traduit
et en le corrigeant pour ajouter ces nouvelles traductions aux ressources linguistiques, ce qui a pour effet
d’améliorer la qualité des traductions automatiques suivantes.
À terme, la qualité de traduction est satisfaisante pour une utilisation informelle interne
ou pour une post-édition par un traducteur professionnel en vue d’une diffusion externe.
Voici trois exemples après constitution de ressources linguistiques adéquates, comparés avec les performances
de deux moteurs de traduction sur Internet :
Texte source
Moteur 1
Moteur 2
Libellex
Pelez les navets et coupez
les carottes en dés.
Peel the turnips and carrots cut
into cubes.
Peel the turnips and cut [manque :
the] carrots into cubes.
Peel the turnips and cut the
carrots into cubes.
list and location of
components of the fuel
vapour recirculation circuit
liste et la localisation des
composants du circuit de
recirculation des vapeurs
d’essence
circuit de recirculation de vapeur
de liste et l'emplacement des
composants du combustible
[manque : essence]
liste et localisation des
éléments du circuit de
recyclage des vapeurs
d'essence
Brume de soin
Mist care [manque : skin]
Haze of care [manque : skin]
Skin care mist
Langues traitées
Toutes les langues peuvent être traitées. La mise en œuvre est plus rapide quand un grand corpus est
disponible pour le couple de langues considéré et dans le domaine de spécialité : il est facile de trouver des
documents juridiques traduits de l’anglais au français, il est plus difficile de trouver des notices pharmaceutiques
traduites du français vers le russe ou le coréen. La capacité du client à récupérer des traductions qu’il aura
effectuées ou fait effectuer par le passé joue un rôle important. Nos linguistes et terminologues ont les
compétences pour accumuler les ressources linguistiques complémentaires.
Confidentialité
Les échanges en mode SaaS et API avec le serveur de traduction Libellex se font en mode sécurisé et restent
confidentiels. Nous garantissons la localisation de nos serveurs en France. La confidentialité est garantie a
fortiori quand le serveur est installé chez le client en mode licence.
La machine aide l’Homme mais ne le remplace pas
Lingua et Machina recommande à ses clients et partenaires de ne jamais publier un texte en langue étrangère sans vérification finale par un traducteur professionnel.