La traduction automatique sur mesures
Transcription
La traduction automatique sur mesures
– Lingua et Machina – L’écrit multilingue dans l’entreprise La traduction automatique sur mesures Fiche produit Libellex Présentation Notre plateforme Libellex met en œuvre une traduction automatique statistique spécialisée supervisée : automatique car la traduction ne requiert aucune intervention humaine ; statistique car elle s’appuie sur un entraînement à partir d’un corpus de textes déjà traduits ; spécialisée car un corpus d’entraînement dédié est utilisé pour chaque cas d’usage (automobile, cosmétique, cuisine, e-commerce, finance, informatique, nucléaire, etc.) ; supervisée car chaque corpus est modifié et augmenté au fil du temps par nos linguistes, de façon à faire progresser la qualité des traductions. C’est un processus auto-apprenant, le coût décroît au fur et à mesure que s’accumulent les traductions. La borne haute de coût se situe entre 4 et 7 centimes par mot quand la traduction automatique doit être postéditée pour un résultat de qualité éditoriale, par exemple pour une note interne ou un communiqué de presse. (Le coût moyen pour une traduction humaine traditionnelle en agence est de l’ordre de 15 centimes par mot.) La borne basse de coût est de l’ordre de 0,5 centime par mot quand la qualité de la traduction automatique brute est jugée suffisante, par exemple pour des échanges internes en courriel ou tchat en réseau social d’entreprise. 0,20 € Agence en traduction humaine 90% Traduction humaine 0,12 € 0,08 € Post-édition de traduction automatique Libellex 0,04 € Qualité de la traduction Coût moyen du mot traduit 0,16 € 100% Libellex en traduction automatique 80% 70% 60% Internet en traduction automatique Traduction automatique 0,00 € 50% 0 100 200 300 400 Nombre de pages traduites 500 600 0 100 200 300 400 500 600 Nombre de pages traduites Chaque intervention de post-édition a pour effet secondaire d’améliorer le corpus d’entraînement et donc la qualité de la traduction automatique ultérieure. Un travail sur de très grands volumes présente ainsi deux avantages : d’une part la qualité de traduction automatique augmente, d’autre part le coût de la post-édition baisse. Bénéfices Les avantages utilisateur sont les suivants : une réponse immédiate ; un coût contrôlé en fonction des objectifs et fortement réduit pour les grands volumes ; une traduction plus précise que ne le fait une traduction automatique générique ; une totale confidentialité, que n’apportent pas les traducteurs gratuits en ligne sur Internet. Lingua et Machina, L’écrit multilingue dans l’entreprise Siège et R&D : Laval Mayenne Technopole, 6, rue Léonard de Vinci, BP 0102, 53001 Laval Cedex Administration et commercial : c/o Inria, Domaine de Voluceau, Rocquencourt, BP 105, 78153 Le Chesnay Cedex [email protected] – www.lingua-et-machina.com SAS au capital de 708 870 € – SIRET LAVAL 443 074 729 00023 – TVA intracommunautaire : FR 25 443 074 729 Lingua et Machina Ce mode de traduction s’applique à quatre cas d’usages : les très grands stocks de textes dont la traduction humaine ne serait économiquement pas envisageable, notamment les bases de données ou les référentiels de connaissances ; les réseaux sociaux d’entreprise (RSE) où les volumes échangés sont importants et la durée de vie de l’information est courte ; l’aide aux collaborateurs pour la lecture ou la rédaction d’un document en langue étrangère ; la post-édition par traducteur professionnel quand les documents à traduire nécessitent une qualité irréprochable et que les volumes traités justifient un effort concerté pour réduire les coûts ou garantir l’homogénéité terminologique. Mode de fonctionnement Nous mettons en place un moteur de traduction pour chaque application et chaque sens de langue. Chaque moteur de traduction est entraîné par des données spécifiques qui peuvent être des dictionnaires bilingues spécialisés, des textes déjà traduits, des mémoires de traduction issues des agences de traduction du client. Quand ces données, que nous appelons des ressources linguistiques, ne sont pas disponibles chez le client, nous lançons une campagne d’acquisition de ces ressources linguistiques sur Internet. Cela prend de l’ordre de la semaine. Voici un exemple de données acquises à partir d’un rapport annuel et de sa traduction : Texte source Texte cible net operating expenses charges d’exploitation nettes net operating income produit net bancaire net operating income before loan impairment charges and other credit risk provisions produit net bancaire avant dépréciation de créances et autres provisions pour risques de crédit net positions positions nettes net profit of discontinued operations résultat net d’impôts des activités cédées Les traductions peuvent alors démarrer. Leur qualité est variable en fonction des ressources linguistiques accumulées. Nos linguistes améliorent cette qualité avec le temps en sélectionnant une partie du matériel traduit et en le corrigeant pour ajouter ces nouvelles traductions aux ressources linguistiques, ce qui a pour effet d’améliorer la qualité des traductions automatiques suivantes. À terme, la qualité de traduction est satisfaisante pour une utilisation informelle interne ou pour une post-édition par un traducteur professionnel en vue d’une diffusion externe. Voici trois exemples après constitution de ressources linguistiques adéquates, comparés avec les performances de deux moteurs de traduction sur Internet : Texte source Moteur 1 Moteur 2 Libellex Pelez les navets et coupez les carottes en dés. Peel the turnips and carrots cut into cubes. Peel the turnips and cut [manque : the] carrots into cubes. Peel the turnips and cut the carrots into cubes. list and location of components of the fuel vapour recirculation circuit liste et la localisation des composants du circuit de recirculation des vapeurs d’essence circuit de recirculation de vapeur de liste et l'emplacement des composants du combustible [manque : essence] liste et localisation des éléments du circuit de recyclage des vapeurs d'essence Brume de soin Mist care [manque : skin] Haze of care [manque : skin] Skin care mist Langues traitées Toutes les langues peuvent être traitées. La mise en œuvre est plus rapide quand un grand corpus est disponible pour le couple de langues considéré et dans le domaine de spécialité : il est facile de trouver des documents juridiques traduits de l’anglais au français, il est plus difficile de trouver des notices pharmaceutiques traduites du français vers le russe ou le coréen. La capacité du client à récupérer des traductions qu’il aura effectuées ou fait effectuer par le passé joue un rôle important. Nos linguistes et terminologues ont les compétences pour accumuler les ressources linguistiques complémentaires. Confidentialité Les échanges en mode SaaS et API avec le serveur de traduction Libellex se font en mode sécurisé et restent confidentiels. Nous garantissons la localisation de nos serveurs en France. La confidentialité est garantie a fortiori quand le serveur est installé chez le client en mode licence. La machine aide l’Homme mais ne le remplace pas Lingua et Machina recommande à ses clients et partenaires de ne jamais publier un texte en langue étrangère sans vérification finale par un traducteur professionnel.