La traduction collaborative des MOOC
Transcription
La traduction collaborative des MOOC
– Lingua et Machina – L’écrit multilingue dans l’entreprise Libellex, outil de traduction collaborative pour les MOOC Réduire massivement le coût de traduction professionnelle des sous-titres ; Aider les volontaires à produire des traductions de qualité, avant révision par des traducteurs professionnels. Présentation générale de Libellex Voir la fiche jointe « Libellex fiche synthétique ». Structure des fichiers Les fichiers de sous-titres sont au format SRT, en voici un exemple : 1 00:00:00,525 --> 00:00:08,461 [BLANK_AUDIO] 2 00:00:08,461 --> 00:00:11,053 Welcome to Understanding Europe, one of the first MOOCs 3 00:00:11,053 --> 00:00:14,239 entirely devoted to the European experience of life and government. Nous constatons quatre caractéristiques : Les séquences d’apparition sont dotées d’un numéro d’ordre ; Il y a des séquences sans affichage de sous-titre mais toujours avec un label, ex : [BLANK_AUDIO] ; Les phrases peuvent être sectionnées en deux ou plusieurs séquences (ci-dessus séquences 2 et 3) ; Le texte d’une séquence peut être disposé sur une ou plusieurs lignes. Constitution des mémoires et entraînement de la traduction automatique Dans le monde de la traduction, l’unité linguistique de base est la phrase (parfois le paragraphe mais nous ne prendrons pas cette approche ici.) Libellex transforme donc le contenu des fichiers SRT en correspondance de phrases : [BLANK_AUDIO] [BLANK_AUDIO] Bienvenue sur "Understanding Europe" (Comprendre l'Europe), l'un des premiers MOOCs entièrement consacré à l'expérience européenne de vie et de gouvernement. Welcome to Understanding Europe, one of the first MOOCs entirely devoted to the European experience of life and government. Il n’est pas nécessaire de conserver les numéros d’ordre, les césures de séquence et les césures de ligne pour la constitution de la mémoire. Les correspondances de phrases sont constituées automatiquement par la fonction « Ajouter des documents au référentiel » à l’aide de l’interface suivante : Une fois alimentée, la mémoire sert à entraîner le traducteur automatique spécialisé dans le domaine du MOOC. Lingua et Machina, L’écrit multilingue dans l’entreprise Siège et R&D : Laval Mayenne Technopole, 6, rue Léonard de Vinci, BP 0102, 53001 Laval Cedex Administration et commercial : c/o Inria, Domaine de Voluceau, Rocquencourt, BP 105, 78153 Le Chesnay Cedex [email protected] – www.lingua-et-machina.com SAS au capital de 708 870 € – SIRET LAVAL 443 074 729 00023 – TVA intracommunautaire : FR 25 443 074 729 Lingua et Machina Lancement d’une traduction La traduction d’un nouveau fichier est lancée dans l’interface « Faire traduire un document » : Ici les repères temporels, les numéros d’ordre, les césures de séquence et les césures de ligne sont conservés. Réalisation de la traduction Le traducteur a accès aux tâches de traduction qui lui sont affectées, par l’interface « Travaux de traduction » : En cliquant sur le nom d’un document il ouvre la fenêtre de travail du traducteur et produit sa traduction (colonne du milieu) à partir des suggestions (colonnes de droite) qui lui sont fournies par la mémoire des traductions précédentes ou par le traducteur automatique spécialisé. Le positionnement des césures est proposé par le système, le traducteur décide en dernier recours de leur positionnement optimal. Le texte traduit est ensuite exporté dans son format d’origine, avec les repères temporels, les numéros d’ordre et les césures. Une fois validé, il alimente la mémoire, pour un nouvel entraînement du traducteur automatique. Ce dernier est donc amélioré au fil des traductions. Interface « bureautique » de traduction automatique L’alimentation de la mémoire et l’entraînement du traducteur automatique permet également l’utilisation de l’interface « Traduction automatique », accessible à tout utilisateur de l’entreprise et traducteur occasionnel, pour des tâches courantes. Voici un exemple d’utilisation : La machine aide l’Homme mais ne le remplace pas Lingua et Machina recommande à ses clients et partenaires de ne jamais publier un texte en langue étrangère sans vérification finale par un traducteur professionnel.