La traduction collaborative des MOOC

Transcription

La traduction collaborative des MOOC
– Lingua et Machina –
L’écrit multilingue dans l’entreprise
Libellex, outil de traduction collaborative pour les MOOC
Réduire massivement le coût de traduction professionnelle des sous-titres ;
Aider les volontaires à produire des traductions de qualité, avant révision par des traducteurs professionnels.
Présentation générale de Libellex
Voir la fiche jointe « Libellex fiche synthétique ».
Structure des fichiers
Les fichiers de sous-titres sont au format SRT, en voici un exemple :
1
00:00:00,525 --> 00:00:08,461
[BLANK_AUDIO]
2
00:00:08,461 --> 00:00:11,053
Welcome to Understanding Europe, one of
the first MOOCs
3
00:00:11,053 --> 00:00:14,239
entirely devoted to the European
experience of life and government.
Nous constatons quatre caractéristiques :




Les séquences d’apparition sont dotées d’un numéro d’ordre ;
Il y a des séquences sans affichage de sous-titre mais toujours avec un label, ex : [BLANK_AUDIO] ;
Les phrases peuvent être sectionnées en deux ou plusieurs séquences (ci-dessus séquences 2 et 3) ;
Le texte d’une séquence peut être disposé sur une ou plusieurs lignes.
Constitution des mémoires et entraînement de la traduction automatique
Dans le monde de la traduction, l’unité linguistique de base est la phrase (parfois le paragraphe mais nous ne
prendrons pas cette approche ici.) Libellex transforme donc le contenu des fichiers SRT en correspondance de
phrases :
[BLANK_AUDIO]
[BLANK_AUDIO]
Bienvenue sur "Understanding Europe" (Comprendre l'Europe),
l'un des premiers MOOCs entièrement consacré à l'expérience
européenne de vie et de gouvernement.
Welcome to Understanding Europe, one of the first MOOCs
entirely devoted to the European experience of life and
government.
Il n’est pas nécessaire de conserver les numéros d’ordre, les césures de séquence et les césures de ligne pour
la constitution de la mémoire. Les correspondances de phrases sont constituées automatiquement par la
fonction « Ajouter des documents au référentiel » à l’aide de l’interface suivante :
Une fois alimentée, la mémoire sert à entraîner le traducteur automatique spécialisé dans le domaine du MOOC.
Lingua et Machina, L’écrit multilingue dans l’entreprise
Siège et R&D : Laval Mayenne Technopole, 6, rue Léonard de Vinci, BP 0102, 53001 Laval Cedex
Administration et commercial : c/o Inria, Domaine de Voluceau, Rocquencourt, BP 105, 78153 Le Chesnay Cedex
[email protected] – www.lingua-et-machina.com
SAS au capital de 708 870 € – SIRET LAVAL 443 074 729 00023 – TVA intracommunautaire : FR 25 443 074 729
Lingua et Machina
Lancement d’une traduction
La traduction d’un nouveau fichier est lancée dans l’interface « Faire traduire un document » :
Ici les repères temporels, les numéros d’ordre, les césures de séquence et les césures de ligne sont conservés.
Réalisation de la traduction
Le traducteur a accès aux tâches de traduction qui lui sont affectées, par l’interface « Travaux de traduction » :
En cliquant sur le nom d’un document il ouvre la fenêtre de travail du traducteur et produit sa traduction (colonne
du milieu) à partir des suggestions (colonnes de droite) qui lui sont fournies par la mémoire des traductions
précédentes ou par le traducteur automatique spécialisé.
Le positionnement des césures est proposé par le système, le traducteur décide en dernier recours de leur
positionnement optimal. Le texte traduit est ensuite exporté dans son format d’origine, avec les repères
temporels, les numéros d’ordre et les césures. Une fois validé, il alimente la mémoire, pour un nouvel
entraînement du traducteur automatique. Ce dernier est donc amélioré au fil des traductions.
Interface « bureautique » de traduction automatique
L’alimentation de la mémoire et l’entraînement du traducteur automatique permet également l’utilisation de
l’interface « Traduction automatique », accessible à tout utilisateur de l’entreprise et traducteur occasionnel, pour
des tâches courantes. Voici un exemple d’utilisation :
La machine aide l’Homme mais ne le remplace pas
Lingua et Machina recommande à ses clients et partenaires de ne jamais publier un texte en langue étrangère sans vérification finale par un traducteur professionnel.

Documents pareils