Glossaire des diffrents types d`outils en traduction

Transcription

Glossaire des diffrents types d`outils en traduction
Glossaire d’outils de traductique
Type d’outil
Description
Équivalent
anglais
Aligneurs de bitextes
Les aligneurs de bitextes sont utilisés afin de créer des bitextes (i.e. fragmenter les textes
originaux (sources) et leurs traductions (textes cibles) en de plus petits segments et puis
faire correspondre les segments correspondants dans les textes source et cible). Ces
outils fonctionnent habituellement au niveau de la phrase et font correspondre les
phrases selon leurs longueurs relatives, leur endroit dans le texte et parfois leur contenu.
Puisque ces critères formels et la nature des textes ne permettent pas toujours un
alignement parfait, la plupart des outils offrent aussi d’autres fonctions qui peuvent aider
les utilisateurs à corriger l’alignement de façon manuelle. Les bitextes peuvent être
utilisés afin d’aider à analyser les traductions et techniques de traduction; on peut y faire
une recherche en utilisant les concordanciers bilingues. Ils sont aussi un point de départ
pour la création de mémoires de traduction (cf. l’entrée pour systèmes de gestion de
mémoires de traduction). Quelques exemples d’aligneurs de bitextes sont : la fonction de
création de bitexte de LogiTerm, l’Aligneur TextBase dans MultiTrans, l’aligneur dans
Fusion Translate et WinAlign de SDL Trados. Quelques concordanciers bilingues,
comme ParaConc, contiennent des fonctions d’alignement.
Bitext aligners
1
Autres outils Office ;
autres outils de
bureautique
La suite Microsoft Office offre plusieurs logiciels pour assister avec des tâches comme la Other Office tools
conception, l’édition et la gestion de présentations (PowerPoint), de feuilles de calcul
(Excel) et de bases de données (Access). Les traducteurs, rédacteurs et réviseurs peuvent
utiliser ces outils pour accéder à des documents pour la traduction et pour stocker et
gérer des données terminologiques, des informations sur les clients et autres données.
Les professeurs peuvent être intéressés à utiliser de tels outils pour préparer leurs cours
ou leurs présentations de conférence, pour stocker des données de recherche ou pour
calculer des notes.
Banques de données
terminologiques
Term banks
Les banques de données terminologiques sont des ressources qui vous assistent dans la
recherche de termes utilisés dans des langues spécialisées et sont particulièrement utiles
par exemple pour des traductions spécialisées ou techniques et la rédaction technique.
Habituellement bilingues ou plurilingues, les banques de données terminologiques sont
des collections de fiches terminologiques, i.e. des entrées structurées dans des bases de
données qui stockent des données à propos des concepts qui sont importants dans des
champs spécialisés (e.g. termes, leurs équivalents dans d’autres langues, définitions,
contextes, sources et observations). Cette structure basée sur des concepts et leur
orientation spécialisée différentient les banques de données terminologiques de la
plupart des dictionnaires électroniques, lesquels sont généralement organisés par élément
lexical. Deux des banques de données terminologiques les plus connues sont
TERMIUM® et le Grand dictionnaire terminologique (GDT). Une banque de données
terminologiques européenne connue est IATE (Inter-Active Terminology for Europe),
anciennement connue sous le nom Eurodicautom.
2
Concordanciers
bilingues
Bilingual
Les concordanciers bilingues permettent à l’utilisateur de faire une recherche pour les
concordancers
occurrences d’une chaîne de caractères (i.e. séquence de caractères) dans des bitextes
(i.e. textes originaux et leurs traductions qui ont été alignés et qui sont affichés en côte-àcôte ou un au-dessus de l’autre.) Habituellement, ils permettent aux utilisateurs de faire
une recherche dans une ou deux langues et ils offrent des fonctions de recherche
avancées (e.g. opérateurs booléens, recherches approximatives). Ces outils peuvent aider
les utilisateurs à trouver, étudier et comparer diverses occurrences d’une chaîne de
caractères et à identifier et évaluer les traductions potentielles d’unités lexicales,
d’expressions, de phrases ou même de structures. Quelques exemples de concordanciers
bilingues sont : BeeText Find, ParaConc, la fonction de recherche de bitextes de
LogiTerm et TransSearch.
3
Concordanciers
unilingues
Monolingual
Les concordanciers unilingues sont des outils informatiques qui aident à l’analyse de
concordancers
corpus. Ils sont principalement utilisés pour trouver et afficher les occurrences de
chaînes de caractères (i.e. séquences de caractères) dans un corpus. Ils offrent
habituellement des fonctions de recherche avancées (e.g. opérateurs booléens, recherches
approximatives).Certains de ces outils montrent les occurrences repérées dans un format
appelé en anglais key word in context ou KWIC (littéralement, mot-clé en contexte),
lequel affiche chaque occurrence sur une ligne séparée avec la chaîne de caractères qui a
été recherchée par l’utilisateur affichée au centre. Cette présentation est destinée à
rendre la comparaison de multiples occurrences plus facile et plus efficace, puisque la
plupart des outils permettent aussi de trier les occurrences selon différents critères.
L’analyse des occurrences de chaînes de caractères peut aider les utilisateurs à évaluer la
façon dont les mots et les phrases sont utilisés et combinés. Plusieurs concordanciers
offrent aussi des fonctions additionnelles d’analyse de corpus (e.g. des fonctions qui
peuvent créer des listes de toutes les chaînes de caractères présentes dans un corpus ainsi
que leurs fréquences, pour aider à identifier les éléments particulièrement pertinents dans
une collection de textes). Quelques exemples de concordanciers unilingues disponibles
au Centre d’écriture sont : WordSmith Tools, et la fonction de recherche plein texte de
LogiTerm. Quelques autres concordanciers peuvent être utilisés et/ou téléchargés en
ligne gratuitement, entre autres TextStat, WebConc, WebCorp, AntConc et Corsis.
4
Corpus
Les corpus sont des collections de textes en format électronique qui ont été construites
afin d’assister les utilisateurs dans leur étude de la langue et de son usage. Ils sont
généralement conçus pour fournir un échantillon représentatif qui donne une vue
d’ensemble d’un certain type de langage (e.g. dans un registre, une région, un champ ou
un type de texte particulier). Ces collections de textes peuvent aider les utilisateurs à
déterminer comment les unités lexicales sont couramment utilisées ou combinées.
Généralement, on fait une recherche dans un corpus en utilisant soit un concordancier
unilingue (e.g. dans le cas d’un corpus unilingue ou comparable), soit un concordancier
bilingue (dans le cas d’un corpus parallèle, aussi appelé corpus de bitextes). Quelques
corpus bien connus qui peuvent également être consultés en ligne sont : British National
Corpus et Frantext.
Corpora
Dépouilleurs
terminologiques;
extracteurs de termes
Les dépouilleurs terminologiques sont des outils informatiques qui analysent des textes
dans un format électronique et qui identifient les candidats-termes (i.e. unités lexicales
qui semblent être des termes dans un domaine spécifique). Les dépouilleurs
terminologiques utilisent une variété de méthodes pour trouver les candidats-termes,
mais elles fonctionnent toutes selon des critères formels, comme l’analyse de la
fréquence de chaînes de caractères ou les structures de combinaisons de mots. Notez que
ce logiciel automatisé ne produit pas de résultats parfaits. Certains termes contenus dans
les textes peuvent passer inaperçus, alors que certains candidats qui ne sont pas de vrais
termes sont proposés en tant que termes. Les résultats d’un dépouilleur terminologique
doivent donc être vérifiés par un langagier. Quelques exemples de dépouilleurs
terminologiques incluent SDL Trados MultiTerm Extract et TermoStat. Des
environnements de traduction comme MultiTrans, LogiTerm et Fusion Translate offrent
aussi des fonctions d’extraction.
Term extractors
5
Dictionnaires
électroniques
Les dictionnaires électroniques sont des alternatives de plus en plus populaires au
traditionnel dictionnaire « papier ». Ces ressources, qui peuvent être unilingues,
bilingues ou plurilingues, peuvent être disponibles sur CD-ROM ou en ligne. Par rapport
aux dictionnaires papier, elles offrent un accès au contenu des entrées du dictionnaire
souvent plus rapide, plus facile et plus flexible afin d’aider les traducteurs et autres
utilisateurs à trouver l’information dont ils ont besoin. Il est important de ne pas
confondre ces dictionnaires avec les banques de données terminologiques, lesquelles,
quoiqu’aussi habituellement disponibles en ligne, ont une organisation et des buts
différents. Il est aussi important de noter que les dictionnaires électroniques ne sont pas
tous de la même qualité. Il est particulièrement important d’être vigilant lorsque l’on
utilise des dictionnaires électroniques gratuits. Les dictionnaires Oxford English
Dictionary et Dictionnaire de l’Académie française (plusieurs éditions) sont des
dictionnaires très bien connus qui peuvent être consultés en ligne (ce dernier peut être
consulté sur le site Centre national de ressources textuelles et lexicales). D’autres
dictionnaires que vous trouverez peut-être utiles sont : le Longman Dictionary of
Contemporary English Online, le Random House Webster’s Unabridged, le OxfordHachette et le Nouveau Petit Robert (tous installés au Centre d’écriture).
Electronic
dictionaries
6
Environnements de
traduction
Dans la CERTT, nous utilisons le terme environnement de traduction (en anglais
translation environment ou parfois TenT pour translation environment tool) lorsque l’on
fait référence aux systèmes qui comprennent plusieurs outils différents destinés aux
traducteurs dans une seule et même interface intégrée. Ces environnements de traduction
sont habituellement centrés autour des systèmes gestion de mémoires de traduction ou
des outils semblables, mais incluent généralement les fonctions suivantes : aligneurs de
bitextes, systèmes de gestion de données terminologiques, dépouilleurs terminologiques,
traducteurs de vocabulaire et concordanciers bilingues ou unilingues. Certains
permettent également l’intégration de la traduction automatique. Les environnements de
traduction installés au Centre d’écriture sont : SDL Trados, Fusion Translate, LogiTerm,
MultiTrans, WordFast et Omega T.
Translation
environments
7
Gestionnaires de
données
terminologiques ;
systèmes de gestion
de données
terminologiques
Les systèmes de gestion de données terminologiques sont des outils qui fonctionnent de
Terminology
façon similaire aux systèmes de gestion de bases de données génériques, mais qui sont
management
systems
spécifiquement conçus pour assister les traducteurs et autres professionnels du langage
dans le stockage et la gestion de données terminologiques (e.g. termes, équivalents,
domaines, définitions, contextes et sources). Les systèmes de gestion de données
terminologiques permettent aux utilisateurs de créer, stocker, gérer et chercher à
l’intérieur de leurs propres fiches terminologiques pour des éléments qu’ils croient utiles
pour leur travail. Ils suggèrent souvent, imposent parfois des structures de fiches pour
aider les utilisateurs à stocker différents types de données terminologiques, et offrent
parfois un certain nombre de fonctions de recherche pour aider les utilisateurs à trouver
rapidement et facilement les fiches dont ils ont besoin. Les systèmes de gestion de
données terminologiques sont souvent une alternative plus utile que les outils Office plus
généraux (e.g. documents de traitement de texte avec des tableaux, des feuilles de calcul
ou des bases de données) pour stocker les données terminologiques. Un autre avantage
est que les systèmes de gestion de données terminologiques peuvent parfois travailler de
paire avec les traducteurs de vocabulaire et/ou les systèmes de mémoires de traduction
dans le cadre d’un environnement de traduction. Il est important de noter la différence
entre les systèmes de gestion de données terminologiques (généralement utilisés pour
stocker des fiches personnelles ou des fiches pour un petit groupe d’utilisateurs) et les
banques de données terminologiques (qui sont généralement créées et utilisées par des
organisations ou peuvent même être des produits publiques ou commerciaux comme
TERMIUM® ou le GDT). Les systèmes de gestion de données terminologiques incluent
SDL Trados MultiTerm et BeeText Term. Des environnements de traduction comme
MultiTrans, LogiTerm et Fusion Translate comprennent aussi des fonctions de gestion
de données terminologiques.
8
Gestionnaires de
mémoires de
traduction ; systèmes
de gestion de
mémoires de
traduction
Les systèmes de gestion de mémoires de traduction sont conçus pour permettre aux
Translation
traducteurs d’épargner temps et effort lors de la traduction de documents qui contiennent memory systems
des répétitions (soit internes, à l’intérieur d’un même texte, ou externes, à l’intérieur de
documents similaires). Les systèmes de gestion de mémoires de traduction stockent
dans une base de données appelée une mémoire de traduction des segments de textes qui
ont été traduits, ainsi que leurs traductions. (Ces segments correspondants, parfois
appelés unités de traduction, peuvent être créées automatiquement lorsqu’un utilisateur
traduit, ou peuvent être assemblées à partir d’un texte source et sa traduction existante en
utilisant un aligneur de bitextes.) La plupart des systèmes de gestion de mémoires de
traduction s’intègrent à ou intègrent des éditeurs de textes (e.g. traitements de textes) afin
de permettre l’usage pendant un processus de traduction « normal ». Lorsqu’un
traducteur est en train de travailler avec un texte dont un segment est semblable ou
identique à un autre qui a déjà été traduit, le système de gestion de mémoires de
traduction peut automatiquement suggérer la traduction précédente pour réutilisation. Le
traducteur peut alors déterminer si cette traduction est appropriée pour l’utilisation dans
le nouveau texte. Si tel est le cas, le traducteur peut simplement l’insérer dans la nouvelle
traduction, ou il peut l’éditer si cela est nécessaire, et peut ensuite l’insérer dans le
nouveau texte. Si la suggestion n’est pas appropriée, le traducteur peut simplement la
rejeter et traduire le segment lui-même. Il ne faut pas confondre les systèmes de gestion
de mémoires de traduction avec les systèmes de traduction automatique (TA); les
mémoires de traduction permettent aux humains de recycler des segments de traductions
déjà faites par l’humain alors que les systèmes de TA effectuent des traductions de façon
automatique et dépendent très souvent de l’humain pour ensuite éditer la traduction. Bien
que certains processus de traduction ou environnements de traduction intègrent ces deux
types d’outils, le fonctionnement de ces derniers est tout à fait différent. Les systèmes de
gestion de mémoires de traduction sont au cœur des environnements de traduction
comme Déjà Vu, Fusion Translate et SDL Trados (plus spécifiquement l’outil
Translator’s Workbench). (Les deux derniers outils mentionnés ci-dessus sont installés
au Centre d’écriture.) Des outils similaires se trouvent aussi dans les environnements de
traduction de MultiTrans et LogiTerm.
9
Moteurs de recherche Le moteur de recherché le plus connu d’Internet est Google, bien qu’il y en ait d’autres
(comme Yahoo!, Alta Vista, et Ask.com). Les moteurs de recherche analysent le
contenu de pages Web et créent des listes d’occurrences de chaînes de caractères
trouvées dans les pages ou leurs URL, dans les informations que les concepteurs de
pages Web fournissent à propos de leurs pages (les métadonnées des pages), ou dans les
liens vers des pages. Cette analyse facilite et accélère la recherche en ligne en utilisant
des mots-clés. Les moteurs de recherche utilisent aussi des calculs sophistiqués pour
classer les résultats de recherches dans le but de présenter les pages qui sont le plus
susceptibles d’être utiles à un utilisateur en début de la liste de résultats. Plusieurs
moteurs de recherche offrent des fonctions de recherches spécialisées et chaque moteur
de recherche a sa propre syntaxe particulière qui doit être apprise afin d’optimiser les
recherches. Un différent type d’outil de recherche, appelé méta moteur de recherche
(e.g. Dogpile), effectue des recherches dans plusieurs moteurs de recherche à la fois et
synthétise ensuite les résultats.
Search engines
10
Outils de localisation
Localization tools
La localisation est une tâche qui implique la traduction et l’adaptation d’une page Web,
d’un logiciel ou d’un autre produit pour une communauté linguistique et culturelle
particulière. Plusieurs participants sont généralement impliqués dans le processus
puisque la tâche implique la manipulation de codes informatiques complexes. Bon
nombre d’outils de localisation ont été créés afin d’assister les traducteurs et autres
professionnels de la localisation dans la gestion des complexités de la tâche (y compris la
gestion des projets, le calcul d’un estimé ou d’un décompte de mots exact, la séparation
des composants textuels à traduire du code informatique qui doit être préservé, et la
gestion des données terminologiques et des textes ou segments de textes déjà traduits).
En plus des outils de localisation, les systèmes de gestion de mémoires de traduction et
les systèmes de gestion de données terminologiques sont très utiles pour de nombreux
projets de localisation. Les outils de localisation incluent : Catalyst, Passolo et
WebBudget, qui est installé au Centre d’écriture.
Outils sur le Web
La catégorie des outils sur le Web est une catégorie générale qui comprend divers types
d’outils en ligne qui sont utiles aux langagiers. Certains sont difficiles à classer selon les
types d’outils classiques (e.g. Diatopix, un outil qui permet à un utilisateur d’effectuer
simultanément un nombre de recherches sur le Web limitées aux régions et qui crée une
charte pour comparer les résultats, ce qui peut être utile par exemple lorsque l’on veut
identifier si un terme ou une expression est plus courant dans une région que dans une
autre). Les autres (e.g. le catalogue de la bibliothèque, ORBIS) sont des outils plus
généraux, qui peuvent néanmoins être utiles aux traducteurs et autres personnes dans
l’industrie langagière. Dans la CERTT, cette catégorie se distingue des dictionnaires
électroniques et des banques de données terminologiques, lesquels, bien qu’ils soient
généralement disponibles en ligne, forment leur propre classe d’outils.
Web tools
11
Systèmes de
traduction
automatique
Les systèmes de traduction automatique (TA) ne ressemblent à aucun autre outil décrit
dans ce glossaire, puisqu’au lieu d’assister un traducteur humain ou un autre
professionnel du langage dans son travail de traduction, les systèmes de TA prennent en
charge le processus entier de traduction de textes. Cependant, cela ne signifie pas que les
langagiers n’ont aucun rôle à jouer, bien au contraire. Lorsque l’on utilise un système de
TA, les humains sont souvent impliqués dans le processus de révision (appelé postédition) du texte cible produit par le système de TA afin de s’assurer que le texte est
correct et adéquat pour son utilisation destinée. Dans certains cas, les humains peuvent
aussi être en mesure de régler la façon dont le système de TA fonctionne (e.g. en
enrichissant ou en modifiant les dictionnaires qu’il utilise) ou en préparant les
documents de façon à ce qu’ils puissent être traduits avec le plus de succès possible par
le système (appelé pré-édition). Les systèmes de TA sont plus utiles lorsque les textes
sources peuvent être soigneusement préparés pour permettre une traduction facile par le
système. (e.g. en clarifiant les expressions ambigües, en assurant que les phrases sont
courtes), et/ou lorsque le texte cible est destiné à permettre la compréhension du contenu
(et non, par exemple, à être publié). Il y a différentes techniques sous-jacentes utilisées
par les systèmes de TA. Certaines tentent d’imiter la façon dont les humains analysent la
langue (e.g. en utilisant des règles de grammaire), alors que d’autres fonctionnent en
utilisant des probabilités statistiques ou en utilisant des exemples de textes déjà traduits
comme modèles. Tout comme les traducteurs humains peuvent produire des versions
d’un texte cible légèrement différentes, certains systèmes de TA agiront différemment.
Certains outils, comme Systran et Reverso sont installés au Centre d’écriture; d’autres
systèmes, comme Babelfish et Google Translate, sont aussi disponibles en ligne
gratuitement. (Il est important d’être particulièrement vigilant lorsque l’on utilise des
outils accessibles en ligne gratuitement, puisqu’ils n’offrent évidemment pas les mêmes
genres d’avantages que les outils installés localement qui peuvent être adaptés au
traitement d’un type de texte spécifique!)
Machine
translation systems
12
Traducteurs de
vocabulaire
Les traducteurs de vocabulaire sont des outils qui analysent de façon automatique des
textes en format électronique afin d’identifier les occurrences des différents termes ou
autres mots à l’intérieur du texte qui sont aussi présents dans une banque de données
terminologiques. Lorsque les traducteurs de vocabulaire identifient des occurrences de
termes connus, ils les mettent parfois en surbrillance dans le texte et proposent à
l’utilisateur des équivalents stockés dans la base de données pour insertion dans le texte,
ou remplacent automatiquement les occurrences de ces termes connus par leurs
équivalents dans la base de données. Les traducteurs de vocabulaire doivent être utilisés
avec une base terminologique (habituellement stockée dans un système de gestion de
données terminologiques) et sont souvent utilisés avec des systèmes de gestion de
mémoires de traduction. Quelques exemples de traducteurs de vocabulaire : la fonction
de pré-traduction dans LogiTerm et l’Agent TermBase dans MultiTrans.
Active
terminology
recognition tools
Traitements de texte
Les traitements de texte sont des logiciels qui aident les utilisateurs à saisir, éditer,
mettre en forme et sauvegarder des documents texte. La plupart offrent aussi des
fonctions additionnelles qui peuvent aider les traducteurs, rédacteurs et réviseurs à
comparer ou à réviser des documents, à enregistrer les données sous différents formats
ou mises en page (e.g. des tableaux) et à convertir des fichiers vers différents formats.
Les systèmes de gestion de mémoires de traduction et autres outils de traductique
interagissent souvent avec les traitements de texte afin de fournir une assistance aux
traducteurs directement dans l’environnement du traitement de texte.
Word processors
13
Windows XP
Windows XP est un système d’exploitation, une collection de programmes informatiques Windows XP
qui gère des ressources informatiques et qui coordonne l’opération de programmes et la
gestion de fichiers et l’interaction entre l’ordinateur et l’humain. Les fonctions de
Windows couvertes dans la CERTT qui peuvent être utiles aux traducteurs incluent la
création et l’extraction de fichiers à partir de dossiers compressés (i.e. zippés) et
l’utilisation des raccourcis clavier.
14

Documents pareils

Voir la fiche d`information de SynchroTerm

Voir la fiche d`information de SynchroTerm Logiciel de dépouillement terminologique bilingue Qu’est-ce que SynchroTerm ? SynchroTerm est un puissant outil de dépouillement terminologique bilingue permettant d’extraire des termes et de créer...

Plus en détail