Généralités et applications du TALN

Transcription

Généralités et applications du TALN
Traitement automatique des langues naturelles
Introduction"
Hervé Blanchon
d’après Jean-Yves Antoine
http://www.info.univ-tours.fr/~antoine/Linguistique.html
Technologies langagières"
o  Technologies langagières
n  informatique appliquée à un type particulier de données, le
langage naturel : parole, document écrit.
o  Pourquoi travailler sur le langage naturel ?
n  information textuelle à traiter (traduction, recherche documentaire,
SMS…)
n  parole à traiter (reconnaissance vocale, reconnaissance du
locuteur, transcription…)
n  seule modalité d’accès à l’information (téléphonie, contrôle vocal
de systèmes)
n  multimodalité : modalité complémentaire permettant soit de
faciliter l’utilisation d’un système (monitoring vocal : limitation
charge cognitive) ou de l’enrichir.
Applications"
o  Reconnaissance de la parole (ASR : Automatic Speech Recognition)
n  en mots isolés ou en parole continue
n  monolocuteur, multilocuteur ou indépendante du locuteur
n  parole interactive (dialogue) ou non (dictée vocale)
n  Exemples d’applications : o  saisie automatique de compte rendus médicaux, o  sous-titrage automatique d’émissions radiodiffusées ou de cours
o  http://fr.wikipedia.org/wiki/Automatic_Speech_Recognition
o  Reconnaissance du locuteur
n  vérification ou identification
n  dépendante ou indépendante du texte
n  Remarque : non infaillible à 100 %
Applications"
o  Reconnaissance de caractères (OCR : Optical Character
Recognition)
n  en contexte (texte) ou hors-contexte (caractères isolés)
n  Exemple d’application : numérisation du patrimoine de la BNF
n  Quelques logiciels
o  http://fr.wikipedia.org/wiki/OCR
o  Synthèse de parole
n  à partir du texte (TTS : text-to-speech synthesis) ou de concepts
n  évolution historique : o  de la synthèse par règle vers la synthèse par concaténation
n  Démonstateurs
o  Divers : http://fr.wikipedia.org/wiki/Synthèse_vocale
o  Démonstrateur FT R&D : http://tts.elibel.tm.fr
Applications textuelles"
o  Traduction automatique
n  traduction « off-line » ou assistée par ordinateur (TAO)
n  traduction rapide de textes (grand public), de documentations
techniques,
n  localisation (adaptation à l’environnement culturel)
o  Recherche d’information textuelle / recherche documentaire
n  recherche documentaire (donner une liste de documents
pertinents), recherche d’information (extraire une information
précise d’un ensemble de documents).
n  dimension interactive : question/réponse (question/answering)
n  Remarque : indexation préalable (manuelle ou automatique)
n  Applications
o  indexation et interrogation des journaux en ligne (Ouest-France,
LeMonde…) ; demande croissante en ingénierie du document (avec
accès WWW)
o  ask Jeeves : http://www.ask.com/?o=10181
Applications textuelles"
o  Ressources terminologiques
n  outils d’aide à la construction de ressources terminologiques
o  aide à la traduction : bases terminologiques multilingues
o  thesaurus pour l’indexation automatique
o  terminologies de référence pour la documentation technique
o  Résumé automatique de texte : veille technologique
o  Génération automatique de texte
n  deux problèmes : Quoi-dire et Comment-dire
n  génération seule (rapport à partir de données numériques : météo,
bourse, médecine ; production de documentation technique)
n  génération intégrée (TAO, résumé automatique)
n  dimension interactive : génération de réponse en dialogue
Homme-Machine
Applications interactives"
o  Interaction homme-machine
n  dialogue homme-machine : systèmes finalisé sur une tâche
précise (serveurs vocaux : recherche d’information, centres
d’appels et autres services clients ; enseignement assisté par
ordinateur ; système coopératifs de planification ou autres
résolutions de problème)
n  contrôle vocal d’équipement (robot, domotique…)
o  Interaction médiée par l ’ordinateur
n  traduction de parole
n  aide à la communication pour personnes handicapées