Généralités et applications du TALN
Transcription
Généralités et applications du TALN
Traitement automatique des langues naturelles Introduction" Hervé Blanchon d’après Jean-Yves Antoine http://www.info.univ-tours.fr/~antoine/Linguistique.html Technologies langagières" o Technologies langagières n informatique appliquée à un type particulier de données, le langage naturel : parole, document écrit. o Pourquoi travailler sur le langage naturel ? n information textuelle à traiter (traduction, recherche documentaire, SMS…) n parole à traiter (reconnaissance vocale, reconnaissance du locuteur, transcription…) n seule modalité d’accès à l’information (téléphonie, contrôle vocal de systèmes) n multimodalité : modalité complémentaire permettant soit de faciliter l’utilisation d’un système (monitoring vocal : limitation charge cognitive) ou de l’enrichir. Applications" o Reconnaissance de la parole (ASR : Automatic Speech Recognition) n en mots isolés ou en parole continue n monolocuteur, multilocuteur ou indépendante du locuteur n parole interactive (dialogue) ou non (dictée vocale) n Exemples d’applications : o saisie automatique de compte rendus médicaux, o sous-titrage automatique d’émissions radiodiffusées ou de cours o http://fr.wikipedia.org/wiki/Automatic_Speech_Recognition o Reconnaissance du locuteur n vérification ou identification n dépendante ou indépendante du texte n Remarque : non infaillible à 100 % Applications" o Reconnaissance de caractères (OCR : Optical Character Recognition) n en contexte (texte) ou hors-contexte (caractères isolés) n Exemple d’application : numérisation du patrimoine de la BNF n Quelques logiciels o http://fr.wikipedia.org/wiki/OCR o Synthèse de parole n à partir du texte (TTS : text-to-speech synthesis) ou de concepts n évolution historique : o de la synthèse par règle vers la synthèse par concaténation n Démonstateurs o Divers : http://fr.wikipedia.org/wiki/Synthèse_vocale o Démonstrateur FT R&D : http://tts.elibel.tm.fr Applications textuelles" o Traduction automatique n traduction « off-line » ou assistée par ordinateur (TAO) n traduction rapide de textes (grand public), de documentations techniques, n localisation (adaptation à l’environnement culturel) o Recherche d’information textuelle / recherche documentaire n recherche documentaire (donner une liste de documents pertinents), recherche d’information (extraire une information précise d’un ensemble de documents). n dimension interactive : question/réponse (question/answering) n Remarque : indexation préalable (manuelle ou automatique) n Applications o indexation et interrogation des journaux en ligne (Ouest-France, LeMonde…) ; demande croissante en ingénierie du document (avec accès WWW) o ask Jeeves : http://www.ask.com/?o=10181 Applications textuelles" o Ressources terminologiques n outils d’aide à la construction de ressources terminologiques o aide à la traduction : bases terminologiques multilingues o thesaurus pour l’indexation automatique o terminologies de référence pour la documentation technique o Résumé automatique de texte : veille technologique o Génération automatique de texte n deux problèmes : Quoi-dire et Comment-dire n génération seule (rapport à partir de données numériques : météo, bourse, médecine ; production de documentation technique) n génération intégrée (TAO, résumé automatique) n dimension interactive : génération de réponse en dialogue Homme-Machine Applications interactives" o Interaction homme-machine n dialogue homme-machine : systèmes finalisé sur une tâche précise (serveurs vocaux : recherche d’information, centres d’appels et autres services clients ; enseignement assisté par ordinateur ; système coopératifs de planification ou autres résolutions de problème) n contrôle vocal d’équipement (robot, domotique…) o Interaction médiée par l ’ordinateur n traduction de parole n aide à la communication pour personnes handicapées