CV détaillé

Transcription

CV détaillé
Docteur en Informatique
LE Viet Bac
Né le 14 novembre 1978
Laboratoire d’Informatique de Grenoble
Nationalité vietnamienne
220 rue de la Chimie
Mél : [email protected]
Portable : 06 76 54 91 77
Campus Scientifique, BP53
38041 GRENOBLE Cedex 9, FRANCE
Tél : 04 76 63 55 73 - Fax : 04 76 63 55 52
Formation
2006
Thèse en Informatique à l’Université Joseph Fourier – GRENOBLE 1
Sujet de thèse : Reconnaissance automatique de la parole pour des langues peu dotées.
2002
D.E.A. Informatique à l’Université Joseph Fourier - GRENOBLE 1
Projet de stage : Reconnaissance automatique de digits en anglais en condition bruitée.
Mention : Assez bien.
2001
Diplôme d’Ingénieur en Informatique à Institut Polytechnique de Hanoï (Vietnam)
Mémoire de fin d’études : Construction d’un système de bases de données parallèle (soutenu devant un
jury francophone). Mention : Très bien.
Expérience professionnelle
2007-en cours
Chercheur contractuel dans le cadre du projet ANR RNTS TELMA (Téléphonie à l’usage des
Malentendants) et ANR RNTL MISTRAL (Plateforme open source d’authentification biométrique) au
Laboratoire d’Informatique de Grenoble (LIG). Membre du LIG Team participé à la Compétition de
Recherche d’information Audio et Vidéo : TheStarChallenge2008 (www.thestarchallenge.sg).
2006-2007
Chercheur postdoctoral dans le cadre du projet RIAM-STORECO au LORIA-INRIA Lorraine - Equipe
Parole. Sujet : Détection de changement du locuteur et indexation en locuteurs. Responsable :
Dominique Fohr et Odile Mella ([email protected]).
2005
Stage au laboratoire Interactive Systems Labs, Language Technologies Institute, Carnegie Mellon
University, Pittsburgh, PA, USA. Sujet : Rapid Language Adaptation of ASR Systems - An application to
Vietnamese Language. Encadrante : Pr. Tanja Schultz ([email protected]).
2003
Stage au centre MICA, Hanoi, Vietnam. Sujet : Recueil d’un grand corpus vocal en vietnamien et d’un
phonétiseur vietnamien. Encadrant : Dr. Eric Castelli ([email protected]).
2002-2006
Thèse de doctorat en Informatique. Sujet de thèse : Reconnaissance automatique de la parole pour des
langues peu dotées. Participation à des projets de recherche : MAE CORUS, AUF TALK.
Encadrants : Jean Caelen, Laurent Besacier, Brigitte Bigi (pré[email protected]).
2001-2002
Stage au laboratoire CLIPS/IMAG, Grenoble. Sujet : Reconnaissance automatique de digits en anglais en
conditions bruitées. Encadrant : Dr. Laurent Besacier ([email protected]).
2000-2001
Stage professionnel et stage de fin d’études d’ingénieur dans le centre de calcul parallèle HPCC de
l’Institut Polytechnique de Hanoï. Chef d’une équipe de recherche sur la construction d’un système de
bases de données parallèle. Encadrant : Pr. Thanh-Thuy Nguyen ([email protected]).
Activités de recherche
Reconnaissance automatique de la parole multilingue.
Modélisation acoustique multilingue et translingue.
Segmentation en locuteurs de documents audios et reconnaissance de locuteurs.
Indexation audio et transcription automatique de documents audios.
Traitement, fouille de texte et modélisation statistique du langage.
Traduction automatique de la parole par des méthodes statistiques.
Traitement automatique des langues naturelles.
1
Participation à des projets de recherche
ANR RNTL MISTRAL (2007-2008) : Ce projet s’articule autour du thème de la biométrie multimodale avec des
partenaires tels que le LIG, LIA, EURECOM, IRIT et LIUM. Le projet MISTRAL propose une plate-forme logicielle de
type logiciel libre pour l'authentification biométrique. L'objectif de ce projet est de faciliter l'accès aux technologies
biométriques au monde académique comme au monde industriel en fournissant une plate-forme logicielle
complète, performante, modulaire, facile à maîtriser et à mettre en oeuvre, apte à gérer différentes tâches en
biométrie et différents environnements. Une des retombées attendues du projet est l’animation d’une forte
communauté d'utilisateurs de la plate-forme MISTRAL, composée d’acteurs académiques et industriels.
ANR RNTS TELMA (2006-2008) : Ce projet vise à l’étude et au développement algorithmique de fonctionnalités
audiovisuelles originales à l’usage des personnes malentendantes, et à l’étude de faisabilité de leur intégration dans
un terminal autonome de télécommunication téléphonique. Le projet a pour objectif technique précis d’exploiter la
modalité visuelle de la parole, d’une part pour améliorer les techniques de débruitage du son de parole (la
minimisation du bruit environnemental permettant une meilleure exploitation des restes auditifs des
malentendants), et d’autre part, en mettant en œuvre des techniques d’analyse/synthèse de lecture labiale et de
gestes de la Langue Française Parlée Complétée (LPC). Ma contribution à ce projet concerne le développement un
module de reconnaissance automatique de la parole pour le domaine médical et l’interfaçage avec autres modules
du système. Partenaires du projet : GIPSA-Lab, LIG, FTRD, CHU Grenoble, ENST.
RIAM-STORECO (2004-2007) : Ce projet est soutenu par le Réseau pour la Recherche et l’Innovation en
Audiovisuel et Multimédia (RIAM). Le projet, réalisé à l’équipe PAROLE du laboratoire LORIA (Nancy), a pour
objectif d’automatiser le soustitrage télétexte de documents audiovisuels. Nous avons travaillé donc sur la détection
de classes acoustiques (parole/musique), l’alignement temporel des signaux avec leurs transcriptions et la détection
de changements du locuteur.
MAE CORUS (2003-2006) : Un projet de recherche en coopération avec le centre de recherche international
MICA (Hanoi, Vietnam), soutenu par le MAE français (Ministère des Affaires Etrangères). Dans le cadre de ce
projet, nous souhaitons réaliser un transfert scientifique et technologique des compétences du laboratoire
CLIPS/IMAG vers le nouveau groupe de recherche dans le domaine de traitement de la parole du centre MICA, et
d'adapter les traitements de la parole bien maîtrisés pour les langues occidentales (et pour le français) à la langue
vietnamienne.
AUF TALK (2004-2006) : Le projet TALK "Traitement Automatique de la Langue Khmère" est un projet de
collaboration internationale entre le centre MICA, l'institut ITC et le laboratoire CLIPS/IMAG. Ce projet est soutenu
par l’AUF (Agence Universitaire pour la Francophonie). L’objectif du projet TALK est de mettre en place au sein de
l’équipe de l’ITC, un groupe de recherche sur la parole en langue khmère, pour concevoir des applications
d'interaction et de communication parlée et doter les systèmes d'une composante langagière fiable et performante.
Publications
V-B. Le, L. Besacier, S. Seng, B. Bigi, T-N-D. Do, Recent Advances in Automatic Speech Recognition for
Vietnamese, SLTU’08, papier accepté, Hanoi, Vietnam, May 2008.
V-B. Le, S. Seng, L. Besacier, B. Bigi, Word/Sub-Word Lattices Decomposition And Combination For Speech
Recognition, IEEE ICASSP’08, papier accepté, Las Vegas, NV, Avril 2008.
B. Bigi, V-B. Le, Normalisation et alignement de corpus français et vietnamiens : Format et Logiciels, JADT’08,
papier accepté, Lyon, France, March 2008.
L. Besacier, A. Mahdhaoui, V-B. Le, The LIG Arabic/English Speech Translation System at IWSLT 07, IWSLT'07,
Trento, Italy, October 2007.
V-B. Le, O. Mella, D. Fohr, Speaker Diarization using Normalized Cross Likelihood Ratio, InterspeechEurospeech’07, Antwerp, Belgium, August 2007.
L. Besacier, V-B. Le, Automatic Speech Recognition for Under-Resourced Languages, SpeD 2007, Iasi, Romania,
May, 2007.
V-B. Le, L. Besacier, Comparison of acoustic modeling techniques for Vietnamese and Khmer ASR, InterspeechICSLP’06, pp. 129-132, Pittsburgh, PA, USA, September 2006.
V-B. Le, Reconnaissance automatique de la parole pour des langues peu dotées, Thèse de doctorat en
Informatique de l’Université Joseph Fourier, 200 pages, Grenoble, juin 2006.
V-B. Le, L. Besacier, T. Schultz, Acoustic-Phonetic Unit Similarities for Context Dependent Acoustic Model
Portability, IEEE ICASSP'06, vol. 1, pp. 1101-1104, Toulouse, France, May 2006.
L. Besacier, V-B. Le, C. Boitet, V. Berment, ASR and translation for under-resourced languages, IEEE ICASSP'06,
2
vol. 5, pp. 1221-1224, Toulouse, France, May 2006.
L. Besacier, V-B. Le, E. Castelli, S. Sam, L. Protin, Reconnaissance Automatique de la Parole pour des Langues peu
Dotées : Application au Vietnamien et au Khmer, Atelier « TALN et langues peu dotées », TALN’05, vol 2, pp. 207217, Dourdan, France, Juin 2005.
V-B. Le, L. Besacier, First steps in fast acoustic modeling for a new target language: application to Vietnamese,
IEEE ICASSP'05, vol. 1, pp. 821-824, Philadelphia, PA, USA, March 2005.
L. Villaseñor-Pineda, V-B. Le, M. Montes-y-Gómez, M. Pérez-Coutiño, Toward Acoustic Models for Languages with
Limited Linguistic Resources, Lecture Notes in Computer Science, ISBN: 3-540-24523-5, vol. 3406/2005, pp. 433436, Springer-Verlag, February 2005.
V-B. Le, D-D. Tran, L. Besacier, E. Castelli, J-F. Serignat, First steps in building a large vocabulary continuous
speech recognition system for Vietnamese, RIVF’05, pp. 330-333, Can Tho, Vietnam, 2005.
V-B. Le, D-D. Tran, E. Castelli, L. Besacier, J-F. Serignat, Spoken and written language resources for Vietnamese,
LREC’04, pp. 599-602, Lisbon, Portugal, May 2004.
D-D. Tran, V-B. Le, E. Castelli, V-L. Trinh, Building a large Vietnamese Speech Database, en vietnamienne, Journal
of Vietnam Science and Technology, vol. 46+47/2004, pp. 13-17, February 2004.
V-B. Le, B. Bigi, L. Besacier, E. Castelli, Using the Web for fast language model construction in minority languages,
Interspeech-Eurospeech'03, pp. 3117-3120, Geneva, Switzerland, September 2003.
Prix - Récompenses
2002-2006
Obtenu une bourse d’excellence Eiffel du Ministère des Affaires étrangères français pour effectuer
une formation des doctorants en France (pendant 36 mois + 6 mois prolongeable).
2000-2001
1er prix au concours de recherche scientifique pour des étudiants de l’Institut Polytechnique
de Hanoï – Projet : MySQLel - système de bases de données parallèle.
1994-1995
3ème prix au concours National de l’Informatique organisé pour les lycées (Vietnam).
Compétences
Langues :
vietnamien : langue maternelle.
français, anglais : couramment.
Techniques :
Traitement et reconnaissance automatique de la parole multilingue.
Modélisation acoustique (GMM/HMM).
Segmentation, regroupement en locuteur (BIC, KL2, GLR, NCLR, ...) et identification du locuteur (GMM, UBM).
Traitement du signal.
Modélisation statistique du langage.
Traitement du langage naturel (traitement de texte et corpus de texte multilingue, vocabulaire, dictionnaire, ...).
Divers : identification de langues écrites, classification de bruits, recherche d’information, traduction de la parole, …
Outils développés : Démonstrateur de reconnaissance vocale, CLIPS-Text-Tk (Multilingual Text Processing
Toolkit), SELORIA (LORIA Speaker Diarization Toolkit), LatDeCom (Lattice Decomposition and Combination Tools),
EMACOP-Unicode (Outil d’acquisition d’un corpus de parole multilingue), PESCORING (Outil d’évaluation
automatique de distance des phonèmes), VNPhoneAnalyzer (Phonétiseur vietnamien), ...
Informatiques :
Programmation : C/C++, VC++/VB, Perl, Tcl/Tk, Awk, Assembly, Réseaux, Web, Java.
Outils & Systèmes : CMU Janus, CMU Sphinx, SRILM, IRISA SPro, LIUM mClust, Transcriber, Matlab, Praat,…
SGBDs : MySQL, MS Access, SQL Server, …
Systèmes d’exploitation : Linux (Redhat, Mandrake, Debian), Windows (9x/NT,XP, Mobile), Mac OS.
Loisirs
Sport : football, badminton, ski, tennis.
Divers : Musique, cinéma, jeu vidéo, photographie, lecture.
3

Documents pareils