Thomas Hueber
Thomas Hueber
E-mail : thomas.hueber /at/
Web :
Tél : +33 (0)4 76 57 49 40
Chargé de recherche au CNRS
Affilié au GIPSA-lab (Grenoble) - Département Parole & Cognition
Etat Civil
Nationalité Française, Célibataire, Né le 9 novembre 1982 à Cannes
Expériences Professionnelles
GIPSA-lab (Grenoble) – Département Parole & Cognition (ex-ICP)
fév. 2010-à ce jour
- Chargé de recherche au CNRS (section 07, depuis le 01/10/10) & Post-doc (6 mois)
- Thématiques de recherche : « Interfaces de communication parlée augmentée,
application à la rééducation orthophonique interactive » & « Interfaces de
communication en parole silencieuse ».
ESPCI ParisTech (Laboratoire SIGMA) & Telecom ParisTech (LTCI)
fév. 2006-dec. 2009
- Doctorat (Financement DGA) & Stage de Master Recherche
- Sujet : « Reconstitution de la parole par imagerie ultrasonore et vidéo de l’appareil
vocal, vers une communication parlée silencieuse » (Projet ANR Ouisper)
- Direction : Pr Denby (ESPCI ParisTech/UPMC), Dr Chollet (Telecom ParisTech)
IRCAM (Paris) - Equipe Analyse/Synthèse (stagiaire)
Synthèse musicale et vocale (TTS) par concaténation d’unités
sept. 2004-sept. 2005
REALViZ (Sophia-Antipolis) (stagiaire)
Développements sur le logiciel MatchMover Professional
juillet-août 2003
Doctorat en Informatique, Télécommunications et Electronique
Université Pierre et Marie Curie (Paris 6)
Master Recherche Sciences de l’Information des Dispositifs et des Systèmes
INSA Lyon - Spécialité Traitement du Signal et de l’Image (mention TB, major)
Ingénieur en Electronique, Télécommunications et Informatique
Ecole Supérieure de Chimie Physique Electronique de Lyon (CPE Lyon)
Classes Préparatoires Math Sup’ Math Spé’
Lycée Masséna - Nice - Parcours MPSI & PSI
Baccalauréat Scientifique
Lycée Carnot, Cannes - Mention Très Bien
Compétences techniques
Image : filtrage, contours actifs, Eigenfaces, AAM, block-matching, OpenCV, synthèse 3D (OpenGL)
Audio : transformation (OLA, HNM) / reconnaissance (DTW, HMM) / synthèse (concaténative/HMM) - vocale
Apprentissage artificiel : approches discriminatives (réseaux de neurones, SVM) & génératives (GMM/HMM)
Informatique : C/C++ (MFC, GTK), Java, Matlab, Perl, PostgreSQL, Max/MSP, PHP, HTML, OS type Unix
Electronique : microcontrôleur (PIC), VHDL
Anglais : Courant
Allemand : Bonnes connaissances
Prix / Récompenses
2008 : « Best Student Paper Award in Speech Communication » - Acoustics'08 - Acoustical Society of America
2007 : Prix de la société « IRIS-Inspection Machine » (spécialisée en traitement de l’image)
Intérêts Personnels ~ Divers
Musique (Guitare, Batterie, Piano, MAO), Escrime ~ Permis B, Brevet de secourisme PSC 1
Revues internationales
Hueber, T., Benaroya, E.L., Chollet, G., Denby, B., Dreyfus, G., Stone, M., (2009) "Development of a Silent
Speech Interface Driven by Ultrasound and Optical Images of the Tongue and Lips", Speech
Communication, 52(4), pp. 288-300.
Denby, B., Schultz, T., Honda, K., Hueber, T., Gilbert, J.M., Brumberg, J.S. (2009) "Silent speech interfaces",
Speech Communication, 52(4), pp. 270-287.
Hueber, T., Dubois, R., Roussel, P., Denby, B., and Dreyfus, G. (2009). "Dispositif de reconstitution de la
parole par sondage ultrasonore de l'appareil phonatoire (Brevet, Numéro de dépot 09 04444)"
Chapitres d’ouvrages
Hueber, T., Denby, B. (2009). "Analyse du conduit vocal par imagerie ultrasonore", L'imagerie médicale
pour l'étude de la parole, Alain Marchal, Christian Cavé, Traité Cognition et Traitement de
l'Information, IC2, Hermes Science, pp. 147-174.
Chollet, G., Landais, R., Hueber, T., Bredin, H., Mokbel, C., Perrot, P., Zouari, L. (2007). "Some Experiments in
Audio-Visual Speech Processing", Advances in Nonlinear Speech Processing, vol 4885, Springer,
pp. 28-56.
Conférences internationales avec actes et comité de lecture
Badin., P, Ben Youssef, A., Bailly, G., Elisei, F., Hueber, T. (2010), "Visual articulatory feedback for phonetic
correction in second language learning", Proceedings of L2SW (Tokyo, Japan).
Florescu, V-M., Crevier-Buchman, L., Denby, B., Hueber, T., Colazo-Simon, A., Pillot-Loiseau, C., Roussel, P.
Gendrot, C., Quattrochi, S. (2010), "Silent vs Vocalized Articulation for a Portable Ultrasound-Based
Silent Speech Interface", Proceedings of Interspeech (Makuari, Japan).
Hueber, T., Chollet, G., Denby, B., Dreyfus, G., and Stone, M. (2009). "Visuo-Phonetic Decoding using MultiStream and Context-Dependent Models for an Ultrasound-based Silent Speech Interface,"
Proceedings of Interspeech (Brighton, UK), pp. 640-643.
Hueber, T., Chollet, G., Denby, B., and Stone, M. (2008). "Acquisition of ultrasound, video and acoustic
speech data for a silent-speech interface application," Proceedings of International Seminar on
Speech Production (Strasbourg, France), pp. 365-369.
Hueber, T., Chollet, G., Denby, B., Dreyfus, G., and Stone, M. (2008). "Towards a Segmental Vocoder Driven
by Ultrasound and Optical Images of the Tongue and Lips," Proceedings of Interspeech (Brisbane,
Australie), pp. 2028-2031.
Hueber, T., Chollet, G., Denby, B., Dreyfus, G., and Stone, M. (2008). "Phone Recognition from Ultrasound
and Optical Video Sequences for a Silent Speech Interface," Proceedings of Interspeech (Brisbane,
Australia), pp. 2032-2035.
Hueber, T., Chollet, G., Denby, B., Stone, A., and Zouari, L. (2007). "Ouisper: Corpus Based Synthesis Driven
by Articulatory Data," Proceedings of International Congress of Phonetic Sciences (Saarbrücken,
Germany), pp. 2193-2196.
Hueber, T., Chollet, G., Denby, B., Dreyfus, G., and Stone, M. (2007). "Continuous-Speech Phone
Recognition from Ultrasound and Optical Images of the Tongue and Lips," Proceedings of Interspeech
(Antwerp, Belgium), pp. 658-661.
Hueber, T., Aversano, G., Chollet, G., Denby, B., Dreyfus, G., Oussar, Y., Roussel, P., and Stone, M. (2007).
"Eigentongue feature extraction for an ultrasound-based silent speech interface," Proceedings of
ICASSP (Honolulu, USA), pp. 1245-1248.
Beller, G., Hueber, T., Schwarz, D., Rodet, X. (2006). "Speech Rates in French Expressive Speech",
Proceedings of Speech Prosody, (Dresden, Allemagne), pp. 672-675.
Beller, G., Hueber, T., Schwarz, D., Rodet, X. (2005). "A Hybrid Concatenative Synthesis System On the
Intersection of Music And Speech", Proceedings of JIM, (Paris, France), pp. 41-45.
Enseignements / Encadrements
Qualifié aux fonctions de Maitre de Conférences (sections 61 & 63)
Moniteur en Electronique
Université Pierre et Marie Curie (Paris 6) / Ecole d’Ingénieur Polytech’Paris (~100 h/an)
Fonctions et Systèmes Electroniques - Cours - (Bac +3)
Electronique Numérique - TP - (Bac +4)
Microcontrôleurs (PIC) - Projet 6 semaines - (Bac +4)
Modulation d'Amplitude/Angulaire Analogique/Numérique - TD/TP – (Bac +4)
Préceptorat en Traitement du Signal
ESPCI ParisTech (20 h)
« Introduction au traitement automatique de la parole » - Cours/TP - (Bac +5)
Encadrement de stages (informatique/apprentissage statistique)
Stage Master 1 (1 mois) - 3 Etudiants UPMC Paris 6
Stage Recherche (3 mois) - 4 Etudiants ESPCI ParisTech - (Bac +5)

