Titre du sujet : Reconnaissance d`écriture par Réseaux de

Transcription

Titre du sujet : Reconnaissance d`écriture par Réseaux de
PROPOSITION DE SUJET DE STAGE – Janvier 2010
Titre du sujet : Reconnaissance d’écriture par Réseaux de Neurones
Récurrents
Encadrement :
Laboratoire :
Laurence Likforman-Sulem (Telecom ParisTech),
Tél. : 01 45 81 73 28
Courriel : [email protected]
46 rue Barrault, 75013 Paris
Marc Sigelle (Telecom ParisTech)
Courriel : [email protected]
Telecom ParisTech/ Dept Traitement du Signal et des Images
CNRS LTCI UMR 5141
Contexte et objectifs
La reconnaissance de la parole et de l’écriture sont des domaines de recherche très actifs
depuis une vingtaine d'années. Les recherches dans ces deux domaines ont fait émerger des
modèles comme les modèles de Markov cachés (HMMs), les réseaux Bayésiens dynamiques
et les réseaux de neurones récurrents. Les réseaux de neurones récurrents ont été appliqués
initialement à la reconnaissance de la parole (Schuster et Paliwal, 97) et plus récemment à la
reconnaissance de l’écrit (Graves et al., 2009).
Les réseaux de neurones récurrents diffèrent des réseaux de neurones classiques (feedforward) par l’existence de liaisons vers des unités des couches précédentes. Cette propriété
permet de produire en sortie du réseau des séquences évoluant au cours du temps.
L’architecture de réseau récurrent LSTM (Long Short Term Memory) introduit la notion de
contexte par des dépendances bidirectionnelles.
Il s’agira pendant ce stage de mettre en œuvre un modèle de réseau LSTM (Long Short Term
Memory) en vue de la classification d’images de mots. On proposera également une
paramétrisation pour les vecteurs d’observations qui seront issus d’une fenêtre glissante.
L'évaluation se fera sur la base publique Rimes de mots isolés issus de courriers clients et
collectée en 2008 (Grosicki et al. 2009).
Un prolongement de ce stage sous forme d'une thèse sur la reconnaissance de documents
multilingues et financée par la DGA est envisagé.
Références
A. Senior, Off-line handwriting recognition: a review and experiments, Technical report TR 105, Cambridge
University, 1992.
A. Graves S. Fernandez, J. Schmidhuber Bidirectional LSTM Networks for Improved Phoneme Classification
and Recognition,
A. Graves, M. Liwicki, S. Fernandez, R. Bertolami, H. Bunke, J. Schmidhuber. A Novel Connectionist System
for Improved Unconstrained Handwriting Recognition. IEEE PAMI, vol. 31, no. 5, 2009.
E. Grosicki, M. Carré, J-M. Brodin, E. Geoffrois, Results of the RIMES Evaluation Campaign for Handwritten
Mail Processing. ICDAR 2009: 941-945
L. Likforman-Sulem, M. Sigelle, Recognition of degraded characters using Dynamic Bayesian Networks,
Pattern Recognition, Vol. 41, pp. 3092-3103, 2008,