Titre du sujet : Reconnaissance d`écriture par Réseaux de
Transcription
Titre du sujet : Reconnaissance d`écriture par Réseaux de
PROPOSITION DE SUJET DE STAGE – Janvier 2010 Titre du sujet : Reconnaissance d’écriture par Réseaux de Neurones Récurrents Encadrement : Laboratoire : Laurence Likforman-Sulem (Telecom ParisTech), Tél. : 01 45 81 73 28 Courriel : [email protected] 46 rue Barrault, 75013 Paris Marc Sigelle (Telecom ParisTech) Courriel : [email protected] Telecom ParisTech/ Dept Traitement du Signal et des Images CNRS LTCI UMR 5141 Contexte et objectifs La reconnaissance de la parole et de l’écriture sont des domaines de recherche très actifs depuis une vingtaine d'années. Les recherches dans ces deux domaines ont fait émerger des modèles comme les modèles de Markov cachés (HMMs), les réseaux Bayésiens dynamiques et les réseaux de neurones récurrents. Les réseaux de neurones récurrents ont été appliqués initialement à la reconnaissance de la parole (Schuster et Paliwal, 97) et plus récemment à la reconnaissance de l’écrit (Graves et al., 2009). Les réseaux de neurones récurrents diffèrent des réseaux de neurones classiques (feedforward) par l’existence de liaisons vers des unités des couches précédentes. Cette propriété permet de produire en sortie du réseau des séquences évoluant au cours du temps. L’architecture de réseau récurrent LSTM (Long Short Term Memory) introduit la notion de contexte par des dépendances bidirectionnelles. Il s’agira pendant ce stage de mettre en œuvre un modèle de réseau LSTM (Long Short Term Memory) en vue de la classification d’images de mots. On proposera également une paramétrisation pour les vecteurs d’observations qui seront issus d’une fenêtre glissante. L'évaluation se fera sur la base publique Rimes de mots isolés issus de courriers clients et collectée en 2008 (Grosicki et al. 2009). Un prolongement de ce stage sous forme d'une thèse sur la reconnaissance de documents multilingues et financée par la DGA est envisagé. Références A. Senior, Off-line handwriting recognition: a review and experiments, Technical report TR 105, Cambridge University, 1992. A. Graves S. Fernandez, J. Schmidhuber Bidirectional LSTM Networks for Improved Phoneme Classification and Recognition, A. Graves, M. Liwicki, S. Fernandez, R. Bertolami, H. Bunke, J. Schmidhuber. A Novel Connectionist System for Improved Unconstrained Handwriting Recognition. IEEE PAMI, vol. 31, no. 5, 2009. E. Grosicki, M. Carré, J-M. Brodin, E. Geoffrois, Results of the RIMES Evaluation Campaign for Handwritten Mail Processing. ICDAR 2009: 941-945 L. Likforman-Sulem, M. Sigelle, Recognition of degraded characters using Dynamic Bayesian Networks, Pattern Recognition, Vol. 41, pp. 3092-3103, 2008,