20130811_DREDE_Annonce Thèse de Sophea Prum
Transcription
20130811_DREDE_Annonce Thèse de Sophea Prum
AVI S DE PRE S E NT AT I O N DE T H ESE E N S O UT E NANCE PO UR L ’O B T E NT I O N DU DI PL O ME NAT I O NAL DE DO CT E UR Madame Sophea PRUM Présentera ses travaux intitulés : « Vers une approche discriminante pour la reconnaissance de mots manuscrits en-ligne en utilisant les modèles de bi-caractères » Spécialité : Informatique et Applications Le 8 novembre 2013 à 10h30 Lieu : Université de La Rochelle Pôle Communication, Multimédia et Réseaux Amphithéâtre 44 Av. Albert Einstein 17000 LA ROCHELLE Composition du jury : M. DOMENGER Jean-Philippe Professeur, Université Bordeaux 1 M. FISCHER Andreas M. OGIER Jean-Marc Docteur, Université de Concordia, Canada Professeur, Université de La Rochelle M. RAMEL Jean-Yves M. TABBONE Salvatore Antoine Mme VINCENT Nicole Professeur, École polytechnique de Tours Professeur, Université de Lorraine Professeur, Université Paris Descartes Mme VISANI Muriel Maître de conférences, Université de La Rochelle Résumé : Avec l’avènement des dispositifs nomades tels que les smartphones et les tablettes, la reconnaissance automatique de l’écriture manuscrite cursive à partir d’un signal en ligne est devenue durant les dernières décennies un besoin réel de la vie quotidienne à l’ère numérique. Dans le cadre de cette thèse, nous proposons de nouvelles stratégies pour un système de reconnaissance de mots manuscrits en-ligne. Ce système se base sur une méthode collaborative segmentation/reconnaissance et en utilisant des analyses à deux niveaux: caractère et bicaractères. Plus précisément, notre système repose sur une segmentation de mots manuscrits en graphèmes afin de créer un treillis à L niveaux. Chaque noeud de ce treillis est considéré comme un caractère potentiel envoyé à un moteur de Reconnaissance de Caractères Isolés (RCI) basé sur un SVM. Pour chaque noeud, ce dernier renvoie une liste de caractères associés à une liste d’estimations de probabilités de reconnaissance. Du fait de la grande diversité des informations résultant de la segmentation en graphèmes en particulier à cause de la présence de morceaux de caractères et de ligatures, l’injection de chacun des nœuds du treillis dans le RCI engendre de potentielles ambiguïtés au niveau du caractère. Nous proposons de lever ces ambiguïtés en utilisant des modèles de bi-caractères, basés sur une régression logistique et dont l’objectif est de vérifier la cohérence des informations à un niveau de reconnaissance plus élevé. Finalement, les résultats renvoyés par le RCI et l’analyse des modèles de bi-caractères sont utilisés dans la phase de décodage pour parcourir le treillis dans le but de trouver le chemin optimal associé à chaque mot dans le lexique.Deux méthodes de décodage sont proposées (recherche heuristique et programmation dynamique), la plus efficace étant basée sur de la programmation dynamique.