20130811_DREDE_Annonce Thèse de Sophea Prum

Transcription

20130811_DREDE_Annonce Thèse de Sophea Prum
AVI S DE PRE S E NT AT I O N DE T H ESE E N S O UT E NANCE PO UR
L ’O B T E NT I O N DU DI PL O ME NAT I O NAL DE DO CT E UR
Madame Sophea PRUM
Présentera ses travaux intitulés :
« Vers une approche discriminante pour la reconnaissance de mots manuscrits en-ligne en
utilisant les modèles de bi-caractères »
Spécialité : Informatique et Applications
Le 8 novembre 2013 à 10h30
Lieu :
Université de La Rochelle
Pôle Communication, Multimédia et Réseaux
Amphithéâtre
44 Av. Albert Einstein
17000 LA ROCHELLE
Composition du jury :
M. DOMENGER Jean-Philippe
Professeur, Université Bordeaux 1
M. FISCHER Andreas
M. OGIER Jean-Marc
Docteur, Université de Concordia, Canada
Professeur, Université de La Rochelle
M. RAMEL Jean-Yves
M. TABBONE Salvatore Antoine
Mme VINCENT Nicole
Professeur, École polytechnique de Tours
Professeur, Université de Lorraine
Professeur, Université Paris Descartes
Mme VISANI Muriel
Maître de conférences, Université de La Rochelle
Résumé :
Avec l’avènement des dispositifs nomades tels que les smartphones et les tablettes, la reconnaissance
automatique de l’écriture manuscrite cursive à partir d’un signal en ligne est devenue durant les dernières
décennies un besoin réel de la vie quotidienne à l’ère numérique. Dans le cadre de cette thèse, nous proposons de
nouvelles stratégies pour un système de reconnaissance de mots manuscrits en-ligne. Ce système se base sur une
méthode collaborative segmentation/reconnaissance et en utilisant des analyses à deux niveaux: caractère et bicaractères. Plus précisément, notre système repose sur une segmentation de mots manuscrits en graphèmes afin
de créer un treillis à L niveaux. Chaque noeud de ce treillis est considéré comme un caractère potentiel envoyé à
un moteur de Reconnaissance de Caractères Isolés (RCI) basé sur un SVM. Pour chaque noeud, ce dernier
renvoie une liste de caractères associés à une liste d’estimations de probabilités de reconnaissance. Du fait de la
grande diversité des informations résultant de la segmentation en graphèmes en particulier à cause de la présence
de morceaux de caractères et de ligatures, l’injection de chacun des nœuds du treillis dans le RCI engendre de
potentielles ambiguïtés au niveau du caractère. Nous proposons de lever ces ambiguïtés en utilisant des modèles
de bi-caractères, basés sur une régression logistique et dont l’objectif est de vérifier la cohérence des
informations à un niveau de reconnaissance plus élevé. Finalement, les résultats renvoyés par le RCI et l’analyse
des modèles de bi-caractères sont utilisés dans la phase de décodage pour parcourir le treillis dans le but de
trouver le chemin optimal associé à chaque mot dans le lexique.Deux méthodes de décodage sont proposées
(recherche heuristique et programmation dynamique), la plus efficace étant basée sur de la programmation
dynamique.

Documents pareils