Titre du Document
Transcription
Titre du Document
PILOTAGE D ’UNE APPLICATION PAR LA VOIX ENTREPRISE E-DEAL est un éditeur de progiciel CRM, et conduit, de manière directe ou avec des partenaires intégrateurs, la mise en place de ses solutions au sein du SI de ses clients. Nous recherchons un candidat pour un stage dans le domaine du traitement automatique de la parole. OBJET DU STAGE Le stagiaire sera intégré au département Recherche et Développement et travaillera sur une solution vocale innovante, dédiée au pilotage par le biais de la parole de notre application destinée aux utilisateurs nomades. Cette solution a fait l’objet d’un prototype. Ce prototype se base sur les technologies du W3C dont fait partie le langage VoiceXML et permet un dialogue interactif. Il est à noter que ce cadre technologique n’est pas limitatif et laisse place à d’autres technologies équivalentes, notamment pour la partie reconnaissance vocale. Ce prototype donne aujourd’hui satisfaction pour les fonctionnalités de parcours de liste et de lecture de données. La problématique principale qui demeure à résoudre consiste à rechercher des noms propres (par opposition à noms communs) par reconnaissance vocale et fera l’objet de ce stage : Effectuer un état de l’art complet des techniques permettant de rechercher des noms propres dans un dialogue vocal homme-machine. Parmi les solutions existantes, nous en avons détecté 3 : la recherche phonétique, la recherche via touche DTMF et l’épellation de lettres pour l’assistance à la recherche. Ces solutions sont détaillées ci-dessous. Le stagiaire pourra approfondir une première solution qui consisterait à stocker la représentation phonétique des noms propres de la base de données et à indexer son contenu et de la confronter à la représentation phonétique d’un nom prononcé par un locuteur. Le calcul d’un degré de vraisemblance permettra de décider du ou des enregistrements approchants à restituer. Une autre solution consisterait à procéder par reconnaissance vocale de touches tapées au clavier. Chaque chiffre reconnu est alors associé à un ensemble de lettres de l’alphabet par analogie avec un téléphone. De l’ensemble des touches tapées est alors déduite une combinaison de lettres permettant finalement de rechercher des enregistrements dans la base. La troisième solution consiste à épeler des lettres de manière naturelle. L’acceptation de ces lettres et leur concaténation permet de procéder à une recherche dans une base de données. Cette solution pourrait nécessiter de se doter d’outils de reconnaissance vocale à large vocabulaire comme l’est la dictée vocale. TECHNOLOGIES Application web Java/J2EE : Servlet, JSP, modèle MVC, html, javascript Technologies vocales : VoiceXML, SRGS, SISR, SSML NIVEAU / DUREE 4ème ou 5eme année, 3 à 6 mois DIVERS Localisation : Paris- MONTROUGE (Porte d’orléans) Envoyez-nous votre CV à l’adresse [email protected] E-DEAL SAS | 41, rue Périer 92120 Montrouge Tél. : +33 (0)1 73 03 29 80 | Fax : +33 (0)1 73 01 69 77 | www.e-deal.com RCS Nanterre B 420 688 400 | TVA FR55420688400 | APE 5829C