Titre du Document

Transcription

Titre du Document
PILOTAGE D ’UNE APPLICATION
PAR LA VOIX
ENTREPRISE
E-DEAL est un éditeur de progiciel CRM, et conduit, de manière directe ou avec des partenaires intégrateurs,
la mise en place de ses solutions au sein du SI de ses clients. Nous recherchons un candidat pour un stage
dans le domaine du traitement automatique de la parole.
OBJET DU STAGE
Le stagiaire sera intégré au département Recherche et Développement et travaillera sur une solution vocale
innovante, dédiée au pilotage par le biais de la parole de notre application destinée aux utilisateurs nomades.
Cette solution a fait l’objet d’un prototype. Ce prototype se base sur les technologies du W3C dont fait partie
le langage VoiceXML et permet un dialogue interactif. Il est à noter que ce cadre technologique n’est pas
limitatif et laisse place à d’autres technologies équivalentes, notamment pour la partie reconnaissance vocale.
Ce prototype donne aujourd’hui satisfaction pour les fonctionnalités de parcours de liste et de lecture de
données. La problématique principale qui demeure à résoudre consiste à rechercher des noms propres (par
opposition à noms communs) par reconnaissance vocale et fera l’objet de ce stage : Effectuer un état de l’art
complet des techniques permettant de rechercher des noms propres dans un dialogue vocal homme-machine.
Parmi les solutions existantes, nous en avons détecté 3 : la recherche phonétique, la recherche via touche
DTMF et l’épellation de lettres pour l’assistance à la recherche. Ces solutions sont détaillées ci-dessous.
Le stagiaire pourra approfondir une première solution qui consisterait à stocker la
représentation phonétique des noms propres de la base de données et à indexer son
contenu et de la confronter à la représentation phonétique d’un nom prononcé par un
locuteur. Le calcul d’un degré de vraisemblance permettra de décider du ou des
enregistrements approchants à restituer.
Une autre solution consisterait à procéder par reconnaissance vocale de touches
tapées au clavier. Chaque chiffre reconnu est alors associé à un ensemble de lettres de
l’alphabet par analogie avec un téléphone. De l’ensemble des touches tapées est alors
déduite une combinaison de lettres permettant finalement de rechercher des
enregistrements dans la base.
La troisième solution consiste à épeler des lettres de manière naturelle. L’acceptation
de ces lettres et leur concaténation permet de procéder à une recherche dans une base
de données. Cette solution pourrait nécessiter de se doter d’outils de reconnaissance
vocale à large vocabulaire comme l’est la dictée vocale.
TECHNOLOGIES
Application web Java/J2EE : Servlet, JSP, modèle MVC, html, javascript
Technologies vocales : VoiceXML, SRGS, SISR, SSML
NIVEAU / DUREE
4ème ou 5eme année, 3 à 6 mois
DIVERS
Localisation : Paris- MONTROUGE (Porte d’orléans)
Envoyez-nous votre CV à l’adresse [email protected]
E-DEAL SAS | 41, rue Périer 92120 Montrouge
Tél. : +33 (0)1 73 03 29 80 | Fax : +33 (0)1 73 01 69 77 | www.e-deal.com
RCS Nanterre B 420 688 400 | TVA FR55420688400 | APE 5829C