Projet Reconnaissance Automatique de la Parole - LRDE

Transcription

Projet Reconnaissance Automatique de la Parole - LRDE
Projet Reconnaissance Automatique de la Parole
Date de rendu : 02/11/2004
Soutenance : semaine du 15/11/2004
7 octobre 2004
Le but du projet est de réaliser une calculatrice vocale. La calculatrice doit effectuer un
calcul enregistré dans un fichier “wav”, ou bien, dicté directement avec un microphone. Ce
projet comporte une partie obligatoire et une partie optionnelle :
1
Partie obligatoire : Mots isolés
Dans cette partie, on suppose que le message correspondant à un calcul est un enregistrement d’une suite de chiffres 0..9 et des opérateurs (étoile, plus, moins, div, égal) séparés par
des silences.
1.1
Monolocuteur :
Le but de cette partie est de mettre en œuvre l’algorithme DTW pour la reconnaissance
monolocuteur. Votre rapport doit contenir les parties suivantes :
– Calcul des paramètres LPC.
– Calcul des paramètres MFCC.
– Comparaison des résultats obtenus en utilisant l’algorithme DTW avec les paramètres
LPC et avec les paramètres MFCC (taux de reconnaissance).
1.2
Multilocuteur :
Le but de cette partie est d’utiliser les modèles de markov cachés pour faire de la reconnaissance. Votre rapport doit contenir les parties suivantes :
– La définition du modèle utilisé.
– Une comparaison des performances de cette approche par rapport à l’approche DTW
(temps de réponse et taux de reconnaissance).
2
Partie optionnelle :
1. Refaire la première partie pour le traitement de la parole continue.
1
2. Comparaison des deux premières approches (DTW et HMM ) avec une approche neuronale (vue en cours avec YJD).
3. Synthèse audio de la valeur du résultat.
3
Remarques :
– Pour construire une base d’apprentissage, vous êtes invités à déposer vos enregistrements
à cette adresse https://www.lrde.epita.fr/vocalc/. Il faut utiliser votre login et votre mot
de passe EPITA pour vous identifier. Vous avez également la possibilité de télécharger
les enregistrements déposés par les autres.
– L’utilisation de Matlab est autorisé.
– Vous pouvez utiliser la bibliothèque IT++ 1 .
– Pour la gestion des fichiers “wav”, vous pouvez utiliser la bibliothèque LIBSNDFILE 2 .
– Si vous avez une question ou une remarque, envoyer un email à l ’adresse reda@lrde.
epita.fr.
1
2
http://itpp.sourceforge.net
http://www.mega-nerd.com/libsndfile/
2

Documents pareils