TER Implémentation d`un système de reconnaissance de la parole

Transcription

TER Implémentation d`un système de reconnaissance de la parole
TER
Implémentation d’un système de reconnaissance de la
parole sur un processeur embarqué
Alexandre Aminot
Ensimag, LIG
18 mai 2011
Alexandre Aminot (Ensimag, LIG)
TER Implémentation d’un système de reconnaissance de la parole
18 sur
maiun
2011
processeur
1 /embar
19
Plan
1
Contexte
2
Démarche
3
Résultats
4
Synthèse, Bilan
Alexandre Aminot (Ensimag, LIG)
TER Implémentation d’un système de reconnaissance de la parole
18 sur
maiun
2011
processeur
2 /embar
19
Contexte
1
Contexte
La parole
e-lio
Logiciel de reconnaissance de la parole
2
Démarche
3
Résultats
4
Synthèse, Bilan
Alexandre Aminot (Ensimag, LIG)
TER Implémentation d’un système de reconnaissance de la parole
18 sur
maiun
2011
processeur
3 /embar
19
Contexte
La parole
"bonjour"
logiciel
locuteur
Alexandre Aminot (Ensimag, LIG)
TER Implémentation d’un système de reconnaissance de la parole
18 sur
maiun
2011
processeur
4 /embar
19
Contexte
La parole
"bonjour"
logiciel
locuteur
bruits
Alexandre Aminot (Ensimag, LIG)
TER Implémentation d’un système de reconnaissance de la parole
18 sur
maiun
2011
processeur
4 /embar
19
Contexte
La parole
"bonjour"
logiciel
locuteur
bruits
parole spontanée
Alexandre Aminot (Ensimag, LIG)
TER Implémentation d’un système de reconnaissance de la parole
18 sur
maiun
2011
processeur
4 /embar
19
Contexte
La parole
"bonjour"
logiciel
locuteur
bruits
parole spontanée
vocabulaire important
Alexandre Aminot (Ensimag, LIG)
TER Implémentation d’un système de reconnaissance de la parole
18 sur
maiun
2011
processeur
4 /embar
19
Contexte
La parole
"bonjour"
logiciel
locuteur
bruits
parole spontanée
vocabulaire important
reconnaissance multilingue
Alexandre Aminot (Ensimag, LIG)
TER Implémentation d’un système de reconnaissance de la parole
18 sur
maiun
2011
processeur
4 /embar
19
Contexte
La parole
"bonjour"
logiciel
locuteur
bruits
fréquence d’échantillonage
parole spontanée
vocabulaire important
reconnaissance multilingue
Alexandre Aminot (Ensimag, LIG)
TER Implémentation d’un système de reconnaissance de la parole
18 sur
maiun
2011
processeur
4 /embar
19
Contexte
La parole
"bonjour"
logiciel
locuteur
bruits
fréquence d’échantillonage
parole spontanée
vocabulaire important
quantification réduite
reconnaissance multilingue
Alexandre Aminot (Ensimag, LIG)
TER Implémentation d’un système de reconnaissance de la parole
18 sur
maiun
2011
processeur
4 /embar
19
Contexte
La parole
"bonjour"
logiciel
locuteur
bruits
fréquence d’échantillonage
parole spontanée
vocabulaire important
reconnaissance multilingue
Alexandre Aminot (Ensimag, LIG)
quantification réduite
vitesse de calcul
TER Implémentation d’un système de reconnaissance de la parole
18 sur
maiun
2011
processeur
4 /embar
19
Contexte
e-lio
Fig.: Le produit e-lio de Technosens
Alexandre Aminot (Ensimag, LIG)
TER Implémentation d’un système de reconnaissance de la parole
18 sur
maiun
2011
processeur
5 /embar
19
Contexte
Logiciel de reconnaissance de la parole
Fig.: Logiciel de reconnaissance de la parole
Alexandre Aminot (Ensimag, LIG)
TER Implémentation d’un système de reconnaissance de la parole
18 sur
maiun
2011
processeur
6 /embar
19
Démarche
1
Contexte
2
Démarche
3
Résultats
4
Synthèse, Bilan
Alexandre Aminot (Ensimag, LIG)
TER Implémentation d’un système de reconnaissance de la parole
18 sur
maiun
2011
processeur
7 /embar
19
Démarche
Microphone e-lio et reconnaissance sur ordinateur
“Bonjour”
“La chaise
est tombée”
“Appelez
le samu”
Alexandre Aminot (Ensimag, LIG)
TER Implémentation d’un système de reconnaissance de la parole
18 sur
maiun
2011
processeur
8 /embar
19
Démarche
Création du système complet de reconnaissance de la
parole
Alexandre Aminot (Ensimag, LIG)
TER Implémentation d’un système de reconnaissance de la parole
18 sur
maiun
2011
processeur
9 /embar
19
Démarche
Implémentation du système complet sur e-lio
Distribution
Microphone
Alexandre Aminot (Ensimag, LIG)
TER Implémentation d’un système de reconnaissance de la parole
18 mai
sur un
2011
processeur
10 /embar
19
Résultats
1
Contexte
2
Démarche
3
Résultats
Reconnaissance sur e-lio
Techniquement
4
Synthèse, Bilan
Alexandre Aminot (Ensimag, LIG)
TER Implémentation d’un système de reconnaissance de la parole
18 mai
sur un
2011
processeur
11 /embar
19
Résultats
86%
Alexandre Aminot (Ensimag, LIG)
TER Implémentation d’un système de reconnaissance de la parole
18 mai
sur un
2011
processeur
12 /embar
19
Résultats
86%
Reconnaissance de la parole possible
Alexandre Aminot (Ensimag, LIG)
TER Implémentation d’un système de reconnaissance de la parole
18 mai
sur un
2011
processeur
12 /embar
19
Résultats
Reconnaissance sur e-lio
2-3 secondes
Alexandre Aminot (Ensimag, LIG)
TER Implémentation d’un système de reconnaissance de la parole
18 mai
sur un
2011
processeur
13 /embar
19
Résultats
Reconnaissance sur e-lio
2-3 secondes
Acceptable
Alexandre Aminot (Ensimag, LIG)
TER Implémentation d’un système de reconnaissance de la parole
18 mai
sur un
2011
processeur
13 /embar
19
Résultats
Reconnaissance sur e-lio
2-3 secondes
Acceptable
Pas temps réel
Alexandre Aminot (Ensimag, LIG)
TER Implémentation d’un système de reconnaissance de la parole
18 mai
sur un
2011
processeur
13 /embar
19
Résultats
Techniquement
Problèmes rencontrés
Intéraction avec le microphone e-lio
Alexandre Aminot (Ensimag, LIG)
TER Implémentation d’un système de reconnaissance de la parole
18 mai
sur un
2011
processeur
14 /embar
19
Résultats
Techniquement
Améliorations
8khz → 16khz
nettoyer le signal
Alexandre Aminot (Ensimag, LIG)
TER Implémentation d’un système de reconnaissance de la parole
18 mai
sur un
2011
processeur
15 /embar
19
Synthèse, Bilan
1
Contexte
2
Démarche
3
Résultats
4
Synthèse, Bilan
Alexandre Aminot (Ensimag, LIG)
TER Implémentation d’un système de reconnaissance de la parole
18 mai
sur un
2011
processeur
16 /embar
19
Synthèse, Bilan
Des résultats positifs
Alexandre Aminot (Ensimag, LIG)
TER Implémentation d’un système de reconnaissance de la parole
18 mai
sur un
2011
processeur
17 /embar
19
Synthèse, Bilan
Problèmes mis en évidence par l’étude
la fréquence d’échantillonnage imposée
le découpage temporel
le temps de calcul
Alexandre Aminot (Ensimag, LIG)
TER Implémentation d’un système de reconnaissance de la parole
18 mai
sur un
2011
processeur
18 /embar
19
Synthèse, Bilan
Bilan personnel
trop tard sur e-lio
développement
but unique
Alexandre Aminot (Ensimag, LIG)
TER Implémentation d’un système de reconnaissance de la parole
18 mai
sur un
2011
processeur
19 /embar
19
Synthèse, Bilan
Bilan personnel
trop tard sur e-lio
développement
but unique
procédure
possibilités et solutions
Alexandre Aminot (Ensimag, LIG)
TER Implémentation d’un système de reconnaissance de la parole
18 mai
sur un
2011
processeur
19 /embar
19