En savoir plus

Transcription

En savoir plus
PropositiondethèsededoctoratenInformatique
Modélisationdelacoarticulationmultimodale:Versl’animationd’unetête
parlanteintelligible
Encadrement:SlimOuni([email protected])
Lieu:Nancy(UniversitédeLorraine–laboratoire:LORIA)
Nousproposonsdanscetravailderechercheledéveloppementd’unetêteparlante3Dqui
est animée à partir de la parole enregistrée. Le principe d’animation est de générer les
gestes articulatoires (les mouvements des lèvres, de la langue, et de la mâchoire). Ces
gestes doivent être réalistes, corrects et intelligibles. Il faut savoir que les gestes
articulatoires ne peuvent pas être vus comme une simple concaténation d’articulation de
sons avec une simple transition d’un son à l’autre. Dans le domaine de recherche en
traitementdelaparole,ilestbienétabliquelatransitionentresonsdoittenircomptedela
coarticulation, c’est-à-dire de l’influence d’un phonème sur ses voisins. Par exemple, pour
prononcer le mot clou composé des sons (phonèmes) /k/, /l/ et /u/, il faut préparer
l’articulation du /u/ dès le début de l’articulation du /k/ en arrondissant les lèvres. Dans ce
travail, nous parlons de coarticulation multimodale, parce que nous prenons en compte
simultanément,lesaspectsarticulatoires,visuelsetacoustiques.
L’objectif de cette thèse est la modélisation de la coarticulation multimodale. Il s’agit de
développer des techniques qui permettent de générer les trajectoires articulatoires qui
animentlevisage,leslèvresetlalangueentenantcomptedusignaldeparole.Lesgestes
articulatoiresgénérésdoiventêtrecohérents,c’est-à-dire,lesmouvementsduvisage,des
lèvresetdelalanguenedoiventpasêtrecontradictoires.
La modélisation de la coarticulation multimodale se basera sur un corpus multimodal qui
correspond à des données de capture de mouvement pour le visage, des données
articulatoires,principalementmouvementdelalangueetlesignalacoustique.Cesdonnées
serontannotéesettraitées.Parlasuite,ellesserontutiliséespourdévelopperunmodèlede
coarticulation. Nous étudions la modélisation par technique d’apprentissage automatique
ouparlacombinaisondeméthodesd’apprentissageetuneméthodeàbasederègle.
Nousavonsdéveloppédestechniquesquipermettentd’acquérirdesdonnéesarticulatoires
correspondantes aux mouvements du visage, de la langue et de la mâchoire grâce à la
plateforme d’acquisition articulatoire existante au LORIA. Nous avons également
développédesoutilsetméthodesquipermettentd’animerunvisagevirtuel.

Documents pareils