Perception Visuelle de Parole chez les Enfants de Spectre Autistique

Transcription

Perception Visuelle de Parole chez les Enfants de Spectre Autistique
Perception Visuelle de Parole chez les Enfants de Spectre Autistique
Rida S. YOU 1,2 , Willy SERNICLAES1 , Delphine RIDER1, Nadia CHABANE3
rida‐[email protected]
1 Laboratoire de Psychologie de la Perception UMR 8158‐ CNRS‐ Université Paris Descartes
2 Laboratoire de Phonétique (ARP), UFR Linguistique‐ Université Denis Diderot
3 Service de Psychopathologie de l’Enfant et de l’Adolescent‐ Hôpital Robert Debré
Abstract
During exposure to natural speech, the vocal and the visual aspects of the signal are integrated in a unitary percept. The contribution of visual cues to speech perception has been demonstrated by numerous of studies. However, the recent the literature on speech audiovisual integration in autism spectrum disorders
(ASD) reported mixed findings about their audiovisual integration capacities in speech communication. This study aimed to investigate: (1) if the children with ASD have or not a lip‐reading deficit for consonants and vowels, (2) if full face versus mouth only modifies lip‐reading skills in ASD and (3) if lip‐reading abilities
are correlated to communication scores tested by ADI‐R. Lip‐reading was assessed using the natural French syllables with either vowel onsets ([ia], [ya], [ua]) or consonant onsets ([ba], [da], [ga]) presented in unimodal visual condition. Both children with ASD aged 9‐12 years and typically developing children matched
approximately for chronologic age, verbal ability and non verbal ability participated to the study. Results showed that: (1) ASD children had a deficit in in lip‐reading accuracy for consonants but not for vowels compared to the control group, (2) no significant differences between ASD and controls full face vs. only
mouth face condition in lip‐reading task; however, the children with Asperger’’s syndrome showed a better performance than high‐functioning children with autism in lip‐reading in the mouth only condition, and (3) no correlation between lip‐reading performances and ADI‐R. Our results suggest that children with
ASD show a deficit in the integration of auditory and visual information, which might have implications for language acquisition.
Key Words : perception, lip‐reading, vowels, consonants, autism.
I. Introduction
Dès les premiers stades du développement perceptif de parole, l’enfant pré‐linguistique est capable d’utiliser un système perceptif sensori‐moteur de la parole. Il est capable d’associer les sons de parole aux mouvements des lèvres faits par le locuteur (Kuhl & Meltzoff, 1982, Bristow et al., 2009). La catégorisation en
traits phonologiques de(s) sa(es) langue(s) maternelle(s) s’opère par l’intégration bimodale des traits acoustiques aux traits visuels fournis par les mouvements des lèvres durant les premières étapes de compréhension du langage.
L’importance de l’information visuelle comme complémentaire à l’information auditive durant le traitement de la parole et notamment en milieu bruité, a déjà été largement confirmée par un grand nombre d’études chez l’enfant et l’adulte (Teinonen et al., 2008, Desjardins et al., 1997, Massaro, 1987, Sumby &
Pollack, 1954 ) avec un développement normal et pathologique (Mills, 1987, O’Connor & Hermelin, 1981).
Les troubles du langage et de la communication font partie des principales manifestations trouvées dans l’autisme (APA,1994). Les personnes avec autisme ont des difficultés à établir une communication face à face et à intégrer plusieurs informations provenant du visage (pour une révision voir : Dawson et al., 2005).
Dès les premières étapes du développement nous observons un évitement du regard vers le visage et une préférence à des stimuli de non‐parole chez les enfants avec trouble du spectre autistique‐ TSA (Dawson et al., 1998, Klin, 1991). De plus, en utilisant la technique « eyes tracking », les études suggèrent que les
personnes avec autisme ont une attention visuelle vers la bouche lors de la perception du visage en situation sociale (Klin et al., 2002).
Pour expliquer les déficits du langage et de la communication, des études de neuroimageries ou électrophysiologiques montrent des dysfonctionnements dans les circuits neuronaux responsables du traitement de la parole en modalité auditive (p.ex. Zilbovicius et al., 2000, Čeponienè et al., 2003). En modalité
visuelle, les résultats sont assez controversés. Certains études montrent un déficit dans la lecture labiale des consonnes avec des visages dynamiques et synthétisés (Williams et al., 2004), des mots dans une phrase avec des visages dynamiques et naturels (Smith & Benetto, 2007). De plus, ces déficits semblent être
indépendants de l’attention du regard vers le visage chez les TSA. Par exemple, Irwin (2006) a mis en évidence avec la technique « eyes tracking » que bien que les personnes avec TSA fixaient leur regard vers le visage, ils utilisaient moins d’information visuelle pendant les tâches perceptives audiovisuelles de parole.
Iarocci et al. (2010) ont également mis en évidence un déficit de lecture labiale et un déficit d’intégration audiovisuelle en utilisant uniquement la région de la bouche.
Cependant, contrairement à ces hypothèses d’autres études montrent une absence de déficit de la lecture labiale des consonnes avec des visages dynamiques et naturels (de Gelder et al., 1991) ou dans la détection de la désynchronisation AV des mots (Grossman et al., 2009). Ces derniers auteurs suggèrent même
une sorte d’expertise dans la lecture labiale (voir aussi Grossman & Tager‐Flusberg, 2008). La complexité de tous ces résultats est due d’une part, aux différentes méthodologiques utilisées entre les études (consonnes/voyelles, syllabes/mots, visage statique/dynamique, naturel/synthétique), et d’autre part, aux
différences entre les âges des participants dans chaque étude (enfants, adolescents, adultes). Taylor et al. (2010) ont mis en évidence que les enfants autistes de haut niveau présentent un retard dans la trajectoire développementale pour l’utilisation de l’information visuelle de parole par rapport aux enfants de
même âge chronologique, avec toutefois un pic d’accélération perceptive audiovisuelle au début de la puberté. Le manque de consensus et de clarté sur l’utilisation de l’information visuelle lors de la compréhension du langage dans l’autisme, nous amène à poursuivre ces investigations.
II. Objectifs de l’étude
(1) confirmer le déficit de lecture labiale des consonnes en visage dynamique et naturel et voir si le déficit est également présent pour les contrastes vocaliques,
(2) voir si les enfants avec TSA présenteront des différences de performance de lecture labiale entre le visage complet et la bouche seule et,
(3) corréler les résultats avec les performances de communication et socialisation évaluées par l’ADI‐R afin de mieux comprendre les troubles du langage et de la communication dans l’autisme.
III. Hypothèses
(1) les enfants TSA présenteraient un déficit dans la lecture labiale pour les consonnes et voyelles, le déficit d’intégration des indices visuels dans la perception de la parole ferait partie d’un déficit de couplage entre traits phonétiques,
(2) la présence du visage entier ou de la bouche seule ne modifierait pas les performances de lecture labiale et,
(3) l’existence d’une corrélation positive entre les déficits dans la lecture labiale et les performances de communication verbale et non verbale évaluées par l’ADI‐R (Lord et al.,1994).
IV. Méthode
V. Résultats
Participants: Deux groupes d’enfants âgés de 9 à 12 ans ont participé à cette étude. Le premier groupe de
16 enfants (Moy=10,6ans, SD=11,8) diagnostiqués d’autisme de haut niveau (AHN n=10) ou syndrome
d’Asperger (SA n=6), sera désigné comme le groupe avec Trouble du Spectre Autistique (TSA). Ce groupe a
été diagnostiqué selon les critères du DSM‐IV (APA,1994), et confirmé par le premier investigateur lors des
entretiens avec les échelles ADI‐R (Lord et al., 1994) (CS=23, CV=16, CNV=10, CRS=5). Le deuxième groupe
de participants, était formé de 18 enfants (Moy=10,3, SD=9,0) avec développement typique (DT), les
enfants ont été comparés selon leur âge chronologique, les performances d’intelligence verbale(EVIP) et
non‐verbale(RAVEN).
Stimuli: Un enregistrement d’une vidéo d’un locuteur masculin phonéticien et francophone verbalisant
une série de syllabes isolées du type « VV » variant en degré d’arrondissement des lèvres (/ia/, /ya/, /ua/)
et du type « CV » variant en lieu d’articulation (/ba/, /da/, /ga/) a été réalisé au laboratoire au laboratoire
de Gipsa à Grenoble. Les stimuli ont été présentés sous forme de vidéos sur un ordinateur portable avec
trois boutons de réponses en couleurs. Chaque image a été présentée avec une durée de 1sec et un ISI de
200ms et un ITI de 1000ms.
Procédure: Les tests réalisés ont été uniquement des tests d’identification. Les enfants devaient identifier
chaque « visème » et répondre à partir des trois alternatives de choix forcé (3ACF), en appuyant sur les
boutons correspondants (p.ex. /i/ bouton jaune ; /y/ bouton vert ; /u/ bouton bleu). Chaque stimulus a été
présenté quatre fois dans un ordre aléatoire (total 24 stimuli), en deux séries différentes (voyelles et
consonnes) et dans deux conditions différentes « visage et bouche ». La condition visage entier a toujours
été présentée avant la condition bouche seule.
• Les performances des enfants avec TSA et DT en fonction de chaque contraste de lieu et dans les deux conditions visage et bouche sont présentées dans les figures 1a. et 2a. Une régression linéaire
multiple a été utilisée afin de comparer les enfants avec TSA et DT en fonction de contraste phonologique et contexte. Les enfants avec TSA sont plus faibles (64%) dans la lecture labiale (LLB)
indépendamment du contexte uniquement pour les consonnes, et non pour les voyelles (p=.06) par rapport aux enfants avec TD (84%), et cette différence est significative (p=.02).
• Les performances des enfants avec SA et AHN en fonction de contrastes et dans les deux contextes sont présentés dans les figures 2a. et 2b. Les enfants avec SA sont plus performants (78%) en LLB
indépendamment du type de contraste vocalique et contexte par rapport aux enfants avec AHN (55%), et cette différence est significative (p<.05).
• Les différences de temps de réaction lors de la lecture labiale entre les groupes avec TSA et DT en fonction du contexte sont présentées dans les figures 1c. et 2c. Les enfants avec TSA ont été plus lents
(TR= 457ms/411ms) dans les tâches de LLB des consonnes et voyelles respectivement et indépendamment du contexte par rapport aux enfants avec DT (TR= 345ms/ 295ms), et cette différence est
significative (p<.05).
• Une corrélation faiblement positive a été trouvée entre les performances de LLB des consonnes dans les deux contextes « visage et bouche » et les compétences de communication verbale (r =.20,
p<.05) et non verbale (r=.21, p<.05) évaluées par l’ADI‐R.
Lecture labiale des consonnes
100%
100%
80%
80%
DT
TSA
40%
20%
700
600
500
60%
DT
SA
AHN
40%
daV
daB
gaV
gaB
baB
stimuli
100%
80%
80%
60%
DT
TSA
40%
20%
% réponses correctes
% réponses correctes
100%
visage
gaB
Figure 1c. Temps de réaction des consonnes
chez les enfants avec DT et SA.
Lecture labiale des voyelles
700
600
500
60%
DT
SA
AHN
40%
yaV
yaB
uaV
uaB
SA
300
AHN
100
0
iaV
stimuli
iaB
yaV
yaB
uaV
uaB
stimuli
400 ms
Figure 2a. Identification des voyelles chez les
enfants avec DT et TSA.
DT
400
200
0%
iaB
bouche
contexte
20%
iaV
1s
gaV
Lecture labiale des voyelles
0%
400 ms
daB
Figure 1b. Identification des consonnes chez
les enfants avec SA et AHN. vs. DT
Lecture labiale des voyelles
1s
daV
stimuli
Figure 1a. Identification des consonnes chez
les enfants avec DT et TSA.
400 ms
AHN
0
baV
TR (m s)
baB
SA
300
100
0%
baV
DT
400
200
20%
0%
400 ms
Lecture labiale des consonnes
TR (ms)
60%
% réponses correctes
% réponses correctes
Lecture labiale des consonnes
Figure 2b. Identification des voyelles chez les
enfants avec SA et AHN. Vs. DT
VI. Discussion
Hypothèse 1: Les enfants TSA présenteraient un déficit dans la lecture labiale pour les consonnes et voyelles.
Résultats 1 : Les résultats de cette étude mettent en évidence un déficit dans l’utilisation d’informations visuelles de parole (lecture labiale) pour les consonnes et non pour les voyelles chez
les enfants avec trouble du spectre autistique par rapport aux enfants avec développement typique. Nos résultats corroborent d’autres études : déficit de LLB pour les consonnes en visage naturel et
dynamique (Iarocci et al., 2010) et en visage synthétique (Williams et al., 2004), Deruelle et al. (2004) pour des résultats semblables avec des voyelles en utilisant des images statiques.
Interpretation1 :
•Lors du développement perceptif la catégorisation des voyelles natives se fait plus précocement que les consonnes (Polka & Werker, 1994) et dans le développement de production orale, les voyelles sont
les premières unités à être produites par l’enfant (pour une revue : Boysson‐Bardies, 1996).
•De plus, les différences configurationnelles entre les visèmes vocaliques (/i/ # /y,u/) sont plus visibles que les consonnes (/b/#/d/# /g/).
•Les voyelles semblent donc être plus facilement perceptibles que les consonnes, notamment en lecture labiale. Ceci peut expliquer le déficit de LLB pour les consonnes et l’absence de déficit de LLB pour
les voyelles mis en évidence ici avec des visages dynamiques chez les enfants avec TSA par rapport aux enfants avec DT .
•Les enfants avec TSA participants de cette étude sont tous des enfants verbaux, néanmoins, ils ont présenté un déficit dans la lecture labiale des sons plus complexes. Ces résultats suggèrent, que les
enfants avec TSA utilisent préférentiellement la modalité auditive de parole (cf. résultats de Iarocci et al., 2010) en situation d’écoute difficile (milieu bruité). Leur performance de compréhension verbale
est réduite par le manque de compensation de la modalité visuelle de parole (cf. résultats de Smith & Bennetto, 2007). Ces déficits peuvent être le résultat d’un dysfonctionnement d’intégration entre les
régions acoustiques et motrices dans le sulcus temporal supérieur (STS) lors du traitement audiovisuel de la parole (Calvert et al., 1998 ).
Résultats 2 : Les enfants avec AHN sont plus déficitaires dans la LLB des voyelles par rapport aux enfants avec SA. Nous avons mis en évidence des différences de performances perceptives,
uniquement pour les voyelles entre ces deux groupes.
Interprétation 2 : Les enfants avec SA sont plus sensibles aux différences configurationnelles des contrastes plus longs comme les voyelles, étant donné leur manque de retard dans
l’acquisition du langage.
Hypothèse 2: La présence du visage entier ou de la bouche seule ne modifiera pas les performances de lecture labiale.
Résultats : Nos résultats montrent une tendance à une amélioration de la perception de la LLB en contexte bouche pour les deux groupes, notamment chez les SA (83%B/61%V) mais les
différences entre des performances entre les groupes ne sont pas significatives. Iarocci et al., (2010) ont confirmé un déficit de la LLB chez les enfants avec TSA avec les consonnes en utilisant uniquement
la bouche.
Interprétation :
Ces résultats suggèrent que les enfants avec TSA présentent un déficit de la LLB indépendamment de la présence du visage entier. Les études neurophysiologiques montrent une dissociation cérébrale
entre les différentes fonctions du visage (Campbell, 1992, Hasby et al., 2000). L’inhabileté à utiliser les informations visuelles de parole dépend des mécanismes spécifiques linguistiques. Toutefois, le visage
entier semble perturber la prise d’information phonétique des contrastes complexes chez les SA, par un défaut d’inhibition des autres informations extra‐orales du visage (cf. hypothèses d’un déficit de
cohérence centrale, Frith & Happé, 1994).
Hypothèse 3: Une corrélation positive entre les déficits dans la lecture labiale et les performances de communication verbale et non verbale évaluées par l’ADI‐R .
Résultats : Nos résultats montrent une corrélation faiblement positive entre la LLB des consonnes avec les scores de communication verbale et non‐verbale évalués par l’ADI‐R, et une
corrélation négative avec la LLB des voyelles.
Interprétation : L’une des hypothèses est que les items de l’ADI‐R dans le domaine de la communication intègrent plusieurs aspects de l’échelle communicationnelle (p.ex. sémantique,
pragmatique…) et non précisément les aspects phonologiques.
VII. Conclusion : Les enfants avec trouble du spectre autistique présentent un déficit dans l’intégration de l’information visuelle aux informations acoustiques des contrastes phonologiques les plus
complexes. Les résultats de cette étude peuvent ne pas être généralisables chez les personnes avec TSA de « haut niveau » à l’âge adolescent ou adulte. L’âge développemental change les performances
perceptives de parole. Les recherches futures, dans une perspective développementale, doivent mettre en évidence le profil perceptif de parole en fonction de l’âge et tester différents contrastes
phonologiques, afin de donner des stratégies d’intervention dans les troubles du langage et de communication dans l’autisme.
visage
bouche
contexte
Figure 2c. Temps de réaction des voyelles
chez les enfants avec DT et TSA.
Remerciements
Nous souhaitons remercier tous les parents et les enfants pour leur brillante collaboration à cette étude. Nous remercions
également Stéfany Bonnot pour son aide dans le recrutement des enfants, Christophe Savariaux pour son aide dans la
programmation des logiciels utilisés dans cette étude, et Mônica Zilbovicius pour le soutien scientifique.
VIII. Références Bibliographiques
• APA (1994). Diagnostic and Statiscal Manual of Mental Disorders ‐DSM‐IV (4th ed.). Washington DC: American Psychiatric
Association.
•Boysson‐Bardies, B. (1996). Comment la parole vient aux enfants. Paris: Editions Odile Jacob.
•Calvert, G., A., Brammer, M.J., & Iversen, S.D. (1998). Crossmodal identification. Trends in cognitive sciences, 2 (7), 247‐253.
• Campbell, R. (1992). Lip‐reading and the modularity of cognitive function: Neuropsychological glimpses of fractionation for
speech and for faces. In. J. Alegria, D. Holender, J. Morais & M. Radeau (Eds.). Analytic Approaches to Human Cognition (pp.
275‐289). Elsevier Science Publishers.
• Čeponiène, R., Lepistö, T., Shestakova, A. et al. (2003). Speech‐sound‐selective auditory impairment in children with autism:
They can perceive but do not attend. PNAS, 100(9), 5567‐5572.
• Dawson, G., Meltzoff, A.N., Osterling, J. et al. (1998). Children with autism fail to orient to naturally occurring social stimuli.
Journal of Autism developmental Disorders, 28 (6), 479‐485.
• Dawson, G. Webb,S.J. & McPartland,J. (2005). Understanding the Nature of Face Processing Impairment in Autism: Insights
from Behavioral and Electrophysiological Studies. Developmental Neuroscience, 27(3), 403‐424.
• De Gelder, B., Vroomen, J., Van der Heide, L. (1991). Face recognition and Lip‐reading in Autism. European Journal of
Cognitive Psychology, 3(1), 69‐86.
• Deruelle, C., Rondan, C., Gepner,B. & Tardif, C. (2004). Spatial Frequency and Face Processing in Children with Autism and
Asperger Syndrome. JADD, 34(2), 199‐210.
•Frith, U. & Happé,F. (1994). Autism: beyond of “theory of mind”. Cognition, 50, 115‐132.
• Grossman, R.B., Schneps,M.H. & Tager‐Flusberg, H. (2009). Slipped lips: onset asynchony detection of auditory‐visual
language in autism. Journal of Child Psychology and Psychiatry, 50(4), 491‐497.
• Grossman, R.B. & Tager‐Flusberg, H. (2008). Reading faces for information about words and emotions in adolescents with
autism. Research in Autism Spectrum Disorders, 2, 681‐695.
•larocci, G., Rombough, A., Yager,J. et al. (2010). Visual Influences on speech perception in children with autism. Autism, 14(4),
305‐320.
•Irwin, J.R. (2006). Audiovisual speech integration in children with autism spectrum disorders. JASA, 120, 3348. Abstract.
• Klin, A., Jones, W., Schultz, R., Volkmar, F. & Cohen, D. (2002). Visual fixation patterns during viewing of naturalistic social
situations as predictors of social competence in individuals with autism. Arch. Gen. Psychiatry, 59, 809‐816.
•Kuhl, P.K. & Meltzoff, A. (1982). The bimodal perception of Speech in Infancy. Science, 218 (4577), 1138‐1141.
• Lord, C., Rutter, M. & Le Couteur, A. (1994). Autism Diagnostic Interview‐Revised : A revised version of a diagnostic interview
for caregivers of individuals with possible pervasive developmental disorders. JASA, 24, 659‐685.
•Mills, A.E. (1987). The development of phonology in the blind child. In. B. Dodd & R. Campbell (Ed.). Hearing by eye: The
psychology of lip reading ( pp. 145‐161). London, Lawrence Erlbaum Associates Publishers.
•Polka, L. & Werker, J.F. (1994). Developmental Changes in Perception of Nonnative Vowel Contrasts. Journal of experimental
Psychology: Human Perception and Performance, 20(2), 421‐435.
• Smith, E.G. & Bennetto, L. (2007). Audiovisual speech integration and lipreading in autism. Journal of child psychology and
psychiatry, 48(8), 813‐821.
• Sumby, W. & Pollack, I. (1954). Visual contribution to speech intelligibility in noise. Journal of the acoustical society of
America, 26, 212‐215.
• Taylor, N., Isaac,C. & Milne,E. (2010). A comparison of the Development of Audiovisual Integration in Children with Autism
Spectrum Disorders and Typically Developing Children. JADD, 40, 1403‐1411.
• Teinonen, T., Aslin, R.N., Alku, P. & Csibra, G. (2008). Visual speech contributes to phonetic learning in 6‐month –old infants.
Cognition, 108, 850‐855.
• Williams, J.H.G., Massaro,D.W., Peel, N.J. et al. (2004). Visual‐auditory integration during speech imitation in autism. Research
in Developmental Disabilities, 25, 559‐575.
• Zilbovicius, M., Boddaert,N., Belin, P. et al. (2000).Temporal Lobe Dysfunction in Childhood Autism: A PET study. Am. J.
Psychiatry,157:12, 1988‐1993.