Fichier 2.1.2. L`analyse linguistique

Transcription

Fichier 2.1.2. L`analyse linguistique
Annexe 2. Dossier 2.1 Les modalités d’analyse
ANNEXE 2
LES DOCUMENTS RADIOPHONIQUES :
ANALYSE LINGUISTIQUE ET EXPÉRIMENTATION
DOSSIER 2.1
Les modalités d’analyse
FICHIER 2.1.2
L’analyse linguistique
INTRODUCTION
Nous avons mis dans l’annexe 2 les 12 documents ayant servi de base à
l’expérimentation. Pour chaque document de l’expérimentation, on trouvera :
1) une fiche d’analyse, pensée en fonction du critère d’intercompréhension, avec les éléments
suivants :
•
la transcription, avec les conventions graphiques rendant compte de la structure
syntaxique, de la prononciation et de la prosodie (voir ci-dessous les conventions de
transcription) ;
•
une translation du document à l’écrit et une transposition en italien.
•
une présentation situationnelle du document ;
•
une analyse linguistique du document (nature et fonction du texte, planification
textuelle, typologie du lexique, structures syntaxiques). La description mettra en
relief certaines particularités intrinsèques du document et des points relevant d’une
analyse contrastive.
•
une description technique et linguistique (durée de l’extrait et de ses sous-parties,
qualité de l’enregistrement, débit, pauses, hésitations, etc.) ;
2) la transcription des entretiens de l’expérimentation avec nos deux informateurs G. et C.
75
Annexe 2. Dossier 2.1 Les modalités d’analyse
2.1.2.1. Données situationnelles
Nous précisons la source du document (type de radio, date, et heure), l’identité des
locuteurs qui dans la transcription seront désignés par L1… Ln , et leur statut dans l’échange
communicatif, autant d’éléments importants pour le décodage du message.
2.1.2.2. Données linguistiques
L’analyse linguistique s’attache à décrire le texte aux niveaux macro-textuel et
micro-textuel, en soulignant en particulier ce qui est susceptible de poser un problème à la
compréhension pour des italophones.
2.1.2.3. Niveau macro-textuel pragmatique
• nature et fonction communicative du texte
• thème général
• planification : découpage en séquences notées S qui sont des macro-unités
discursives ayant une unité thématique et/ou pragmatique, et en énoncés E qui ne
correspondent pas à la phrase, mais à des unités plus petites déterminées par leur
fonction communicative et discursive.
Nous utilisons pour ce faire des concepts d’analyse du discours provenant de
plusieurs écoles travaillant en pragmatique ou sur l’analyse du discours : énoncés et
propositions, rhème/thème et progression thématique, notion de présupposé et d’implication,
notion de fonction communicative et d’acte de parole, de fonction discursive, etc., dans la
mesure où ces concepts ont déjà franchi le cadre des études théoriques où ils sont nés et sont
entrés dans le champ de la didactique. Mais notre analyse est ‘éclectique’ et vise seulement à
mettre en lumière la logique du texte en utilisant ceux des concepts qui apparaissent utiles
pour notre description à un moment donné, afin de pouvoir relier d’éventuelles erreurs en
compréhension à ce niveau général de l’organisation textuelle. Par exemple, nous utilisons le
symbole E pour désigner un énoncé. Mais un énoncé peut recouvrir plusieurs propositions, il
correspond donc à un ensemble discursif, d’ampleur moindre que la séquence, défini par un
thème ou un objectif commun.
76
Annexe 2. Dossier 2.1 Les modalités d’analyse
2.1.2.4. Niveau micro-textuel sémantique et stylistique
A. Le lexique
La définition du « mot » nous a posé problème. Nous avons bien sûr exclu les
comptages automatiques de l’ordinateur qui estime qu’un mot est une suite de graphèmes
séparés par deux blancs. Nous avons adopté un critère, personnel, en comptant comme mot
tout signe ou ensemble de signes doté d’un signifié ou d’un rôle spécifique dans le discours.
Les déterminants (même avec l’apostrophe comme l’), les pronoms, les prépositions sont
comptées comme mots, au même titre que les mots pleins (substantifs, verbes, adjectifs).
Ainsi, les nombres sont présentés en un seul bloc, car il suffit de ne pas comprendre un seul
de ses composants singuliers pour perdre la valeur finale du constituant. De même, les
locutions prépositionnelles ne sont pas démembrées (au pied de = un mot), car en
compréhension, il ne suffit pas de comprendre le mot pied, si on ne le met pas en relation
avec la structure morphologique de la locution qui introduit un SN. Et le même raisonnement
vaut pour les locutions adverbiales comme pas du tout (1 mot).
Les noms composés, propres ou communs, comptent pour un seul mot si leur signifié
ne peut être déduit à partir de la somme des signifiés comme par exemple : compte rendu ou
Ile de France qui désigne une région géographique précise de la France; en effet il ne suffit
de connaître les substantifs île ou France pour accéder au sens. Il en est de même pour
Massif Central : les deux éléments du nom composé sont interprétables, mais le référent de
l’ensemble – à savoir le nom d’une région montagneuse du centre de la France - ne peut être
complètement déduit. Mais table de cuisson en revanche compte pour trois mots : il est vrai
que c’est le groupe dans son ensemble qui désigne un objet particulier, mais le sens est
déductible des composants.
Pour les noms propres de personne, nous avons cependant divisé nom et prénom, le
nom pouvant être complètement opaque alors que le prénom appartient à un paradigme
lexical et peut être plus facilement reconnu, et qu’il arrive que soit utilisé le nom sans le
prénom ou vice versa. Les verbes sont présentés avec le pronom complément qui les
accompagne dans le cas des verbes pronominaux, et sous leur forme conjuguée (auxiliaire +
participe, marques de personne) car les marques de la flexion et de l’accord (personne, mode,
temps, forme active/passive) ne peuvent être dissociées du lexème pour une bonne
compréhension du texte, même si elles peuvent ne pas être perçues toutes en même temps ;
dans ce cas, il y a une compréhension partielle.
Par contre, les différentes formes
morphologiques d’un même verbe (variation de personne, de temps, de mode ou de forme
77
Annexe 2. Dossier 2.1 Les modalités d’analyse
active/passive) sont décomptées séparément. On pourra donc trouver dans le tableau : allait
/est allé / vais.
Le problème a été également l’étiquetage des mots, et nous avons adopté une
classification traditionnelle, d’autant plus que notre analyse est manuelle et non
informatisée :
• noms propres et communs,
• adjectifs qualificatifs ou non qualificatifs (accompagné d’un autre déterminant) : un
autre problème
• verbes
• adverbes ou locutions adverbiales divisés en adverbes circonstanciels (temps, lieu,
manière, moyen, etc.), adverbes de quantité ou d’intensité (beaucoup, très, tout,
etc), adverbes modaux (interrogation, négation, certitude, doute, probabilité, etc.),
les articulateurs de discours (par conséquent, alors, etc).
• déterminants articles, démonstratifs, possessifs, indéfinis et quantificateurs,
interrogatifs et exclamatifs, numéraux
• prépositions et locutions prépositionnelles
• conjonctions de coordination et de subordination
• interjections (voilà, tiens)
Toutefois nous avons conscience que cette classification est imparfaite. Par exemple
une conjonction de coordination peut jouer un rôle d’articulateur de discours et non pas de
coordination à l’intérieur de la phrase. C’est souvent le cas de et ou de mais. De même
certains adverbes de temps jouent un rôle comme articulateurs de discours (et puis). En fait
l’étiquetage pose souvent un problème de catégorisation que les linguistes eux-mêmes n’ont
pas toujours résolu. Mais pour notre propos qui est d’avoir une vision rapide de la
constitution morphologique d’un texte, cela n’a pas d’incidence majeure. Nous ferons une
analyse précise, si le besoin s’en fait ressentir, au moment où nous trouvons une erreur en
compréhension.
Nous avons également adopté une terminologie sujette à caution en parlant de mots pleins.
Nous avons fait entrer dans cette catégorie uniquement les noms, adjectifs et verbes. Or tous
les autres mots ne sont pas de simples outils : certains adverbes ou prépositions ont un poids
sémantique important. Inversement le verbe être servant de copule a un poids sémantique
inférieur. La mesure des mots pleins est en réalité une façon de percevoir la variété lexicale
du texte.
Le lexique est analysé de la façon suivante :
78
Annexe 2. Dossier 2.1 Les modalités d’analyse
• classement sur la base des critères de transparence /opacité avec l’italien ;
• classement par catégories morphologiques, en commençant par les mots pleins
(substantifs, adjectifs, verbes), puis les mots outils (adverbes, déterminants,
pronoms, prépositions, conjonctions, interjections) ;
• calcul du nombre de mots différents par rapport à l’ensemble des mots du texte,
pour avoir une mesure de la charge lexicale et de la difficulté du texte, exprimé en
pourcentage (arrondi) ;
• calcul du nombre de mots pleins différents (noms, adjectifs, verbes sauf être) par
rapport à l’ensemble des mots exprimé en pourcentage (arrondi) ;
• calcul du nombre de mots pleins différents par rapport à l’ensemble des mots pleins
(grande variété ou faible variété lexicale) ;
• niveaux de langue ;
• champs lexicaux (sens des mots et implicites culturels) ;
• expressions figées ;
• usages stylistiquement marqués.
NB. Les calculs sont effectués sur la base de la translation écrite, dans laquelle ne figurent
pas les pauses pleines (bon, euh, hein, eh bien).
B. La syntaxe
• constructions des phrases (simples, complexes, etc.)
• cohésion textuelle (réseaux référentiels, temps verbaux)
• particularités syntaxiques non transparentes.
2.1.2.5. Données techniques
Nous précisons en particulier le problème de la vitesse d’élocution dans la mesure où
c’est bien là un des facteurs de trouble majeur pour la compréhension. Cette vitesse est
mesurée en syllabes/seconde, et sera précisée pour chacune des sous-parties qui ont une
unité discursive. La mesure en phonèmes par seconde qui aurait été plus exacte était trop
onéreuse pour notre propos qui n’est pas celui d’un spécialiste de prosodie. Nous avons
conscience que les syllabes n’ont pas toutes le même poids et donc le même temps
d’émission, mais nous avons besoin d’un ordre de grandeur qui nous permettent de comparer
les documents entre eux plutôt que de mesures exactes. Avec une mesure syllabique, sont
79
Annexe 2. Dossier 2.1 Les modalités d’analyse
pris en considération également les faux départs, les hésitations, les phénomènes de
resyllabation, dont il faut tenir compte car c’est sans doute là une source de difficulté pour
l’auditeur non natif. Le temps des pauses à l’intérieur du discours toutefois n’a pas été
soustrait, si bien que les valeurs obtenues pour le débit sont nécessairement inférieures à ce
qu’elles devraient être. Mais la variation ne devrait pas être très grande, car les documents ne
sont pas très longs, et la durée des pauses dans l’ensemble ne l’est pas non plus. L’indice est
donc suffisant dans notre perspective pour évaluer la difficulté d’un texte par rapport à un
autre en terme de vitesse d’élocution.
Nous analyserons le type d’intonation uniquement s’il y a des faits saillants à remarquer.
80