Analyse dialectométrique des parlers berbères de Kabylie

Transcription

Analyse dialectométrique des parlers berbères de Kabylie
Saïd GUERRAB
Analyse dialectométrique des parlers
berbères de Kabylie
Résumé de la thèse (pour affichage)
Il est difficile de parler du berbère sans parler de la variation. Il y a d’abord une variation au niveau
interdialectal. Les dialectes berbères sont tellement différents que l’intercompréhension est rarement
assurée entre un dialecte et un autre. Les différences sont à tous les niveaux : phonético-phonologique,
sémantique, lexical et morphosyntaxique. Ensuite, chaque dialecte (kabyle, rifain, touareg…) connaît une
variation interne, parfois extrêmement importante. Pourtant, cette variation a rarement bénéficié d’une
analyse systématique. D’ailleurs, la classification des dialectes et parlers berbères reste toujours
problématique. Seul le rifain a récemment bénéficié d’une étude systématique (LAFKIOUI, 2009).
Les quelques études sur la variation en kabyle ont été soit restreintes à une zone microdialectale
(ex. MADOUI, 1995), soit basées sur un corpus limité (ex. NAIT-ZERRAD, 2005). Nous avons donc voulu
mener une analyse systématique de la variation en Kabylie, à l’aide des méthodes de la dialectométrie et
ce pour atteindre plusieurs objectifs. Les deux principaux objectifs, inhérents à toute étude
dialectométrique, étaient la mise en évidence du continuum dialectal qui existe en Kabylie et la
classification des parlers kabyles sur la base d’une méthode objective et à partir d’un corpus large. Notre
troisième objectif, qui rentre plutôt dans le cadre de la perspective, était la préparation d’un atlas
linguistique kabyle basé sur le corpus recueilli dans le cadre de cette étude, car le seul travail de ce genre
qui existe est celui de BASSET (1929) et n’inclut que quelques termes relatifs au corps humain.
Nous avons commencé notre étude par un chapitre préliminaire où nous avons fourni quelques
généralités sur le berbère en nous focalisant sur le dialecte kabyle. Ce chapitre nous a permis de donner
une vue d’ensemble de notre domaine d’étude à un lecteur non-spécialiste. A la fin du chapitre, dans la
section 2.6, nous avons fait l’inventaire phonétique du kabyle, nécessaire au travail d’analyse
dialectométrique.
Pour faire une analyse dialectométrique, nous avions besoin d’examiner la variation linguistique en
berbère d’une manière générale et en kabyle particulièrement. C’est ce que nous avons pu faire dans le
chapitre « 3. Variation en berbère ». Nous avons parlé de la variation aussi bien au niveau interdialectal
(section 3.2) qu’au niveau intradialectal (section 3.3). Nous avons classé la variation en quatre catégories :
variation phonétique, variation lexicale, variation sémantique et variation morphosyntaxique.
Du fait que notre étude porte sur le kabyle, nous avons traité la variation entre les parlers kabyles
avec beaucoup plus de détails. Cet examen détaillé, nous a permis d’élaborer notre grille d’enquête avant
d’aller sur le terrain.
La variation en berbère, comme nous l’avons présentée dans le chapitre 3, a déjà suscité l’intérêt
des berbérisants depuis l’aube des études berbères. Ainsi, pour placer notre recherche dans le contexte
Saïd GUERRAB
Résumé de la thèse
Analyse dialectométrique des parlers berbères de Kabylie
des études berbères, nous avons fait, dans le chapitre 4, l’état des lieux des études comparatives qui ont
porté, soit sur plusieurs dialectes soit sur un dialecte en particulier. Nous avons classé ces travaux
antérieurs en plusieurs catégories : études de géolinguistique, études contrastives, études de classification
et études dialectométriques.
Nous avons, notamment, conclu que le champ de la dialectométrie n’est pas encore bien exploré
dans le domaine berbère. Cette conclusion justifie donc notre l’intérêt pour une analyse dialectométrique
des parlers kabyles.
Pour mener une étude de dialectométrie, qui est une discipline relativement récente et en pleine
évolution, nous avons voulu, d’abord, dresser l’état de l’art des méthodes de dialectologie pour comparer
un ensemble de variétés. C’est ce que nous avons fait dans le chapitre 5.
Nous avons classé ces méthodes en trois grandes catégories : méthodes traditionnelles, méthodes
perceptuelles et méthodes informatiques. En commençant par les méthodes les plus anciennes (les
méthodes traditionnelles) à l’exemple de la méthode d’isoglosses, aux méthodes les plus récentes
(méthodes informatiques) comme les méthodes de dialectométrie.
La comparaison des différentes méthodes, notamment celles qui rentrent dans le champ de la
dialectométrie, nous a conduits à choisir la méthode Levenshtein comme étant la meilleure méthode pour
classifier un ensemble de variétés linguistiques. C’est la conclusion de la section 5.4.5.
La méthode Levenshtein, appelée aussi « distance d’édition », reste encore une méthode obscure
pour la plupart des dialectologues, bien qu’elle soit très utilisée dans d’autres disciplines comme le
traitement automatique des langues ou la comparaison des séquences d’ADN en génétique. C’est la raison
pour laquelle nous avons consacré le chapitre 6 à la présentation de cette méthode.
La mise en œuvre de la méthode de Levenshtein ou toute autre méthode dialectométrique,
nécessite l’utilisation de logiciels ou d’applications en ligne. Ce sont ces outils que nous avons explorés au
cours du chapitre 7. Nous avons fait une brève description des trois principaux outils utilisés en
dialectométrie : le logiciel VDM (méthode de GOEBL), le logiciel RUG/L04 (calcul binaire, méthode de
GOEBL et distance de Levenshtein) et enfin l’application en ligne Gabmap (distance de Levenshtein). La
comparaison des trois solutions, nous a permis de choisir l’application en ligne Gabmap pour analyser nos
données.
Avant de commencer l’analyse des données, il faut d’abord les présenter. C’est ce que nous avons
accompli dans le chapitre 8, consacré à la présentation du corpus et du terrain d’enquête. Nous avons
commencé le chapitre par des informations très générales sur notre domaine d’enquête qui est la Kabylie.
Nous avons fini le chapitre avec des informations très spécifiques à notre travail, comme l’inventaire des
sons (unités phoniques) et des variantes (unités lexicales et unités syntaxiques) du corpus.
Après avoir présenté les données indépendamment des localités (points d’enquête) dans le
chapitre 8, nous avons voulu, à travers le chapitre 9, lier les différentes variantes aux différents endroits où
elles ont été recueillies. Les cartes linguistiques sont le meilleur moyen pour accomplir cette tâche. Nous
avons élaboré une quinzaine de cartes géolinguistiques pour donner un visage aux données recueillies sur
le terrain. Nous avons classé les cartes en trois catégories : cartes phonétiques, cartes lexicales et cartes
morphosyntaxiques.
2
Saïd GUERRAB
Résumé de la thèse
Analyse dialectométrique des parlers berbères de Kabylie
Ce chapitre nous a aussi permis de réaliser l’un de nos objectifs de départ qui consistait à mettre
des bases à l’élaboration d’un atlas linguistique des parlers kabyles. Puisque nous avons un corpus adéquat
et nous avons acquis les techniques nécessaires pour l’élaboration des cartes linguistiques.
Après avoir présenté les différents préalables à notre analyse (la méthode Levenshtein, les outils
d’analyse, le terrain d’enquête, corpus, …) nous sommes passés, tout naturellement, dans le chapitre 10, à
l’analyse dialectométrique des données. Ce chapitre constitue la partie purement applicative de notre
étude.
Nous nous sommes servis de Gabmap pour suivre toutes les étapes d’une analyse dialectométrique.
En commençant par la distribution des variantes, qui a pu nous donner une idée sur les différents groupes
de parlers qui partagent telle ou telle variante, jusqu’à l’étape finale qui est l’analyse de grappes qui nous a
permis de délimiter les principales zones infra dialectales en Kabylie.
Pour mesurer la distance entre les paires de variantes, nous avons appliqué, dans la section 10.3,
trois méthodes différentes pour le calcul de la différence entre les unités phoniques : calcul binaire,
formule euclidienne et formule de Manhattan. Les trois méthodes ont donné des résultats cohérents. La
distance linguistique (valeur numérique) entre deux variantes est globalement proportionnelle à la
différence linguistique entre ces deux dernières.
Par la suite, dans la section 10.4, nous avons fourni des extraits des matrices des distances entre les
variétés, avec chacune des méthodes suivies. La matrice obtenue avec le calcul binaire, celle obtenue avec
la distance de Manhattan et enfin celle obtenue avec la distance d’Euclide. La comparaison des trois
matrices a montré une cohérence de la méthode Levenshtein sous les trois distances. Deux variétés très
proches dans la matrice du calcul binaire sont forcément très proches dans les deux autres matrices et
vice-versa.
Après avoir obtenu les matrices de distances entre les variétés (parlers), nous avons voulu voir le
résultat qu’on obtiendra si l’on comparaît une variété avec l’ensemble des autres variétés. C’est ce que
nous avons achevé à travers la section 10.5, qui a porté sur la variation vue d’un point de référence. Nous
avons pris des points de références éloignées et d’une façon à représenter les quatre points cardinaux de
notre domaine d’enquête. Les cartes dialectométriques et les diagrammes obtenus dans cette section nous
ont permis de dégager trois zones infradialectales hypothétiques : la zone extrême orientale, la zone
orientale (ou proche orientale) et la zone occidentale.
Représenter l’ensemble des différences linguistiques entre les variétés revient à projeter les valeurs
numériques (distance numérique entre les paires de variétés) sur un espace multidimensionnel. C’est le
travail que nous avons fait dans la section 10.6, qui a porté sur l’analyse multidimensionnelle. Nous avons
d’abord fourni la représentation des variétés sur un plan multidimensionnel puis sur une carte
multidimensionnelle.
L’analyse multidimensionnelle, notamment le plan bidimensionnel, nous a permis de confirmer
l’existence des trois zones infradialectales mises en évidence lors de l’analyse par point de référence. Nous
avons vu une frontière nette entre le grand groupe occidental et le grand groupe oriental, ainsi qu’une
séparation bien visible entre le sous-groupe proche oriental (vallée de la Soummam) et le sous-groupe
extrême oriental (tasaḥlit). Par contre, la subdivision du groupe occidental s’est avérée bien plus difficile.
Les cartes et les plans MDS ont aussi permis de découvrir le continuum dialectal en Kabylie. Nous
avons pu voir les zones de transition entre les trois groupes mis en évidence (voir Figure 95). Les cartes
MDS nous ont permis de montrer la graduation de la variation en passant d’un parler à un autre et d’une
3
Saïd GUERRAB
Résumé de la thèse
Analyse dialectométrique des parlers berbères de Kabylie
zone à une autre. Nous avons donc atteint l’un de nos objectifs de départ qui était la découverte du
continuum dialectal en Kabylie.
Enfin, nous avons terminé notre analyse dialectométrique avec l’analyse de grappes (Cluster
Analysis en anglais). Nous avons regroupé les parlers avec l’algorithme de Ward’s Method. Nous avons
testé, successivement, les trois matrices de distances : matrice binaire, matrice d’Euclide et matrice de
Manhattan. Pour chaque matrice, nous avons regroupé les parlers : en deux groupes, puis en trois groupes,
puis en quatre groupes et enfin en cinq groupes.
Nous nous sommes arrêtés sur le regroupement en cinq groupes, car les trois méthodes ont
convergé à cette étape en donnant les mêmes groupes. La matrice d’Euclide et la matrice de Manhattan
ont donné deux cartes de groupes identiques (les frontières des groupes se superposent parfaitement). La
matrice binaire a produit un résultat légèrement différent concernant les frontières du groupe oriental.
Toutefois, chacune des trois matrices a produit une ramification différente. Par exemple, la
méthode d’Euclide divise le groupe occidental en sous-groupes « proche occidental » et « extrême
occidental » (division verticale), avant de partager le sous-groupe proche occidental en deux sous-groupes
« nord occidental » et « sud occidental ». Alors que la méthode binaire et la méthode de Manhattan
divisent d’abord le groupe occidental d’une façon horizontale « nord » et « sud » avant de continuer la
subdivision en trois sous-groupes (voir section 10.7.3 et section 10.7.4). La classification finale est proposée
dans le chapitre qui succède et qui porte sur la validation des résultats.
Nous avons consacré le dernier chapitre de la thèse à la validation des résultats. La validation des
résultats s’est faite en deux parties : nous avons d’abord validé les différences linguistiques entre les
parlers (section 11.1), puis nous avons procédé à la validation des groupes linguistiques obtenus et nous
avons proposé une classification finale sur la base de cette validation.
Pour la validation des différences linguistiques entre les parlers, nous avons utilisé des méthodes
statistiques pour valider les valeurs numériques obtenues. Nous avons obtenu un indice d’incohérence
locale proche de zéro qui constitue la valeur optimale : la distance de Manhattan et la distance euclidienne
ont donné un indice d’une valeur de 0.70 et le calcul binaire a produit un indice d’une valeur de 0.63.
Par la suite, nous avons tracé les diagrammes qui montrent la relation de la différence linguistique
avec la distance géographique. Les trois méthodes ont donné des résultats très satisfaisants, avec une
courbe qui tend vers la diagonale, signe que la différence linguistique est proportionnelle à la distance
géographique.
Et enfin, nous avons terminé par le calcul du coefficient alpha de Cronbach. Les trois méthodes
utilisées ont fourni un excellent résultat : le calcul binaire et la distance de Manhattan ont donné un
coefficient d’une valeur de 0.94 et la distance euclidienne a donné un coefficient d’une valeur de 0.93. Ces
valeurs sont proches de la valeur idéale qui est 1 (un).
Concernant la validation des groupes et la proposition d’une classification des parlers kabyles, nous
avons d’abord comparé les cartes issues de l’analyse de grappes avec les plans bidimensionnels
correspondants. Cette comparaison a confirmé le fait que le groupe occidental se montre très solidaire et
les parlers sont bien plus difficiles à subdiviser en groupes.
Puis nous avons combiné les cartes de groupes avec les cartes MDS, qui ont donné un type de
cartes appelé « fuzzy cluster maps » (cartes de groupes floues). Cette dernière procédure s’est avérée être
le meilleur moyen de valider les zones linguistiques pertinentes et nous sommes arrivés à la conclusion
4
Saïd GUERRAB
Résumé de la thèse
Analyse dialectométrique des parlers berbères de Kabylie
suivante : la distance de Manhattan a produit le meilleur résultat pour classifier les parlers kabyles (voir
page 347 pour la classification retenue).
En dernier lieu, nous avons comparé les résultats de notre classification avec les classifications des
parlers kabyles proposés dans des travaux antérieurs. Nous les avons d’abord comparés avec la
classification proposée par MADOUI (1995) (1995) et nous avons conclu que sa classification des parlers de
la Petite-Kabylie correspond à notre subdivision du groupe oriental en groupe proche oriental et groupe
extrême oriental. Finalement, nous avons comparé notre classification avec celle proposée par NAITZERRAD (2005) et nous avons conclu que les deux classifications divergent, notamment en ce que concerne
la subdivision du groupe occidental.
K. NAIT-ZERRAD
5