Analyse dialectométrique des parlers berbères de Kabylie
Transcription
Analyse dialectométrique des parlers berbères de Kabylie
Saïd GUERRAB Analyse dialectométrique des parlers berbères de Kabylie Résumé de la thèse (pour affichage) Il est difficile de parler du berbère sans parler de la variation. Il y a d’abord une variation au niveau interdialectal. Les dialectes berbères sont tellement différents que l’intercompréhension est rarement assurée entre un dialecte et un autre. Les différences sont à tous les niveaux : phonético-phonologique, sémantique, lexical et morphosyntaxique. Ensuite, chaque dialecte (kabyle, rifain, touareg…) connaît une variation interne, parfois extrêmement importante. Pourtant, cette variation a rarement bénéficié d’une analyse systématique. D’ailleurs, la classification des dialectes et parlers berbères reste toujours problématique. Seul le rifain a récemment bénéficié d’une étude systématique (LAFKIOUI, 2009). Les quelques études sur la variation en kabyle ont été soit restreintes à une zone microdialectale (ex. MADOUI, 1995), soit basées sur un corpus limité (ex. NAIT-ZERRAD, 2005). Nous avons donc voulu mener une analyse systématique de la variation en Kabylie, à l’aide des méthodes de la dialectométrie et ce pour atteindre plusieurs objectifs. Les deux principaux objectifs, inhérents à toute étude dialectométrique, étaient la mise en évidence du continuum dialectal qui existe en Kabylie et la classification des parlers kabyles sur la base d’une méthode objective et à partir d’un corpus large. Notre troisième objectif, qui rentre plutôt dans le cadre de la perspective, était la préparation d’un atlas linguistique kabyle basé sur le corpus recueilli dans le cadre de cette étude, car le seul travail de ce genre qui existe est celui de BASSET (1929) et n’inclut que quelques termes relatifs au corps humain. Nous avons commencé notre étude par un chapitre préliminaire où nous avons fourni quelques généralités sur le berbère en nous focalisant sur le dialecte kabyle. Ce chapitre nous a permis de donner une vue d’ensemble de notre domaine d’étude à un lecteur non-spécialiste. A la fin du chapitre, dans la section 2.6, nous avons fait l’inventaire phonétique du kabyle, nécessaire au travail d’analyse dialectométrique. Pour faire une analyse dialectométrique, nous avions besoin d’examiner la variation linguistique en berbère d’une manière générale et en kabyle particulièrement. C’est ce que nous avons pu faire dans le chapitre « 3. Variation en berbère ». Nous avons parlé de la variation aussi bien au niveau interdialectal (section 3.2) qu’au niveau intradialectal (section 3.3). Nous avons classé la variation en quatre catégories : variation phonétique, variation lexicale, variation sémantique et variation morphosyntaxique. Du fait que notre étude porte sur le kabyle, nous avons traité la variation entre les parlers kabyles avec beaucoup plus de détails. Cet examen détaillé, nous a permis d’élaborer notre grille d’enquête avant d’aller sur le terrain. La variation en berbère, comme nous l’avons présentée dans le chapitre 3, a déjà suscité l’intérêt des berbérisants depuis l’aube des études berbères. Ainsi, pour placer notre recherche dans le contexte Saïd GUERRAB Résumé de la thèse Analyse dialectométrique des parlers berbères de Kabylie des études berbères, nous avons fait, dans le chapitre 4, l’état des lieux des études comparatives qui ont porté, soit sur plusieurs dialectes soit sur un dialecte en particulier. Nous avons classé ces travaux antérieurs en plusieurs catégories : études de géolinguistique, études contrastives, études de classification et études dialectométriques. Nous avons, notamment, conclu que le champ de la dialectométrie n’est pas encore bien exploré dans le domaine berbère. Cette conclusion justifie donc notre l’intérêt pour une analyse dialectométrique des parlers kabyles. Pour mener une étude de dialectométrie, qui est une discipline relativement récente et en pleine évolution, nous avons voulu, d’abord, dresser l’état de l’art des méthodes de dialectologie pour comparer un ensemble de variétés. C’est ce que nous avons fait dans le chapitre 5. Nous avons classé ces méthodes en trois grandes catégories : méthodes traditionnelles, méthodes perceptuelles et méthodes informatiques. En commençant par les méthodes les plus anciennes (les méthodes traditionnelles) à l’exemple de la méthode d’isoglosses, aux méthodes les plus récentes (méthodes informatiques) comme les méthodes de dialectométrie. La comparaison des différentes méthodes, notamment celles qui rentrent dans le champ de la dialectométrie, nous a conduits à choisir la méthode Levenshtein comme étant la meilleure méthode pour classifier un ensemble de variétés linguistiques. C’est la conclusion de la section 5.4.5. La méthode Levenshtein, appelée aussi « distance d’édition », reste encore une méthode obscure pour la plupart des dialectologues, bien qu’elle soit très utilisée dans d’autres disciplines comme le traitement automatique des langues ou la comparaison des séquences d’ADN en génétique. C’est la raison pour laquelle nous avons consacré le chapitre 6 à la présentation de cette méthode. La mise en œuvre de la méthode de Levenshtein ou toute autre méthode dialectométrique, nécessite l’utilisation de logiciels ou d’applications en ligne. Ce sont ces outils que nous avons explorés au cours du chapitre 7. Nous avons fait une brève description des trois principaux outils utilisés en dialectométrie : le logiciel VDM (méthode de GOEBL), le logiciel RUG/L04 (calcul binaire, méthode de GOEBL et distance de Levenshtein) et enfin l’application en ligne Gabmap (distance de Levenshtein). La comparaison des trois solutions, nous a permis de choisir l’application en ligne Gabmap pour analyser nos données. Avant de commencer l’analyse des données, il faut d’abord les présenter. C’est ce que nous avons accompli dans le chapitre 8, consacré à la présentation du corpus et du terrain d’enquête. Nous avons commencé le chapitre par des informations très générales sur notre domaine d’enquête qui est la Kabylie. Nous avons fini le chapitre avec des informations très spécifiques à notre travail, comme l’inventaire des sons (unités phoniques) et des variantes (unités lexicales et unités syntaxiques) du corpus. Après avoir présenté les données indépendamment des localités (points d’enquête) dans le chapitre 8, nous avons voulu, à travers le chapitre 9, lier les différentes variantes aux différents endroits où elles ont été recueillies. Les cartes linguistiques sont le meilleur moyen pour accomplir cette tâche. Nous avons élaboré une quinzaine de cartes géolinguistiques pour donner un visage aux données recueillies sur le terrain. Nous avons classé les cartes en trois catégories : cartes phonétiques, cartes lexicales et cartes morphosyntaxiques. 2 Saïd GUERRAB Résumé de la thèse Analyse dialectométrique des parlers berbères de Kabylie Ce chapitre nous a aussi permis de réaliser l’un de nos objectifs de départ qui consistait à mettre des bases à l’élaboration d’un atlas linguistique des parlers kabyles. Puisque nous avons un corpus adéquat et nous avons acquis les techniques nécessaires pour l’élaboration des cartes linguistiques. Après avoir présenté les différents préalables à notre analyse (la méthode Levenshtein, les outils d’analyse, le terrain d’enquête, corpus, …) nous sommes passés, tout naturellement, dans le chapitre 10, à l’analyse dialectométrique des données. Ce chapitre constitue la partie purement applicative de notre étude. Nous nous sommes servis de Gabmap pour suivre toutes les étapes d’une analyse dialectométrique. En commençant par la distribution des variantes, qui a pu nous donner une idée sur les différents groupes de parlers qui partagent telle ou telle variante, jusqu’à l’étape finale qui est l’analyse de grappes qui nous a permis de délimiter les principales zones infra dialectales en Kabylie. Pour mesurer la distance entre les paires de variantes, nous avons appliqué, dans la section 10.3, trois méthodes différentes pour le calcul de la différence entre les unités phoniques : calcul binaire, formule euclidienne et formule de Manhattan. Les trois méthodes ont donné des résultats cohérents. La distance linguistique (valeur numérique) entre deux variantes est globalement proportionnelle à la différence linguistique entre ces deux dernières. Par la suite, dans la section 10.4, nous avons fourni des extraits des matrices des distances entre les variétés, avec chacune des méthodes suivies. La matrice obtenue avec le calcul binaire, celle obtenue avec la distance de Manhattan et enfin celle obtenue avec la distance d’Euclide. La comparaison des trois matrices a montré une cohérence de la méthode Levenshtein sous les trois distances. Deux variétés très proches dans la matrice du calcul binaire sont forcément très proches dans les deux autres matrices et vice-versa. Après avoir obtenu les matrices de distances entre les variétés (parlers), nous avons voulu voir le résultat qu’on obtiendra si l’on comparaît une variété avec l’ensemble des autres variétés. C’est ce que nous avons achevé à travers la section 10.5, qui a porté sur la variation vue d’un point de référence. Nous avons pris des points de références éloignées et d’une façon à représenter les quatre points cardinaux de notre domaine d’enquête. Les cartes dialectométriques et les diagrammes obtenus dans cette section nous ont permis de dégager trois zones infradialectales hypothétiques : la zone extrême orientale, la zone orientale (ou proche orientale) et la zone occidentale. Représenter l’ensemble des différences linguistiques entre les variétés revient à projeter les valeurs numériques (distance numérique entre les paires de variétés) sur un espace multidimensionnel. C’est le travail que nous avons fait dans la section 10.6, qui a porté sur l’analyse multidimensionnelle. Nous avons d’abord fourni la représentation des variétés sur un plan multidimensionnel puis sur une carte multidimensionnelle. L’analyse multidimensionnelle, notamment le plan bidimensionnel, nous a permis de confirmer l’existence des trois zones infradialectales mises en évidence lors de l’analyse par point de référence. Nous avons vu une frontière nette entre le grand groupe occidental et le grand groupe oriental, ainsi qu’une séparation bien visible entre le sous-groupe proche oriental (vallée de la Soummam) et le sous-groupe extrême oriental (tasaḥlit). Par contre, la subdivision du groupe occidental s’est avérée bien plus difficile. Les cartes et les plans MDS ont aussi permis de découvrir le continuum dialectal en Kabylie. Nous avons pu voir les zones de transition entre les trois groupes mis en évidence (voir Figure 95). Les cartes MDS nous ont permis de montrer la graduation de la variation en passant d’un parler à un autre et d’une 3 Saïd GUERRAB Résumé de la thèse Analyse dialectométrique des parlers berbères de Kabylie zone à une autre. Nous avons donc atteint l’un de nos objectifs de départ qui était la découverte du continuum dialectal en Kabylie. Enfin, nous avons terminé notre analyse dialectométrique avec l’analyse de grappes (Cluster Analysis en anglais). Nous avons regroupé les parlers avec l’algorithme de Ward’s Method. Nous avons testé, successivement, les trois matrices de distances : matrice binaire, matrice d’Euclide et matrice de Manhattan. Pour chaque matrice, nous avons regroupé les parlers : en deux groupes, puis en trois groupes, puis en quatre groupes et enfin en cinq groupes. Nous nous sommes arrêtés sur le regroupement en cinq groupes, car les trois méthodes ont convergé à cette étape en donnant les mêmes groupes. La matrice d’Euclide et la matrice de Manhattan ont donné deux cartes de groupes identiques (les frontières des groupes se superposent parfaitement). La matrice binaire a produit un résultat légèrement différent concernant les frontières du groupe oriental. Toutefois, chacune des trois matrices a produit une ramification différente. Par exemple, la méthode d’Euclide divise le groupe occidental en sous-groupes « proche occidental » et « extrême occidental » (division verticale), avant de partager le sous-groupe proche occidental en deux sous-groupes « nord occidental » et « sud occidental ». Alors que la méthode binaire et la méthode de Manhattan divisent d’abord le groupe occidental d’une façon horizontale « nord » et « sud » avant de continuer la subdivision en trois sous-groupes (voir section 10.7.3 et section 10.7.4). La classification finale est proposée dans le chapitre qui succède et qui porte sur la validation des résultats. Nous avons consacré le dernier chapitre de la thèse à la validation des résultats. La validation des résultats s’est faite en deux parties : nous avons d’abord validé les différences linguistiques entre les parlers (section 11.1), puis nous avons procédé à la validation des groupes linguistiques obtenus et nous avons proposé une classification finale sur la base de cette validation. Pour la validation des différences linguistiques entre les parlers, nous avons utilisé des méthodes statistiques pour valider les valeurs numériques obtenues. Nous avons obtenu un indice d’incohérence locale proche de zéro qui constitue la valeur optimale : la distance de Manhattan et la distance euclidienne ont donné un indice d’une valeur de 0.70 et le calcul binaire a produit un indice d’une valeur de 0.63. Par la suite, nous avons tracé les diagrammes qui montrent la relation de la différence linguistique avec la distance géographique. Les trois méthodes ont donné des résultats très satisfaisants, avec une courbe qui tend vers la diagonale, signe que la différence linguistique est proportionnelle à la distance géographique. Et enfin, nous avons terminé par le calcul du coefficient alpha de Cronbach. Les trois méthodes utilisées ont fourni un excellent résultat : le calcul binaire et la distance de Manhattan ont donné un coefficient d’une valeur de 0.94 et la distance euclidienne a donné un coefficient d’une valeur de 0.93. Ces valeurs sont proches de la valeur idéale qui est 1 (un). Concernant la validation des groupes et la proposition d’une classification des parlers kabyles, nous avons d’abord comparé les cartes issues de l’analyse de grappes avec les plans bidimensionnels correspondants. Cette comparaison a confirmé le fait que le groupe occidental se montre très solidaire et les parlers sont bien plus difficiles à subdiviser en groupes. Puis nous avons combiné les cartes de groupes avec les cartes MDS, qui ont donné un type de cartes appelé « fuzzy cluster maps » (cartes de groupes floues). Cette dernière procédure s’est avérée être le meilleur moyen de valider les zones linguistiques pertinentes et nous sommes arrivés à la conclusion 4 Saïd GUERRAB Résumé de la thèse Analyse dialectométrique des parlers berbères de Kabylie suivante : la distance de Manhattan a produit le meilleur résultat pour classifier les parlers kabyles (voir page 347 pour la classification retenue). En dernier lieu, nous avons comparé les résultats de notre classification avec les classifications des parlers kabyles proposés dans des travaux antérieurs. Nous les avons d’abord comparés avec la classification proposée par MADOUI (1995) (1995) et nous avons conclu que sa classification des parlers de la Petite-Kabylie correspond à notre subdivision du groupe oriental en groupe proche oriental et groupe extrême oriental. Finalement, nous avons comparé notre classification avec celle proposée par NAITZERRAD (2005) et nous avons conclu que les deux classifications divergent, notamment en ce que concerne la subdivision du groupe occidental. K. NAIT-ZERRAD 5