Analyse Syntaxique Automatique en Tamazight (Kabyle)

Transcription

Analyse Syntaxique Automatique en Tamazight (Kabyle)
Analyse Syntaxique Automatique en Tamazight
(Kabyle)
Yamouni Farida1
1
Université Mouloud Mammeri Tizi Ouzou Algérie
[email protected]
Résumé .
Dans cet article nous présentons la description des grammaires
syntaxiques pour la phrase simple en Tamazight (kabyle) en vue
de l’analyse syntaxique automatique de phrases. Nous retenons
la phrase simple déclarative, avec la phrase simple nominale et la
phrase simple verbale. Nos travaux entrent dans le cadre du
module Tamazight (kabyle). Nous élaborons les ressources
linguistiques utilisées pour l’analyse syntaxique et nous
décrivons les mots grammaticaux recensés et utilisés, autres que
le nom et le verbe. Nous présentons ensuite les grammaires
syntaxiques construites ainsi que des exemples d’analyse
syntaxique de phrases en Kabyle. L’analyse linguistique qui est
tout d’abord effectuée avant l’analyse syntaxique utilise les
dictionnaires électroniques existants (Aoughlis et al, 2013),
(Aoughlis, 2014) afin de fournir les catégories syntaxiques
utilisées lors de l’analyse syntaxique. Les grammaires
syntaxiques permettant l’analyse sont construites sur1 la base des
travaux de Nait-Zerrad K. à l’aide du système NooJ en vue du
traitement automatique de la langue Tamazight (kabyle). NooJ
est une plate-forme de développement permettant la description
des langues naturelles ou techniques.
1. Introduction
Une implémentation des règles de grammaire est réalisée dans NooJ en vue
de l’analyse syntaxique automatique de phrases.
Nous nous intéressons à la phrase simple déclarative. Nous décrivons la
phrase simple avec ses constituants. Elle est composée d’un énoncé
minimal : EVM (énoncé verbal minimum) ou bien ENM (énoncé nominal
minimum), suivi d’un ou plusieurs compléments (GN : groupe nominal). La
1
http://www.nooj4nlp.net/
YAMOUNI FARIDA
phrase verbale complète est l’EVM. La phrase nominale complète est
l’ENM. Une étude de la grammaire de Tamazight (Kabyle) est faite. Les
grammaires syntaxiques sont construites pour les deux types de phrases
simples. Des tests sont réalisés dans NooJ pour analyser automatiquement
dans NooJ des phrases de la langue retenue. Les résultats sont présentés pour
quelques phrases.
2. La phrase simple
La phrase met en relation deux éléments : un sujet (ce dont on parle) et un
prédicat (ce que l’on dit du sujet), suivis éventuellement de compléments.
Toute phrase est constituée d’un prédicat complété par au moins un groupe
nominal qui lui est lié. Le prédicat peut être verbal ou nominal.
Elle phrase simple est constituée d’un EVM ou ENM suivi d’un ou plusieurs
compléments. Selon (Chaker, 1998), « en berbère, langue à opposition
verbo-nominale, c’est le verbe qui constitue généralement le noyau
prédicatif, dans certains contextes, notamment en proposition relative, le
verbe peut perdre cette fonction et devenir un déterminant lexical équivalent
à un adjectif ».
Le nom peut occuper la fonction de prédicat. Les fonctions du nom
sont (Chaker, 1998 ; Nait-Zerrad, 2001):
- Le CR, complément référentiel ou explicatif : il est marqué par l’état
d’annexion, postposé à l’élément qu’il détermine, souvent le
prédicat ;
- Le COD, complément d’objet direct : c’est le nominal directement
placé soit après le verbe, soit après le CR, il est à l’état libre. Il peut
être remplacé par un pronom affixe complément direct ;
- Le COIND, complément d’objet indirect, est obligatoirement relié au
verbe par la préposition "i", à. Le noyau nominal est à l’état
d’annexion ;
- L’IT, indicateur de thème : le syntagme nominal à l’état libre se
trouve en position initiale, c’est une mise en relief pour annoncer
l’indice de personne ou le pronom personnel ;
- Le CC, complément circonstanciel : il est introduit le plus souvent par
une préposition. On peut avoir plusieurs CC se rapportant à un
même verbe ou équivalent nominal. On trouve le complément direct
ANALYSE SYNTAXIQUE AUTOMATIQUE EN TAMAZIGHT (KABYLE)
3
et les compléments prépositionnels (CC de lieu, cause, but, manière,
moyen, accompagnement, comparaison) ;
- CD, Complément de nom (nom déterminant un autre nom) ou
complément déterminatif, dans ce cas là le nom a une relation
indirecte avec le verbe. Il peut suivre directement le nom déterminé
ou être précédé de la préposition "n", de. Il est toujours à l’état
d’annexion ;
- Adjectif ;
- Participe : le participe est un verbe pour lequel les oppositions de
personnes sont neutralisées, il s’agit donc de constructions de type
relatif dans lesquelles le verbe a perdu sa fonction de prédicat.
2.1. La phrase simple verbale
Elle est constituée d’un EVM (énoncé verbal minimum) suivi d’un ou de
plusieurs compléments : GN, ayant la fonction de COD, COIND, CR, CC,
etc. (Nait-Zerrad, 2001 ; 1995b).
L’EVM est composé d’un verbe + indice de personne.
La structure de la phrase simple verbale est :
EVM/CR(EA)/COD(EL)/COIND/[CC]* ou bien :
EVM (+pCOIND+pCOD+Po)/CR/CR1(COD repris)(EA)/COIND/[CC]
Avec :
COIND= PREP "i" + (N+EA) ;
Po= particule d’orientation ;
pCOD= pronom personnel COD ;
pCOIND= pronom personnel COIND ;
CR1= 2ème CR correspondant au COD, car il reprend un pronom COD.
2.2. La phrase simple non verbale
Elle est constituée d’un EVM (énoncé verbal minimum) suivi d’un ou de
plusieurs compléments : GN ayant la fonction de COD, COIND, CR, CC,
etc. (Nait-Zerrad, 2001 ; 1995b).
Elle est aussi appelée phrase nominale. C’est une phrase sans verbe,
constituée d’un ENM, suivi d’un ou plusieurs compléments ou GN : CR, IT,
CC, adjectif, etc.
YAMOUNI FARIDA
Phr-Simpl-Nom = ENM + GN*
L’ENM contient un nom ou équivalent (jouant le rôle du verbe dans l’EVM),
accompagné d’un élément prédicatif. L’élément prédicatif peut être :
-
La particule "d" dite prédicative, placée devant le nom à l’état libre ;
-
Une préposition ;
-
Un présentatif.
2.2.1.
L’ENM avec la particule prédicative "d" :
L’ENM est composé entre autres de :
-
d + nom : d aqcic ;
-
d + adjectif : d ameqqran ;
-
d + pronom : d nutni ;
2.2.2.
L’ENM avec la préposition "n"
Elle indique l’appartenance, nous avons entre autres :
-
n + pronom ;
-
n + nom : n mmi-s, userwal-agi (CR); Aserwal-agi (IT), n mmi-s ;
-
n + démonstratif : aɣrum, n ta ;
2.2.3.
La phrase simple nominale
Nous avons les exemples suivants :
-
Pronom + ENM : Netta d aqcic. / Lui, c’est un garçon ;
-
Nom + ENM : Axxam d ameqqran / La maison (elle) est grande.
ANALYSE SYNTAXIQUE AUTOMATIQUE EN TAMAZIGHT (KABYLE)
5
3. Les ressources linguistiques pour l’analyse syntaxique
Dans le système NooJ (Silberztein, 2003), les grammaires syntaxiques sont
représentées par des ensembles structurés de graphes ou de règles qui
décrivent des paradigmes syntaxiques stockés dans des fichiers ".nog ".
Pour l’analyse syntaxique automatique, nous avons construit des grammaires
syntaxiques pour l’analyse de la phrase simple verbale et de la phrase
simple nominale.
Une analyse linguistique est d’abord faite pour récupérer les catégories
syntaxiques obtenues grâce à la consultation des dictionnaires élaborés dans
NooJ pour le nom et le verbe. Ces catégories sont utilisées pour l’analyse
syntaxique. Nous avons aussi recensé les mots grammaticaux et complété le
dictionnaire existant.
3.1. Les dictionnaires utilisés
Plusieurs dictionnaires sont utilisés pour l’analyse linguistique, ils
permettent de récupérer les catégories syntaxiques utilisées pour l’analyse
syntaxique. Le dictionnaire des noms et celui des verbes sont décrits dans
(Aoughlis et al, 2013). Le dictionnaire des verbes simples contient 3900
entrées, celui des noms 500 entrées. Les noms et adjectifs qui ont été
dérivés des verbes (Aoughlis, 2014) sont dans le dictionnaire des noms et
adjectifs dérivés.
3.2. Le dictionnaire des mots grammaticaux
Nous avons recensé et codé les catégories syntaxiques (Nait-Zerrad, 1995a)
autres que le nom et le verbe, dans le dictionnaire des mots grammaticaux
qui contient 116 entrées.
YAMOUNI FARIDA
Nous trouvons ci-dessous, un extrait :
Figure1. Extrait de la grammaire des mots grammaticaux
3.3. Les grammaires syntaxiques
Deux grammaires principales sont construites : une pour la phrase simple
verbale et une autre pour la phrase simple nominale.
Les grammaires sont utilisées pour l’analyse syntaxique dans NooJ.
3.3.1. Grammaire syntaxique de la phrase simple nominale
Elle contient 9 graphes.
ANALYSE SYNTAXIQUE AUTOMATIQUE EN TAMAZIGHT (KABYLE)
7
Nous trouvons ci-dessous la grammaire principale PHR-SIMPL-NOM.nog :
Figure2. Extrait de la grammaire PHR-SIMPL-NOM
PHR-SIMPL-NOM est composée d’un ENM suivi d’un GN ou bien d’un
GN suivi d’un ENM.
Nous avons deux sous-graphes ENM et GN. Nous trouvons ci-dessous, le
sous-graphe ENM, avec les règles de grammaires. Quatre sous-graphes sont
utilisés : REL pour la relative, ENMn pour l’ENM avec "n", PRESTAHA et
PRESTAQL.
YAMOUNI FARIDA
Figure3. Le sous-graphe ENM
3.3.2. Grammaire syntaxique de la phrase simple verbale
Nous trouvons ci-dessous la grammaire principale PHR-SIMPL-VERB, avec
par exemple, les sous-graphes EVM, GNL (sous-graphe décrit dans la
figure5 suivante) ou GN état libre, GNA ou GN état d’annexion.
ANALYSE SYNTAXIQUE AUTOMATIQUE EN TAMAZIGHT (KABYLE)
9
Figure4. Extrait de la grammaire PHR-SIMPL-VERB
Figure4. Extrait de la grammaire PHR-SIMPL-VERB
Figure5. Le sous-graphe GNL
YAMOUNI FARIDA
4. Analyse syntaxique de phrases
4.1. Analyse syntaxique d’une phrase simple nominale
-
Soit la phrase à analyser :
Axxam d ameqqran. / La maison (elle) est grande
-
La grammaire utilisée est PHR-SIMPL-NOM.nog
-
Résultats de l’analyse :
Figure6.Arbre d’analyse de la phrase "axxam d ameqqran"
ANALYSE SYNTAXIQUE AUTOMATIQUE EN TAMAZIGHT (KABYLE)
11
Figure7. Arbre syntaxique de la phrase"axxam d ameqqran"
Soit une autre phrase à analyser : amcic-agi n yemma, les résultats sont :
Figure8. Arbre d’analyse de la phrase "amcic-agi n yemma"
YAMOUNI FARIDA
Figure9. Arbre syntaxique de la phrase"amcic-agi n yemma"
4.2. Analyse syntaxique d’une phrase simple verbale
Soit la phrase à analyser : yekcem wergaz yeččan aɣrum ;
la grammaire est PHR-SIMPL-VERB, les résultats des analyses sont :
Figure10. Arbre d’analyse de la phrase "yekcem wergaz yeččan aɣrum"
ANALYSE SYNTAXIQUE AUTOMATIQUE EN TAMAZIGHT (KABYLE)
13
Figure11. Arbre syntaxique de la phrase "yekcem wergaz yeččan aɣrum"
5. Conclusion et perspectives
Dans ce travail nous avons étudié les règles de grammaire du Kabyle, nous
avons construit les ressources linguistiques pour l’analyse syntaxique
automatique. Les travaux réalisés permettent d’analyser les phrases simple et
nominale. Les résultats souhaités sont obtenus et les arbres d’analyse et
syntaxiques sont affichés. Les grammaires développées utilisent les
catégories syntaxiques définies pour les mots grammaticaux de la langue,
ainsi que le nom et le verbe.
Il est envisagé une étude détaillée de la proposition relative avec la mise en
place des grammaires syntaxiques. Une étude de la phrase négative est
prévue.
YAMOUNI FARIDA
Les résultats obtenus peuvent être utilisés pour concevoir et développer un
outil pédagogique pour enseigner la grammaire du Kabyle.
Références
Aoughlis F., Nait-Zerrad K., Annouz H., Aït-Kaci F. and Habet MS. (2013). A new
Tamazight Module for NooJ, In Formalising Natural Languages with NooJ
2013. Selected Papers from the NooJ 2013 International Conference. Svetla
Koeva, Slim Mesfar, Max Silberztein Eds. Cambridge Scholars Publishing:
Newcastle upon Tyne.
Aoughlis ,F. (2014). Noms et adjectifs dérivés en Tamazight, 6ème Edition de la
Conférence Internationale sur Les Technologies d’Information et de
Communication pour l'Amazighe,TICAM’14, IRCAM, Rabat, 24 et 25 novembre
2014. (Actes à paraître aux éditions de l’IRCAM).
Chaker S. (1998). Fonctions, in Filage-Gastel, Encyclopédie Berbère 19 : 28802886. Edisud, Aix-en-Provence.
Nait-Zerrad, K. (1995a). Grammaire du berbère contemporain (kabyle), IMorphologie , Enag Ed. : Alger
Nait-Zerrad, K. (1995b). Grammaire du berbère contemporain (kabyle), II- Syntaxe,
Enag Ed., Alger.
Nait-Zerrad, K. (2001). Grammaire moderne du kabyle, tajerrumt tatrart n
teqbaylit, Karthala, Paris.
Silberztein, M. (2003). Manuel NOOJ. http://www.nooj4nlp.net