Comment se faire comprendre par un ordinateur ?

Transcription

Comment se faire comprendre par un ordinateur ?
2013
Comment se faire comprendre
par un ordinateur ?
Informatique, Traitement automatique des langues
Alejandra Lorenzo
est jeune chercheuse au laboratoire lorrain de recherche en
informatique et ses applications (LORIA). Elle travaille dans l’équipe SYNALP, qui s’intéresse
au traitement automatique du langage naturel*. Le traitement automatique du langage naturel
est une discipline à la frontière de la linguistique*, de l’informatique et de l’intelligence artificielle,
qui vise à appliquer des programmes et des techniques informatiques à tous les aspects du
langage humain. Dans ses recherches, Alejandra étudie en particulier différentes méthodes pour
améliorer l’interprétation faite par l’ordinateur dans des systèmes de dialogue homme-machine.
* Langage naturel ou «langage ordinaire» : c’est la langue parlée par un être humain, en opposition
à d’autres langages comme le langage informatique.
* Linguistique : Science qui étudie la langue
«Il y a une différence entre être éduqué et être sage. L’instruction est donnée par l’école alors
que la sagesse vient avec la connaissance de soi et du monde. Elle s’acquière donc avec l’âge,
avec la vie. La science apporte à l’homme la sécurité apparente de la connaissance, alors que la
sagesse rend la conscience sereine. L’homme doit donc sans cesse apprendre, tout en cherchant la
sagesse....» (Ramiro Garza). Ces mots appartiennent à un texte qu’un professeur de lycée
m’a confié. Ils ont vraiment marqué ma réflexion sur la science.
D’après l’Experimentarium de Bourgogne
alejan.indd 1
19/06/13 14:28
Dans sa vie quotidienne, l’Homme est
de plus en plus souvent amené à parler
avec un ordinateur. Il peut par exemple
utiliser une commande vocale dans
certaines voitures, ou bien encore les
services d’un assistant personnel sur son
téléphone portable ou d’un assistant
virtuel comme Léa, présente sur le site
d’aide de Voyages-SNCF. Pour pouvoir
comprendre l’utilisateur, l’ordinateur est
équipé d’un système de dialogue capable
d’interpréter des énoncés en langage
naturel relativement simples, puis de
traiter l’information reçue, en répondant
par exemple à une question posée par
l’utilisateur.
Ces systèmes de dialogue hommemachine
sont
des
programmes
informatiques qui fonctionnent par
étapes. Alejandra travaille sur les
premières étapes qui consistent à
permettre à l’ordinateur d’interpréter le
sens d’un texte produit par l’homme, puis
à transformer c’est-à-dire à coder* cette
information en langage informatique.
Les informations codées vont être
utilisées par l’ordinateur pour répondre à
l’utilisateur mais la qualité de la réponse
dépend de la bonne interprétation
par l’ordinateur du texte de départ. La
difficulté de cette interprétation est liée
au fait que le sens d’un mot dépend
fortement du contexte dans lequel il est
utilisé.
Dans son travail, Alejandra utilise deux
méthodes différentes pour coder* le sens
d’une phrase sous forme informatique.
La première méthode consiste à
attribuer un sens unique à la phrase prise
globalement. La deuxième méthode
consiste à repérer dans la phrase les
mots les plus importants pour en
comprendre le sens, en se basant sur la
syntaxe de la phrase. Comme une même
idée peut s’exprimer d’une multitude
de façon, l’étape de codage sous forme
informatique est difficile à réaliser.
Alejandra a développé et appliqué de
nouvelles méthodes basées sur des
analyses mathématiques de probabilités.
Celles-ci lui permettent de faire
correspondre avec plus de fiabilité le sens
d’une phrase avec le code informatique
dans le programme qu’elle développe.
*Coder : passer d’une forme de phrase avec des mots à une représentation en langage informatique
Objectifs/applications:
Développer des systèmes de dialogue
• Capables de comprendre de nouvelles expressions du langage naturel de l’utilisateur.
• Pouvant être facilement utilisés dans différents domaines ou situations. En effet, la plupart des
systèmes de dialogue actuels, comme les assistants virtuels ou les systèmes de réservation, ne sont
applicables qu’à des domaines ou des situations spécifiques car la façon la plus courante de coder
le sens de phrases consiste à attribuer un sens unique de la phrase entière, qui dépend fortement
du contexte du dialogue.
À long terme, développer un système de dialogue qui est capable d’apprendre et de s’adapter
au fil du temps comme le font les humains.
alejan.indd 2
19/06/13 14:28