Intelligence artificielle

Transcription

Intelligence artificielle
Intelligence artificielle
Agents intelligents
Elise Bonzon
[email protected]
LIPADE - Université Paris Descartes
http://www.math-info.univ-paris5.fr/vbonzon/
1
Agents intelligents
1. Agents et environnement
2. Rationalité
3. PEAS
4. Types d’environnement
5. Structure des agents
6. Conclusion
2
Agents et environnement
Agents et environnement
Les agents peuvent être des humains, des robots, des logiciels, des
thermostats...
sensors
percepts
?
environment
actions
agent
actuators
S. Russell and P. Norvig. Artificial Intelligence : A Modern Approach. 2002.
3
Le monde de l’aspirateur
A
B
• Percepts : emplacement et état de propreté e.g., [A, Sale]
• Actions : Gauche, Droite, Aspire, Rien
4
Le monde de l’aspirateur
Percepts
[A, Propre]
[A, Sale]
[B, Propre]
[B, Sale]
Action
Droite
Aspire
Gauche
Aspire
Agent aspirateur
function Reflex-Vacuum-Agent(location, status) return an action
if status = Dirty then return Suck
else if location = A then return Right
else if location = B then return Left
5
Rationalité
Rationalité
• Une mesure de performance évalue l’environnement
• Un point par emplacement nettoyé dans le temps t ?
• Un point par emplacement propre à chaque pas de temps, moins 1
point par action effectuée ?
• Un agent rationnel choisit l’action qui maximise la valeur attendue
de la mesure de performance en fonction de la séquence de percepts
obtenue jusque là
6
Rationalité
• Une mesure de performance évalue l’environnement
• Un point par emplacement nettoyé dans le temps t ?
• Un point par emplacement propre à chaque pas de temps, moins 1
point par action effectuée ?
• Un agent rationnel choisit l’action qui maximise la valeur attendue
de la mesure de performance en fonction de la séquence de percepts
obtenue jusque là
• Rationnel 6= omniscient
→ les percepts ne permettent peut-être pas d’obtenir toutes les
informations utiles
6
Rationalité
• Une mesure de performance évalue l’environnement
• Un point par emplacement nettoyé dans le temps t ?
• Un point par emplacement propre à chaque pas de temps, moins 1
point par action effectuée ?
• Un agent rationnel choisit l’action qui maximise la valeur attendue
de la mesure de performance en fonction de la séquence de percepts
obtenue jusque là
• Rationnel 6= omniscient
→ les percepts ne permettent peut-être pas d’obtenir toutes les
informations utiles
• Rationnel 6= clairvoyant
→ les actions peuvent ne pas avoir les effets escomptés
6
Rationalité
• Une mesure de performance évalue l’environnement
• Un point par emplacement nettoyé dans le temps t ?
• Un point par emplacement propre à chaque pas de temps, moins 1
point par action effectuée ?
• Un agent rationnel choisit l’action qui maximise la valeur attendue
de la mesure de performance en fonction de la séquence de percepts
obtenue jusque là
• Rationnel 6= omniscient
→ les percepts ne permettent peut-être pas d’obtenir toutes les
informations utiles
• Rationnel 6= clairvoyant
→ les actions peuvent ne pas avoir les effets escomptés
⇒ Rationnel 6= efficace
6
Rationalité
• Une mesure de performance évalue l’environnement
• Un point par emplacement nettoyé dans le temps t ?
• Un point par emplacement propre à chaque pas de temps, moins 1
point par action effectuée ?
• Un agent rationnel choisit l’action qui maximise la valeur attendue
de la mesure de performance en fonction de la séquence de percepts
obtenue jusque là
• Rationnel 6= omniscient
→ les percepts ne permettent peut-être pas d’obtenir toutes les
informations utiles
• Rationnel 6= clairvoyant
→ les actions peuvent ne pas avoir les effets escomptés
⇒ Rationnel 6= efficace
⇒ Un agent rationnel explore, apprend, est autonome
6
PEAS
PEAS
• PEAS : Performance measure, Environment, Actuators, Sensors
• Pour concevoir un agent rationnel, il faut pouvoir spécifier son
environnement
• Exemple : Taxi automatisé
•
•
•
•
Mesure de performance :
Environnement :
Actionneurs :
Capteurs :
7
PEAS
• PEAS : Performance measure, Environment, Actuators, Sensors
• Pour concevoir un agent rationnel, il faut pouvoir spécifier son
environnement
• Exemple : Taxi automatisé
•
•
•
•
Mesure de performance : sécurité, destination, profits, confort, . . .
Environnement :
Actionneurs :
Capteurs :
7
PEAS
• PEAS : Performance measure, Environment, Actuators, Sensors
• Pour concevoir un agent rationnel, il faut pouvoir spécifier son
environnement
• Exemple : Taxi automatisé
•
•
•
•
Mesure de performance : sécurité, destination, profits, confort, . . .
Environnement : rues, traffic, piétons, temps, . . .
Actionneurs :
Capteurs :
7
PEAS
• PEAS : Performance measure, Environment, Actuators, Sensors
• Pour concevoir un agent rationnel, il faut pouvoir spécifier son
environnement
• Exemple : Taxi automatisé
•
•
•
•
Mesure de performance : sécurité, destination, profits, confort, . . .
Environnement : rues, traffic, piétons, temps, . . .
Actionneurs : volant, accélérateur, frein, klaxon, . . .
Capteurs :
7
PEAS
• PEAS : Performance measure, Environment, Actuators, Sensors
• Pour concevoir un agent rationnel, il faut pouvoir spécifier son
environnement
• Exemple : Taxi automatisé
•
•
•
•
Mesure de performance : sécurité, destination, profits, confort, . . .
Environnement : rues, traffic, piétons, temps, . . .
Actionneurs : volant, accélérateur, frein, klaxon, . . .
Capteurs : vidéo, accéléromètre, GPS, . . .
7
Types d’environnement
Types d’environnement
• Totalement observable vs. Partiellement observable
• Mono agent vs. Multi agent
• Déterministe vs. Stochastique
• Episodique vs. Séquentiel
• Statique vs. Dynamique
• Discret vs. Continu
8
Types d’environnement
• Totalement observable vs. Partiellement observable
• Mono agent vs. Multi agent
• Déterministe vs. Stochastique
• Episodique vs. Séquentiel
• Statique vs. Dynamique
• Discret vs. Continu
⇒ Monde réel ?
8
Types d’environnement
• Totalement observable vs. Partiellement observable
• Mono agent vs. Multi agent
• Déterministe vs. Stochastique
• Episodique vs. Séquentiel
• Statique vs. Dynamique
• Discret vs. Continu
⇒ Monde réel ?
8
Types d’environnement
• Totalement observable vs. Partiellement observable
• Mono agent vs. Multi agent
• Déterministe vs. Stochastique
• Episodique vs. Séquentiel
• Statique vs. Dynamique
• Discret vs. Continu
⇒ Monde réel ?
8
Types d’environnement
• Totalement observable vs. Partiellement observable
• Mono agent vs. Multi agent
• Déterministe vs. Stochastique
• Episodique vs. Séquentiel
• Statique vs. Dynamique
• Discret vs. Continu
⇒ Monde réel ?
8
Types d’environnement
• Totalement observable vs. Partiellement observable
• Mono agent vs. Multi agent
• Déterministe vs. Stochastique
• Episodique vs. Séquentiel
• Statique vs. Dynamique
• Discret vs. Continu
⇒ Monde réel ?
8
Types d’environnement
• Totalement observable vs. Partiellement observable
• Mono agent vs. Multi agent
• Déterministe vs. Stochastique
• Episodique vs. Séquentiel
• Statique vs. Dynamique
• Discret vs. Continu
⇒ Monde réel ?
8
Types d’environnement
• Totalement observable vs. Partiellement observable
• Mono agent vs. Multi agent
• Déterministe vs. Stochastique
• Episodique vs. Séquentiel
• Statique vs. Dynamique
• Discret vs. Continu
⇒ Monde réel ?
8
Types d’environnement
Observable
Déterministe
Episodique
Statique
Discret
Agent
Echecs
Mots croisés
Poker
Diag. médical
Taxi
Analyse d’images
9
Types d’environnement
Echecs
Mots croisés
Poker
Diag. médical
Taxi
Analyse d’images
Observable
Totalement
Déterministe
Déterministe
Episodique
Sequentiel
Statique
Statique
Discret
Discret
Agent
Multi
9
Types d’environnement
Echecs
Mots croisés
Poker
Diag. médical
Taxi
Analyse d’images
Observable
Totalement
Totalement
Déterministe
Déterministe
Déterministe
Episodique
Séquentiel
Séquentiel
Statique
Statique
Statique
Discret
Discret
Discret
Agent
Multi
Mono
9
Types d’environnement
Echecs
Mots croisés
Poker
Diag. médical
Taxi
Analyse d’images
Observable
Totalement
Totalement
Partiellement
Déterministe
Déterministe
Déterministe
Stochastique
Episodique
Séquentiel
Séquentiel
Séquentiel
Statique
Statique
Statique
Statique
Discret
Discret
Discret
Discret
Agent
Multi
Mono
Multi
9
Types d’environnement
Echecs
Mots croisés
Poker
Diag. médical
Taxi
Analyse d’images
Observable
Totalement
Totalement
Partiellement
Partiellement
Déterministe
Déterministe
Déterministe
Stochastique
Stochastique
Episodique
Séquentiel
Séquentiel
Séquentiel
Séquentiel
Statique
Statique
Statique
Statique
Dynamique
Discret
Discret
Discret
Discret
Continu
Agent
Multi
Mono
Multi
Mono
9
Types d’environnement
Echecs
Mots croisés
Poker
Diag. médical
Taxi
Analyse d’images
Observable
Totalement
Totalement
Partiellement
Partiellement
Partiellement
Déterministe
Déterministe
Déterministe
Stochastique
Stochastique
Stochastique
Episodique
Séquentiel
Séquentiel
Séquentiel
Séquentiel
Séquentiel
Statique
Statique
Statique
Statique
Dynamique
Dynamique
Discret
Discret
Discret
Discret
Continu
Continu
Agent
Multi
Mono
Multi
Mono
Multi
9
Types d’environnement
Echecs
Mots croisés
Poker
Diag. médical
Taxi
Analyse d’images
Observable
Totalement
Totalement
Partiellement
Partiellement
Partiellement
Totalement
Déterministe
Déterministe
Déterministe
Stochastique
Stochastique
Stochastique
Déterministe
Episodique
Séquentiel
Séquentiel
Séquentiel
Séquentiel
Séquentiel
Episodique
Statique
Statique
Statique
Statique
Dynamique
Dynamique
Statique
Discret
Discret
Discret
Discret
Continu
Continu
Discret
Agent
Multi
Mono
Multi
Mono
Multi
Mono
9
Structure des agents
Structure des agents
• Agent = architecture + programme
• Architecture : système, capteurs, actionneurs...
• Programme : 4 types basiques
•
•
•
•
Agent
Agent
Agent
Agent
réflexe simple
réfexe avec état
focalisé sur l’objectif
focalisé sur l’utilité
10
Agent réflexe simple
Agent
Sensors
Condition−action rules
What action I
should do now
Environment
What the world
is like now
Actuators
11
Agent réflexe avec état
Sensors
State
How the world evolves
What my actions do
Condition−action rules
Agent
What action I
should do now
Environment
What the world
is like now
Actuators
12
Agent focalisé sur l’objectif
Sensors
State
What the world
is like now
What my actions do
What it will be like
if I do action A
Goals
What action I
should do now
Agent
Environment
How the world evolves
Actuators
13
Agent focalisé sur l’utilité
Sensors
State
What the world
is like now
What my actions do
What it will be like
if I do action A
Utility
How happy I will be
in such a state
What action I
should do now
Agent
Environment
How the world evolves
Actuators
14
Conclusion
Conclusion
• Les agents intéragissent avec leur environnement à travers des
capteurs et des actionneurs
• La mesure de performance évalue l’environnement
• Un agent rationnel maximise la performance attendue
• La fonction de l’agent décrit ce que l’agent doit faire en toute
circonstance
• Le programme de l’agent implémente des fonctions d’agent
• Le PEAS permet de spécifier l’environnement
15

Documents pareils