Intelligence artificielle
Transcription
Intelligence artificielle
Intelligence artificielle Agents intelligents Elise Bonzon [email protected] LIPADE - Université Paris Descartes http://www.math-info.univ-paris5.fr/vbonzon/ 1 Agents intelligents 1. Agents et environnement 2. Rationalité 3. PEAS 4. Types d’environnement 5. Structure des agents 6. Conclusion 2 Agents et environnement Agents et environnement Les agents peuvent être des humains, des robots, des logiciels, des thermostats... sensors percepts ? environment actions agent actuators S. Russell and P. Norvig. Artificial Intelligence : A Modern Approach. 2002. 3 Le monde de l’aspirateur A B • Percepts : emplacement et état de propreté e.g., [A, Sale] • Actions : Gauche, Droite, Aspire, Rien 4 Le monde de l’aspirateur Percepts [A, Propre] [A, Sale] [B, Propre] [B, Sale] Action Droite Aspire Gauche Aspire Agent aspirateur function Reflex-Vacuum-Agent(location, status) return an action if status = Dirty then return Suck else if location = A then return Right else if location = B then return Left 5 Rationalité Rationalité • Une mesure de performance évalue l’environnement • Un point par emplacement nettoyé dans le temps t ? • Un point par emplacement propre à chaque pas de temps, moins 1 point par action effectuée ? • Un agent rationnel choisit l’action qui maximise la valeur attendue de la mesure de performance en fonction de la séquence de percepts obtenue jusque là 6 Rationalité • Une mesure de performance évalue l’environnement • Un point par emplacement nettoyé dans le temps t ? • Un point par emplacement propre à chaque pas de temps, moins 1 point par action effectuée ? • Un agent rationnel choisit l’action qui maximise la valeur attendue de la mesure de performance en fonction de la séquence de percepts obtenue jusque là • Rationnel 6= omniscient → les percepts ne permettent peut-être pas d’obtenir toutes les informations utiles 6 Rationalité • Une mesure de performance évalue l’environnement • Un point par emplacement nettoyé dans le temps t ? • Un point par emplacement propre à chaque pas de temps, moins 1 point par action effectuée ? • Un agent rationnel choisit l’action qui maximise la valeur attendue de la mesure de performance en fonction de la séquence de percepts obtenue jusque là • Rationnel 6= omniscient → les percepts ne permettent peut-être pas d’obtenir toutes les informations utiles • Rationnel 6= clairvoyant → les actions peuvent ne pas avoir les effets escomptés 6 Rationalité • Une mesure de performance évalue l’environnement • Un point par emplacement nettoyé dans le temps t ? • Un point par emplacement propre à chaque pas de temps, moins 1 point par action effectuée ? • Un agent rationnel choisit l’action qui maximise la valeur attendue de la mesure de performance en fonction de la séquence de percepts obtenue jusque là • Rationnel 6= omniscient → les percepts ne permettent peut-être pas d’obtenir toutes les informations utiles • Rationnel 6= clairvoyant → les actions peuvent ne pas avoir les effets escomptés ⇒ Rationnel 6= efficace 6 Rationalité • Une mesure de performance évalue l’environnement • Un point par emplacement nettoyé dans le temps t ? • Un point par emplacement propre à chaque pas de temps, moins 1 point par action effectuée ? • Un agent rationnel choisit l’action qui maximise la valeur attendue de la mesure de performance en fonction de la séquence de percepts obtenue jusque là • Rationnel 6= omniscient → les percepts ne permettent peut-être pas d’obtenir toutes les informations utiles • Rationnel 6= clairvoyant → les actions peuvent ne pas avoir les effets escomptés ⇒ Rationnel 6= efficace ⇒ Un agent rationnel explore, apprend, est autonome 6 PEAS PEAS • PEAS : Performance measure, Environment, Actuators, Sensors • Pour concevoir un agent rationnel, il faut pouvoir spécifier son environnement • Exemple : Taxi automatisé • • • • Mesure de performance : Environnement : Actionneurs : Capteurs : 7 PEAS • PEAS : Performance measure, Environment, Actuators, Sensors • Pour concevoir un agent rationnel, il faut pouvoir spécifier son environnement • Exemple : Taxi automatisé • • • • Mesure de performance : sécurité, destination, profits, confort, . . . Environnement : Actionneurs : Capteurs : 7 PEAS • PEAS : Performance measure, Environment, Actuators, Sensors • Pour concevoir un agent rationnel, il faut pouvoir spécifier son environnement • Exemple : Taxi automatisé • • • • Mesure de performance : sécurité, destination, profits, confort, . . . Environnement : rues, traffic, piétons, temps, . . . Actionneurs : Capteurs : 7 PEAS • PEAS : Performance measure, Environment, Actuators, Sensors • Pour concevoir un agent rationnel, il faut pouvoir spécifier son environnement • Exemple : Taxi automatisé • • • • Mesure de performance : sécurité, destination, profits, confort, . . . Environnement : rues, traffic, piétons, temps, . . . Actionneurs : volant, accélérateur, frein, klaxon, . . . Capteurs : 7 PEAS • PEAS : Performance measure, Environment, Actuators, Sensors • Pour concevoir un agent rationnel, il faut pouvoir spécifier son environnement • Exemple : Taxi automatisé • • • • Mesure de performance : sécurité, destination, profits, confort, . . . Environnement : rues, traffic, piétons, temps, . . . Actionneurs : volant, accélérateur, frein, klaxon, . . . Capteurs : vidéo, accéléromètre, GPS, . . . 7 Types d’environnement Types d’environnement • Totalement observable vs. Partiellement observable • Mono agent vs. Multi agent • Déterministe vs. Stochastique • Episodique vs. Séquentiel • Statique vs. Dynamique • Discret vs. Continu 8 Types d’environnement • Totalement observable vs. Partiellement observable • Mono agent vs. Multi agent • Déterministe vs. Stochastique • Episodique vs. Séquentiel • Statique vs. Dynamique • Discret vs. Continu ⇒ Monde réel ? 8 Types d’environnement • Totalement observable vs. Partiellement observable • Mono agent vs. Multi agent • Déterministe vs. Stochastique • Episodique vs. Séquentiel • Statique vs. Dynamique • Discret vs. Continu ⇒ Monde réel ? 8 Types d’environnement • Totalement observable vs. Partiellement observable • Mono agent vs. Multi agent • Déterministe vs. Stochastique • Episodique vs. Séquentiel • Statique vs. Dynamique • Discret vs. Continu ⇒ Monde réel ? 8 Types d’environnement • Totalement observable vs. Partiellement observable • Mono agent vs. Multi agent • Déterministe vs. Stochastique • Episodique vs. Séquentiel • Statique vs. Dynamique • Discret vs. Continu ⇒ Monde réel ? 8 Types d’environnement • Totalement observable vs. Partiellement observable • Mono agent vs. Multi agent • Déterministe vs. Stochastique • Episodique vs. Séquentiel • Statique vs. Dynamique • Discret vs. Continu ⇒ Monde réel ? 8 Types d’environnement • Totalement observable vs. Partiellement observable • Mono agent vs. Multi agent • Déterministe vs. Stochastique • Episodique vs. Séquentiel • Statique vs. Dynamique • Discret vs. Continu ⇒ Monde réel ? 8 Types d’environnement • Totalement observable vs. Partiellement observable • Mono agent vs. Multi agent • Déterministe vs. Stochastique • Episodique vs. Séquentiel • Statique vs. Dynamique • Discret vs. Continu ⇒ Monde réel ? 8 Types d’environnement Observable Déterministe Episodique Statique Discret Agent Echecs Mots croisés Poker Diag. médical Taxi Analyse d’images 9 Types d’environnement Echecs Mots croisés Poker Diag. médical Taxi Analyse d’images Observable Totalement Déterministe Déterministe Episodique Sequentiel Statique Statique Discret Discret Agent Multi 9 Types d’environnement Echecs Mots croisés Poker Diag. médical Taxi Analyse d’images Observable Totalement Totalement Déterministe Déterministe Déterministe Episodique Séquentiel Séquentiel Statique Statique Statique Discret Discret Discret Agent Multi Mono 9 Types d’environnement Echecs Mots croisés Poker Diag. médical Taxi Analyse d’images Observable Totalement Totalement Partiellement Déterministe Déterministe Déterministe Stochastique Episodique Séquentiel Séquentiel Séquentiel Statique Statique Statique Statique Discret Discret Discret Discret Agent Multi Mono Multi 9 Types d’environnement Echecs Mots croisés Poker Diag. médical Taxi Analyse d’images Observable Totalement Totalement Partiellement Partiellement Déterministe Déterministe Déterministe Stochastique Stochastique Episodique Séquentiel Séquentiel Séquentiel Séquentiel Statique Statique Statique Statique Dynamique Discret Discret Discret Discret Continu Agent Multi Mono Multi Mono 9 Types d’environnement Echecs Mots croisés Poker Diag. médical Taxi Analyse d’images Observable Totalement Totalement Partiellement Partiellement Partiellement Déterministe Déterministe Déterministe Stochastique Stochastique Stochastique Episodique Séquentiel Séquentiel Séquentiel Séquentiel Séquentiel Statique Statique Statique Statique Dynamique Dynamique Discret Discret Discret Discret Continu Continu Agent Multi Mono Multi Mono Multi 9 Types d’environnement Echecs Mots croisés Poker Diag. médical Taxi Analyse d’images Observable Totalement Totalement Partiellement Partiellement Partiellement Totalement Déterministe Déterministe Déterministe Stochastique Stochastique Stochastique Déterministe Episodique Séquentiel Séquentiel Séquentiel Séquentiel Séquentiel Episodique Statique Statique Statique Statique Dynamique Dynamique Statique Discret Discret Discret Discret Continu Continu Discret Agent Multi Mono Multi Mono Multi Mono 9 Structure des agents Structure des agents • Agent = architecture + programme • Architecture : système, capteurs, actionneurs... • Programme : 4 types basiques • • • • Agent Agent Agent Agent réflexe simple réfexe avec état focalisé sur l’objectif focalisé sur l’utilité 10 Agent réflexe simple Agent Sensors Condition−action rules What action I should do now Environment What the world is like now Actuators 11 Agent réflexe avec état Sensors State How the world evolves What my actions do Condition−action rules Agent What action I should do now Environment What the world is like now Actuators 12 Agent focalisé sur l’objectif Sensors State What the world is like now What my actions do What it will be like if I do action A Goals What action I should do now Agent Environment How the world evolves Actuators 13 Agent focalisé sur l’utilité Sensors State What the world is like now What my actions do What it will be like if I do action A Utility How happy I will be in such a state What action I should do now Agent Environment How the world evolves Actuators 14 Conclusion Conclusion • Les agents intéragissent avec leur environnement à travers des capteurs et des actionneurs • La mesure de performance évalue l’environnement • Un agent rationnel maximise la performance attendue • La fonction de l’agent décrit ce que l’agent doit faire en toute circonstance • Le programme de l’agent implémente des fonctions d’agent • Le PEAS permet de spécifier l’environnement 15