/ Accueil / Simuler l'apprentissage
     | Ecrire

Vers un agent autonome

Imaginons un fonction qui à partir de la situation courante, c'est à dire l'état instantané perçu par les organes sensoriels, calcule un nombre compris entre 0 et 1. Ce nombre exprime le taux de satisfaction, 0 rien ne va, 1 le monde est merveilleux. Il est aisé de concevoir sur le modèle précédent un système dont le but est d'accroitre sa satisfaction de la même façon que nos premiers cobayes devaient obtenir le maximum de récompenses. Cette fonction n'est en fait qu'une méthode sauvage de compression de donnée, qui vise à réduire l'information perçue pour n'en retenir qu'un indice qualitatif se résumant à un unique nombre.

Muni d'une telle fonction, un animat sera entièrement autonome, il n'a plus besoin d'un oeil extérieur pour décider quoi faire. Mais il ne pourra apprendre que sous deux conditions :

  • avoir des sens suffisamment nombreux et riches pour obtenir une description de l'environnement exploitable.
  • un fonction de satisfaction pertinente

Ce deuxième point est le plus délicat. Comment déterminer une telle fonction dont tout dépend ? Pour le moment elle ne peut être élaborée qu'empiriquement, mais toutefois avec une possibilité d'automatiser cette recherche avec des algorithmes génétiques :
On créé de nombreuse créatures et on ne garde que celles qui survivent le plus longtemps.

Le simple respect de règles plus ou moins bien choisie ne permet pas d'adopter des comportements variés. De plus une même situation perçue à des instants différents peut en faite être la même image de deux situations réelles très différentes. En outre il peut parfois être intéressant de choisir alternativement des actions différentes pour traiter une même situation.

Les automates à états savent résoudre parfaitement ces contraintes : l'action à effectuer est déterminée par la situation ET un état interne. Celui ci peut être changé par l'action entreprise à l'issue de l'analyse de la situation. La plupart des programme de traitement automatique de langage et en particulier le compilateurs sont bâtis autour d'un automate à état. Mais ces automates, comme leur nom l'indique, sont parfaitement déterministes et immuables.

Ajoutons un état interne à un système de classeur, que ce passe-t-il ? L'animat choisie l'action à réaliser en fonction de la situation perçue et l'état interne. L'action choisie modifiera éventuellement la situation ou l'état interne ou les deux. Donc si la même situation est atteinte ultérieurement, l'état interne pourra être différent et alors conduire à un choix d'action différent. Pour une même situation, l'animat adoptera selon son "humeur" un comportement différent.

Revenons plus concretement à notre modèle : l'animat n'est qu'une collection d'organes. Certains sont sensitif, d'autre effectif i.e. Des capteurs pour acquerir des informations sur l'état de l'environnement et des actionneur pour agir sur celui ci.

Imaginons un organe un peu plus particulier, pour l'animat c'est en meme temps un capteur et un actionneur. C'est à dire qu'il donne de l'information et traite des commandes. Seulement il n'agit pas sur l'environnement, le traitement de la commande consiste simplement à retourner celle-ci lorsque on l'interroge. Nous obtenons une memoire, parfait support pour l'etat interne evoqué precedemment. Ceci permet de l'implementer avec le systeme de classeur deja vu sans recourir à aucun artifice

Reflexions sur les consequence d'un organe particulier qui aurait pour objet d'agir sur la base de regle, voir sur le classeur lui meme. Vers un embryon de meta representation (de conscience ?)

mis à jour le : 15/04/2006 - 21:58