500 likes | 782 Views
IFT 703 Informatique cognitive Introduction. André Mayers Automne 2010. Plan . Description du plan de cours Introduction à l’informatique cognitive Intelligence artificielle Psychologie cognitive Neuropsychologie
E N D
IFT 703Informatique cognitiveIntroduction André Mayers Automne 2010
Plan • Description du plan de cours • Introduction à l’informatique cognitive • Intelligence artificielle • Psychologie cognitive • Neuropsychologie • Introduction aux architectures cognitives • Historique
Sciences cognitives • Les sciences cognitives ont pour objet l’étude des systèmes intelligents dans leurs aspects représentationnels et computationnels. • Les systèmes intelligents sont des systèmes complexes de traitement de l'information capable d'acquérir, conserver, utiliser et transmettre des connaissances. • Les sciences cognitives s’intéressent • à la théorie abstraite des processus intelligents, • à l’intelligence des machines artificielles, • à l’étude de l’intelligence humaine et animale. • Les sciences cognitives étudient les phénomènes suivant • la perception, l’attention, le langage, les mécanismes de résolution de problèmes (conception, planification…)
Les disciplines des sciences cognitives Philosophie Psychologie Linguistique Informatique Anthropologie Neurosciences
Informatique cognitive • Discipline des sciences cognitives • But de l’informatique cognitive : • Concevoir des modèles computationnels des processus cognitifs • Architecture cognitive • Modèle complet de la cognition humaine • Intégration de modèle computationnel de l’usager dans les systèmes homme-machine • Systèmes tutoriels intelligents • Habitats intelligents • Contrôle de systèmes complexes • Centrales nucléaires ou électriques
Intelligence artificielle • Résoudre des problèmes pour lequel il n’existe pas d’algorithmes dédiés connus • Fouille dans un espace d’état • Symbolique • Forage de donnée, réseau de neurones, algorithme génétique • Deux approches • Intelligence générale • Simulation de l’intelligence naturelle ou humaine
Psychologie • Le behaviorisme considère les processus cognitifs comme une boîte noire et essaie de prédire le comportement (sortie de la boîte noire) en fonction des stimuli (entrée de la boîte noire). • La psychologie cognitive essaie de prédire le comportement en fonction des stimuli et d’hypothèses sur la boîte noire et ses processus • L’individu a un état interne qui influence son comportement • La méthode scientifique aide à choisir l’hypothèse la plus plausible • Les liens entre un concept théorique et les expériences le mettant en valeur peuvent être complexes (entre une particule atomique et sa trace sur une photographie). • Les processus cognitifs doivent être plausibles compte tenu des connaissances que nous avons sur le cerveau
Psychologie cognitive • Étude de la pensée et de ses mécanismes pris dans un sens large. • la perception • la résolution de problèmes • la mémoire • les fonctions exécutives • attention • planification • prise de décision • … • 4 approches • Traitement de l’information • utilisation de symboles et d’abstraction • Basé sur la biologie • voir aussi neuropsychologie • Basé sur les processus de l’évolution • Une combinaison des trois précédentes
Approche traitement de l’information 9 • Modèle modale • Atkinson & Shiffrin (1968) • Information encodée sous sa forme perceptuelle dans la mémoire sensorielle • Information est transmise dans la mémoire à court terme (MCT) • Capacité limitée et dégradation rapide de l’information • Information est ensuite transmise avec une certaine probalité dans la mémoire à long teme (MLT) • Capacité infinie et dégradation lente
Approche traitement de l’information • Module exécutif central : sélectionne et manipule le contenu des modules esclaves • Boucle phonologique : • tampon à court terme : encode l’information sous sa forme verbale • boucle articulatoire : processus de rafraichissement de l’information • Tablette Visuo-spatiale Visuo-spatial sketchpad: encode sous l’information sous sa forme spatiale ou visuelle • Modèle de la mémoire de travail • Baddeley et Hitch’s (1974)
Neuropsychologie • La neuropsychologie est une discipline scientifique et clinique qui étudie les fonctions mentales supérieures dans leurs rapports avec les structures cérébrales au moyen d'observations menées auprès de patients présentant des lésions cérébrales accidentelles, congénitales ou chirurgicales. • Son objectif est la compréhension du système cognitif normal et anormal par le biais de l'étude de ses dysfonctionnements.
Architecture cognitive • Architecture informatique • ensemble de structures fixes permettant à un système d’être programmé • Architecture cognitive • ensemble de structure fixe qui explique l’ensemble des processus cognitifs • indépendance de la tâche modéliser • une théorie générale de la cognition, • intègre plusieurs théories spécifiques • perception, attention, mémoire … • une explicitation de la boîte noire
Architecture cognitive computationnelle • Une architecture cognitivive pouvant servir de devis pour concevoir un programme • Un modèle informatique d’une architecture cognitive • de simuler avec un ordinateur des comportements complexes • de générer des hypothèses qui pourront être validés expérimentalement
Caractéristiques des architectures cognitives • Degré de dépendance par rapport à un domaine. • généralisation possible • Degré de spécification • sa distance d’un modèle computationnel • Étendue des fonctions cognitives modéliser explicitement • attention, mémoire, processus subsymboliques • Adéquation aux résultats expérimentaux
Architecture cognitive : définition • “The fixed (or slowlyvarying) structure thatforms the framework for the immediateprocesses of cognitive performance and learning” • Newell, 1990, p. 111 • “The functional architecture includes the basic operationsprovided by the biologicalsubstrate, say, for storing and retrievingsymbols, comparingthem, treatingthemdifferently” • Pylyshyn, 1984, p. 30 • “ A specification of the structure of the brainat a level of abstraction thatexplains how itachieves the function of the mind” • Anderson, 2007, p. 7 • La notion d’architecture cognitive permet de ne pas s’enfarger • dans la complexité du cerveau humain (1012 cellules) en faisant abstraction du but des structures du cerveau • dans la multiplicité des explications du comportement humain en faisant abstraction du cerveau qui doit les produire
Les niveaux d’une architecture cognitive (Newell) • Tout dans la nature peut être décrit à différents niveaux • La matière peut être décrit au niveau subatomique, atomique, moléculaire, nano, … il en est de même pour les architectures cognitives • Un niveau dans une architecture consiste • en un medium qui est manipulé • des composantes qui permet les opérations de base • des lois de composition qui permet d’assembler les composantes • du système formé à l’aide des lois de composition • des lois comportementales qui décrit le comportement du système • les lois comportementales découlent du comportement de ses composantes et de la façon dont elles sont assemblées.
Les niveaux de traitement • Le niveau du milieu est l’architecture qui manipule le contenu du niveau supérieur et est en même temps le contenu manipulé par le niveau du bas. • Une architecture offre des outils pour manipuler le contenu, p. ex. un traitement de texte offre des outils pour manipuler du texte.
Description d’un niveau • Un niveau peut être décrit de deux façons • autonome • Un programmeur n’a pas besoin de connaître le niveau de la logique des circuits • Un concepteur de circuits logiques n’a pas besoin de connaître les lois régissant le magnétisme ou le courant électrique • par réduction au niveau précédent • On explique les circuits logiques en terme des circuits électriques
Description autonome du niveau connaissance d’un agent • La principale caractéristique du niveau connaissance est que son comportement est uniquement déterminé par ses connaissances et non par sa structure ou ses composantes. • Un agent au sens de l’intelligence artificielle possède • des connaissances et des buts • des composantes pour percevoir et agir dans son environnement • Le principe de rationalité • Si un agent a la connaissance qu’une de ses actions lui permettra d’atteindre un de ses buts alors il choisit cette action • Que pensez d’un thermostat ?
La description du niveau connaissance avec le niveau sous-jacent
Les niveaux d’architecture pour un agent intelligent informatisé • Connaissance • le médium est constitué des connaissances • Programme • le médium sont les symboles • Registre, • le médium est le vecteur de bits • les actions sont les transferts entre les registres ou la mémoire • Circuit logique • le medium est le bit • Circuit électrique • le médium est le courant électrique • Matériel • le médium est l’électron avec toutes ses propriétés
Le niveau intelligence d’une architecture cognitive • Comme au niveau intelligence, les composantes et la structure ne sont pas importantes alors une description autonome du niveau intelligence d’une architecture cognitive est la description de la « logique » de ses comportements en fonction de son environnement. • Pas très réjouissant comme constatation pour des informaticiens • La solution est de le décrire en le réduisant au niveau précédent, i.e. au niveau d’un système de symbole ou programme. • Tous les programmes ou systèmes de symboles ne sont pas des agents intelligents, ils doivent respecter le principe de rationalité. • Il ne faut pas non plus s’enfarger dans les détails du programme et l’idéal est de créer une abstraction au niveau symbolique ainsi que le modèle mathématique décrivant les manipulations symboliques. • C’est à ce niveau d’abstraction que nous décrirons les architectures cognitives comme ACT-R et SOAR • Nous décrirons les modules de ACT-R et l’espace problème de SOAR • C’est aussi à ce niveau que vous devrez décrire les architectures dans vos travaux et présentations
La description du niveau connaissance avec le niveau sous-jacent (bis)
Comment la cognition est-elle possible dans l’univers physique ? • Comment expliquer les fonctions mentales à partir du cerveau ? • Comment expliquer une maison à un extraterrestre ? • C’est certain qu’il faut décrire l’architecture d’une maison, mais est-ce suffisant ? • Il faut aussi expliquer pourquoi l’architecture est ce qu’elle est pour répondre aux besoins humains • Ce sont les contraintes (humain, économique… ) du marché qui font que les maisons ont la forme qu’elles ont actuellement. • Ce sont les contraintes de l’évolution (survie, biologie) qui font que nous avons notre cerveau actuel et ses fonctions cognitions cognitives • Une architecture cognitive permet d’expliquer la fonction cognitive à partir du cerveau. • ce n’est pas toujours le cas
3 alternatives pour expliquer la cognition • Une architecture qui ne tient pas compte du cerveau • Le paradigme classique du traitement de l’information • Une architecture qui ne tient pas compte de la fonction cognitive • Le paradigme du connexionnisme sans l’esprit • Un paradigme qui fait abstraction de l’architecture • L’analyse rationnelle de la fonction cognitive i.e. la fonction cognitive est le résultat d’une adaptation à l’environnement.
Alternative 1 pour expliquer la cognition • Le traitement de l’information classique • le paradigme “information processing” classique de la psychologie • présente des théories validées par des expérimentations expliquant la fonction cognitive • voir la théorie de Sternberg pour expliquer si un nombre fait partie d’une liste dans la WM • sa théorie ne tenait pas compte de la vitesse à laquelle un neurone peut être excitée • ignorer le cerveau, c’est comme concevoir une maison sans tenir compte des contraintes des matériaux pour la construire
Alternative I1 pour expliquer la cognition • Le connexionnisme sans l’esprit • Une description exacte et fonctionnelle du cerveau • C’est comme expliquer une maison à un extraterrestre sans tenir compte des fonctions de ses parties pour un être humain. • La cognition est un effet de bord du cerveau • Construire une maison avec des briques, du bois… sans contraintes et constater à la fin que l’être humain puisse y vivre • C’est comme expliquer le fonctionnement d’un ordinateur sans expliquer l’intention en arrière de chaque structure • C’est comme expliquer la physiologie en terme d’interactions entre les cellules du corps en faisant abstraction des fonctionnalités des organes. • Rumelhart and McClelland (1986) ont conçu un réseau de neurones qui apprenait les participes passés comme un enfant en faisant par exemple les erreurs de surgénéralisation classique du début de l’apprentissage (runned au lieu de ran). • Ignorer l’esprit, c’est considéré que ce réseau de neurones a été premièrement construit et constater ensuite qu’il fait les participes passés
Alternative III pour expliquer la cognition • L’analyse rationnelle de la fonction cognitive en faisant abstraction de l’architecture. • Une des contraintes imposées à la façon dont le cerveau permet la cognition est que les deux sont le résultat d’une évolution dans un environnement réel • Le raccourci est de se concentrer sur l’adaptation de la cognition à l’environnement en faisant abstraction de l’architecture qui doit supporter les fonctions cognitives • C’est un courant très actif actuellement et toutes les variantes sont basées sur l’approche bayésienne • Il ne s’agit pas d’expliquer comment les calculs bayésiens sont exécutés mais tout simplement, sachant qu’il y a adaptation l’environnement, d’élaborer une théorie prédisant le comportement cognitif en conséquence.
L’approche bayésienne de la cognition • L’évolution fait en sorte que nos capacités sont fonction de la probabilité qu’un évènement survienne a priori • Pr(pluie), Pr(cumulonimbus)… • Nous sommes en mesure de connaître les situations dans lesquelles certains événements se produisent • Pr(cumulonimbus | pluie) • Connaissant les probabilités conditionnelles et les probabilité a priori, nous pouvons connaître la probabilité a posteriori que nous sommes dans tel situation étant donné qu’un tel événement est survenu • Pr(pluie | cumulonimbus) = Pr(cumulonimbus| pluie) * Pr(pluie) Pr(cumulonimbus). • Basé sur l’information précédente, i.e. les probabilités a posteriori des situations actuelles, il s’agit de choisir l’action qui maximise l’atteinte des besoins de l’individu • se mettre à l’abri si la situation la plus probable est qu’il pleuve
Architecture cognitive • Architecture informatique • ensemble de structures fixes permettant à un système d’être programmé • Architecture cognitive • ensemble de structure fixe qui explique l’ensemble des processus cognitifs • indépendance de la tâche modéliser • une théorie générale de la cognition, • intègre plusieurs théories spécifiques • perception, attention, mémoire … • une explicitation de la boîte noire
Architecture cognitive computationnelle • Une architecture cognitivive pouvant servir de devis pour concevoir un programme • Un modèle informatique d’une architecture cognitive • de simuler avec un ordinateur des comportements complexes • de générer des hypothèses qui pourront être validés expérimentalement
Caractéristiques des architectures cognitives • Degré de dépendance par rapport à un domaine. • généralisation possible • Degré de spécification • sa distance d’un modèle computationnel • Étendue des fonctions cognitives modéliser explicitement • attention, mémoire, processus subsymboliques • Adéquation aux résultats expérimentaux
Architecture cognitive : les débuts • 1957 • General ProblemSolver • Herbert Simon et Allen Newell • généralise LogicTheorist • un résolveur de problème universel • espace problème (problemspace) • résoudre un problème consiste à explorer et construire un graphe à partir d’un état initial pour trouver un état final. • méthode faible (weakmethod) • méthode de résolution pouvant être appliquée à plusieurs domaines comme l’analyse moyens-fins (means-ends analysis, hill-climbing … • manipule des structures symboliques • logique, géométrie, jeux d'échecs
1973 • human associative memory • John Robert Anderson
1980 • validation expérimentale (protocole verbal) • K. Anders Ericsson et Herbert Simon • 2 systèmes sont faiblements équivalents s’ils représentents la même fonction et fortement équivalents si c’est le même algorithme
Les architectures à base de systèmes de production • 1943 • Les systèmes de production sont apparus sous forme théorique • 1972 • implantation de systèmes de production • Human problem solving de Newell
Évolution des architectures basés sur les systèmes de production
1983 • ACT* • Connaissance sémantique (déclarative) • Réseau sémantique • Activation de base + activation provenant du contexte • Dispersion de l’activation • Pas de distinction entre MCT et MLT, les éléments de la MCT sont les éléments actifs (perception ou actifs) ?? • Connaissances procédurales • Système de production • Force d’une production
ACT* : dispersion de l’activation L’activation part des objets (unit) actuellement actifs et via ses attributs (element) se propage à d’autres objets dans la mémoire à long terme.
1983 • SOAR 1 (State, Operator And Result) • John Laird, Allen Newell, et Paul Rosenbloom • Expliquer le comportement intelligent en proposant l’architecture de base de tout système intelligent • Mécanisme sophistiqué d’apprentissage de nouvelles connaissances • Initialement peu de fondement psychologique à l’architecture • Possible de produire des comportements plausibles et non plausibles • Difficile de modéliser les connaissances sémantiques et épisodiques avec l’architecture SOAR • Attention les règles de production ne sont pas des connaissances procédurales • Il ajoutent des préférences dans la mémoire de travail et complète l’information qui est déjà dans la mémoire de travail mais cette mémoire de travail n’a aucun rapport avec sa partie correspondante en psychologie
1983 : CPM-GOMS Cognitive, Perceptual, Motor GOMS Goals, Operators, Methods and Selection rules
Calcul du temps nécessaire pour percevoir un objet avec GOM/CPM