590 likes | 711 Views
Jeux dialogiques. Jean Caelen. Dialogue = jeu. Jeu de langage = Wittgenstein en 1952 Théorie des jeux = Von Neumann et Morgensten « The Theory of Games and Economic Behavior » en 1944
E N D
Jeux dialogiques Jean Caelen
Dialogue = jeu Jeu de langage = Wittgenstein en 1952 Théorie des jeux = Von Neumann et Morgensten « The Theory of Games and Economic Behavior » en 1944 Dans le dialogue homme-machine, nous supposons au moins deux acteurs, l’homme et le système, comme étant deux locuteurs qui dialoguent, chacun visant au départ un certain but dans l’arrière-plan. Un dialogue est un jeu au cours duquel chaque participant joue des coups à l’aide d’actes de dialogue pour atteindre son but. Un dialogue se présente comme une suite d’échanges (actions, transactions), les échanges visant à résoudre des sous-buts ou des pré-conditions. Le dialogue lui-même peut être discontinu dans le temps et se dérouler sur plusieurs sessions.
Théorie des jeux Définition :un jeu est une situation où des individus rationnels (les "joueurs") sont conduits à faire des choix stratégiques parmi un certain nombre d'actions possibles, et dans un cadre défini à l'avance (les "règles du jeu"), le résultat de ces choix constituant une issue du jeu, à laquelle est associé un gain (ou paiement), positif ou négatif, pour chacun des participants. La théorie des jeux modélise le comportement d'un agent face à des situations de choix, elle étudie toute situation dans laquelle des agents interagissent. On pourrait aussi l'appeler théorie de la décision interactive, car elle modélise des situations dans lesquelles plusieurs agents font des choix, puis des actions conditionnées par ces choix, ces actions ayant à leur tour des effets sur les gains (ou pertes), ceux des uns affectant les gains des autres.
Théorie des jeux • Un jeu se caractérise par des règles qui définissent : • le nombre de joueurs (au moins deux), l’ordre d’intervention des joueurs, • les types d’actions, stratégies possibles des joueurs et informations disponibles pour choisir, • les informations disponibles ou non sur les stratégies des participants (ce dernier paramètre sépare les types de jeux en jeu coopératif ou de coalition vs. en jeu compétitif), • le degré de communication entre joueurs (collusion ou non) • le déroulement et les étapes du jeu, • les rétributions (gains, pertes) et les résultats, • la répétition ou non du jeu. • La théorie distingue différents types de jeux suivant qu'ils sont plus ou moins coopératifs, compétitifs, répétitifs. L’intérêt de la modélisation d’un jeu porte sur ses règles.
Théorie des jeux Le concept d’utilité est central dans un jeu. C’est non seulement le critère qui permet de mesurer le gain ou la perte à l’issue du jeu, mais c’est aussi le critère qui motive le jeu et maintien les acteurs dans cette situation et leur fait respecter les règles. L’utilité peut se décliner en unités monétaires, biens matériels ou non, etc. On l’associe souvent à un nombre réel. Un jeu est dit jeu stratégique entre deux ou plusieurs personnes lorsque l’utilité est affectée non seulement par l’action du joueur lui-même mais aussi par toutes les actions des autres joueurs (jeu d’échec par exemple). Les conflits peuvent souvent se modéliser par des intérêts contradictoires en terme d’utilité.
Théorie des jeux • Le jeu est souvent un problème combinatoire que l’on peu représenter sous forme d’arbre de décision (forme dite extensive) ou sous forme duale, la matrice (forme dite normale). • Les "formes extensives" : arbre de Kuhn, ayant des branches, des nœuds et des feuilles, où l'issue d'un jeu est assimilée à une feuille dans laquelle nous retrouvons le vecteur des gains (ou "paiements") respectif des joueurs. Les embranchements possibles à partir d’un nœud représentent les choix à ce moment du jeu. • Les "formes normales" : tableau de gains (ou "paiements") mais qui sont inadaptés aux jeux répétitifs.
Le dilemme du prisonnier Jeu à connaissance incomplète Comportement de A dépend de celui de B qu’il ne connaît pas, donc émerge la notion d’intérêt commun et la solution qui offre le moins de « regret » 3,3
Équilibre de Nash On appelle équilibre un état ou une situation où aucun joueur ne souhaite modifier son comportement même connaissant le comportement des autres joueurs. Une fois qu’un équilibre a été atteint il n’y a aucune raison de le quitter. L’équilibre de Nash est un concept fondamental en théorie des jeux, c’est pour un joueur la meilleure stratégie possible étant donnée les stratégies des autres joueurs. Mais cet équilibre est relatif, il dépend des stratégies des autres joueurs. Cependant, un équilibre global peut émerger si le risque est partagé par l’ensemble des joueurs. Ainsi le risque pour A de ne pas dénoncer B est moindre si B raisonne de la même manière que lui. L’équilibre de Nash global est alors (3,3).
Stratégie dominante Dans ce jeu la stratégie A du joueur 2 domine faiblement sa stratégie B. Le joueur 1 n’a pas de stratégie dominante mais il pense que le joueur 2 jouera sa stratégie dominante A. Avec cette hypothèse il doit donc jouer la stratégie D qui maximise son gain et devient sa stratégie dominante après élimination des stratégies dominées du joueur 2. Ainsi (4,3) est le point d’équilibre de ce jeu.
Équilibres multiples Dans ce jeu A et B sont en conversation téléphonique et la liaison est coupée. Chacun a la possibilité de rappeler ou d’attendre l’appel de l’autre. Il coûte 6 d’appeler. S’ils attendent tous les deux ou appellent simultanément la conversation ne pourra pas avoir lieu. Supposons que (a) l’intérêt de A et B soit le même alors il y a deux équilibres, le choix in fine de la stratégie de l’un se fera sur la connaissance supposée des préférences de comportement de son interlocuteur (c’est-à-dire par exemple savoir que B est plus impatient que A), sinon (b) c’est celui qui a un intérêt supérieur qui devra appeler l’autre => gains composés (plusieurs jeux composés ou gain externe au jeu)
La rationalité • La théorie des jeux suppose souvent que les joueurs sont rationnels. En réalité il n’en est pas toujours ainsi, • Soit que l’un des joueurs suppose que les autres ne le sont pas, • Soit que les critères de choix ne le sont pas , • Soit que des stratégies à long terme de type spéculatif sont mises en place, • Soit qu’il peut aussi y avoir des connaissances fausses qui biaisent la prise de décision. • Exemple de biais psychologique : on dit à deux joueurs de choisir au hasard et de noter un chiffre quelconque compris entre 1 et 10. Si le hasard leur donne le même chiffre ils gagnent tous deux 10 fois ce chiffre et sinon ils ne gagnent rien. Le jeu est répété 10 fois. • Y a-t-il une stratégie gagnante ?
Limites de la rationalité La théorie des jeux dite néoclassique suppose que les joueurs sont rationnels et intéressés. Ils ne se préoccupent que de leur propre intérêt et des gains des autres, que dans la mesure où ces derniers conditionnent les leurs (par exemple dans les jeux de marchandage à somme nulle). Or ce comportement est actuellement contesté par certains résultats expérimentaux. On montre que le sentiment de partage équitable ou de rémunération équitable entre en jeu, notamment dans certaines relations de marchandage. Des valeurs humanitaires (ou sentimentales) entrent ainsi en considération dans certaines situations. Par exemple le sentiment de magnanimité en marchandage consiste pour un acheteur à accepter un prix au-dessus de l’équilibre pour des raisons d’effort à marchander ou parce qu’il lui semble que le vendeur a fait une concession plus importante que lui (Hollard, 2005).
Tendances actuelles Depuis quelques années, la théorie des jeux s’est ouverte à des concepts plus raffinés qui permettent de réduire le nombre des équilibres comme dans les sous-jeux parfaits ou la renégociation. Dans ces cas la représentation extensive (arbre de choix) n’est pas toujours équivalente à la représentation sous forme normale (matrice). Les sous-jeux parfaits utilisent des notions comme la menace : cela consiste à menacer à l’avance l’un des joueurs, que si le jeu tombe dans une certaine configuration alors il y aura sanction. Un équilibre de sous-jeu parfait devient alors une combinaison de stratégies telle que les actions prescrites par ces stratégies constituent un équilibre de Nash dans tous les sous-jeux
Les jeux répétés Un jeu répété est un jeu dans lequel les mêmes joueurs se rencontrent plusieurs fois. On suppose dans un premier temps que les règles du jeu ne changent pas et que les gains acquis à un tour précédent n’influent pas sur les gains espérés du tour suivant. Malgré ces conditions d’autres équilibres se créent du fait de la répétition du jeu, notamment par le phénomène de collusion ou de coopération, selon que les joueurs se font ou non confiance au cours du temps. Ainsi dans le dilemme du prisonnier, si l’interrogatoire recommence touts les mois, il est probable que les choses changent : (a) au début aucun des deux ne dénonce l’autre puis (b) lorsque cet équilibre semble définitivement établi ainsi que la confiance réciproque, alors l’un des deux peut en décider autrement pour sortir de prison (il « craque » dans le jargon policier).
Conclusion sur la théorie des jeux • Cadre fécond • Beaucoup de travaux, communauté très dynamique • Modélisation mathématique puissante (probabilités, logique, optimisation fonctionnelle) • Raffinements possibles : • Hors du cadre strictement rationnel • Par la répétition du jeu et l’introduction de phases stratégiques distinctes • Par l’introduction de facteurs humains complexes, individuels ou collectifs autres que les intérêts et les connaissances
Retour au dialogue… • Nous allons tenter d’étendre la théorie des jeux pour le dialogue dans trois directions : • Attacher à la notion de but celle d’utilité (= fonction de satisfaction continue) • Appliquer la théorie des jeux à la prise de tour de parole dans un dialogue à plusieurs, • Formaliser des stratégies générales de dialogue.
But satisfait ? Usager : allô, je voudrais réserver une salle pour lundi prochain Système : désolé, toutes les salles sont déjà prises. Usager : bon… merci, au revoir Le but du dialogue est satisfait mais pas le but du jeu (appelé bU). Ce dialogue n’a pas été « utile ». But du jeu = réussir à obtenir un service But du dialogue = réussir la transaction But illocutoire = réussir un acte de dialogue
But bU « mieux » satisfait… Usager U : allô, je voudrais réserver une salle pour lundi prochain Système : désolé, toutes les salles sont déjà prises… mais je vais me renseigner pour savoir si une permutation est possible. Je vous mets en attente. Usager U : bon… merci… Système : bonjour monsieur A, vous est-il possible de déplacer votre réunion de lundi ? Usager A : ah non désolé, ma réunion est trop importante Système : bonjour monsieur B, vous est-il possible de déplacer votre réunion de lundi ? Usager B : oui, si c’est encore possible le lendemain… Système : merci, je réserve votre salle pour le lendemain, mardi, mais je vous confirmerai par e-mail de ce changement Système : allô monsieur U ? Monsieur B accepte de reporter sa réunion. Je peux vous réserver la salle Bleue pour lundi. Cela vous convient ?
La satisfaction du but Satisfaction de bA 1 Buts satisfaits Compromis positif Compromis à somme nulle Compromis négatif Satisfaction de bB 0 1
La gestion des conflitsLes tours de parole Exemple : un dialogue pour gérer les ressources partagées. Dans ce type de problème : • Comment gérer les conflits par le dialogue ? • Comment gérer les tours de parole entre partenaires ?
Résolution par la théorie des jeux • bU = [$x, y=lundi : salle(x) Ù jour(y) Ù réservé(x,y,U)] • ce but posé par U est étendu en considérant : • b = [bUÙ ($h, $d, A : heure(h) Ù durée(d) Ù réservé(x,y,A)] • [($x, y ≠ lundi : salle(x) Ù jour(y) Ù réservé(x,y,U)] • qui permet de chercher • soit une heure et une durée en cas de disponibilité de salle, • soit les agents A qui ont réservé le jour y • soit de relâcher la contrainte sur le jour de réservation de U pour lui proposer une autre date le cas échéant si aucun agent A n’accepte de modifier sa réservation
ET OU ET OU b1p1 b2p2 b3p3 b4p4 b5p5 Construire un arbre de conflits Dans cet exemple le but bU est en conflit avec les buts (b1p1Ù b2p2Ù b4p4) (b1p1Ù b2p2Ù b5p5) (b3p3Ù b4p4) (b3p3Ù b5p5) ce qui laisse 4 tactiques pour résoudre le problème. Plus généralement, le problème est de parcourir l’arbre de conflits de manière optimale afin de rechercher le chemin qui offre la meilleure possibilité de lever le conflit en activant des sessions de dialogue de négociation avec les patients concernés Pi. Trouver la solution qui maximise l’espérance de succès de la négociation.
Optimiser • La recherche de cet optimum, guide la tactique de dialogue qui consiste donc à : • énumérer tous les chemins possibles dans l’arbre de conflits, • estimer les gains individuels et généraux pour tous les chemins, • ordonnancer ces chemins selon l’un des deux critères de choix à savoir intérêts particuliers ou intérêt général, • parcourir ces chemins pour organiser les sessions de négociation selon cet ordre et dialoguer avec chaque participant jusqu’à trouver une solution ou constater un échec, • revenir au dialogue principal qui a motivé le but, en faisant le compte-rendu à l’appelant.
Position du problème La phase de négociation à laquelle nous nous intéressons ici est la phase d’estimation a priori des chances de succès d’une demande de service afin de planifier les sessions de dialogue selon une tactique optimale. Les participants sont en nombre quelconque n, [Ui,i=1,n-1], et U0, pose un problème b0 (demandeur initial) qui se trouve être en conflit avec une situation précédente.
Définitions On définit on ensemble de fonctions dans l’intervalle [-1, +1] Gain(Ui) = le gain (resp. perte) que Ui espère retirer (resp. craint de subir) de la réalisation de b0. Ce gain ne dépend que de l’intérêt propre de Ui, considéré indépendamment de l’intérêt des autres participants. Gain_conjoint(Ui, Uj) = le gain (resp. perte) que Ui espère retirer (resp. craint de subir) de l’acceptation (resp. refus) de b0 par Uj. Ici on considère l’intérêt que Ui et Uj partagent. Si ces intérêts sont opposés le gain conjoint prend une valeur négative. Concession(Ui) = réduction de gain (resp. augmentation) que Ui est prêt à accepter (resp. en attend) en cas d’imposition de b0. Cette valeur dite de concession est la borne limite encore acceptable par Ui s’il peut encore influer sur une situation qui lui est défavorable. Une concession positive serait un gain inespéré par lui à ce stade de la négociation, Concession_conjointe(Ui, Uj) = concession faite par Ui suite à une pression subie par Ui de la part de Uj pour imposer b0. On remarque ici que U0 n’est peut-être pas le seul à vouloir réaliser b0, et que de ce fait Ui peut recevoir diverses pressions pour accepter b0. Si b0 est favorable à Ui alors il peut lui-même faire subir des pressions aux autres participants pour réaliser b0.
Tactiques • La théorie des jeux propose des solutions pour maximiser soit le gain total de certains individus soit le gain total de l’ensemble des participants. • Le gain espéré pour Ui est : • Gi = G(Ui) + ΣGc(Ui, Uj) – C(Ui) – ΣCc(Ui, Uj) • On a donc plusieurs types de tactiques : • Max G0 sur l’intérêt du demandeur initial, • Max ΣpiGi sur l’ensemble des participants ou de certains participants « prioritaires ». j j i
Exemple numérique • Problème : U0 souhaite organiser une réunion ; il s’agit de trouver une date T qui permette de réunir l’ensemble des participants {U0, Ui, i=1,n-1} sous la contrainte C. Le « poids » des participants vis-à-vis de leur importance par rapport à l’ordre du jour de la réunion est par définition une valeur pi réelle comprise dans l’intervalle [0, 1] • Parmi les contraintes on peut avoir par exemple : • C1- tous les participants doivent être présents • C2- tous les participants parmi les k plus importants doivent être présents • C3- un quorum q doit être atteint • Dialogue : on suppose que le dialogue de prise de rendez-vous se fait en face-à-face. La négociation est un jeu répété.
Exemple numérique Discussion à trois : 1-U0 : je vous propose une réunion sur le sujet S à la date T1 2-U1 : désolé je ne peux pas à T1, mais plutôt à T2 3-U0 : pourtant il faudrait que tout le monde soit présent 4-U1 : OK mais j’aimerais aussi que U2 soit présent 5-U2 : pour moi pas de problème à T1 mais impossible à T2 6-U1 : bon, je vais m’arranger pour venir Dans cet exemple on note que U0 fait « pression » sur U1 et U2 (à l’aide d’arguments et/ou par sa position hiérarchique), que U1 a un gain conjoint avec U2 (il le manifeste explicitement à l’acte 4) et qu’il finit par faire une concession à U0 à l’acte 6, la contrainte étant ici que tous les participants doivent être présents.
Exemple numérique Les valeurs des fonctions sont les suivantes par rapport au sujet S : P = 1 0.5 0.8 1 0.4 0.6 G = 0.8 0.5 0.7 0.6 0.2 0.5 Cette matrice Gain n’est pas symétrique, elle peut évoluer au cours du dialogue si le sujet S change ou se modifie. 0 0 0.2 C(T1) = 0.8 1 0.5 0.5 0.4 0 0 0 0.2 C(T2) = 0.8 0 0.5 0.5 0.4 1
Exemple numérique Au départ : G0(T1) = 1 – 0 = 1 G0(T2) = 1 – 0 = 1 G1(T1) = 0.5 – 1 = -0.5 G1(T2) = 0.5 – 0 = 0.5 G2(T1) = 0.5 – 0 = 0.5 G2(T2) = 0.5 – 1 = -0.5 Remarques : la date T1 ou T2 est indifférente pour U0. Il peut subir une pression de la part de U2 mais pas de U1 pour changer de date. La date T1 ne convient pas à U1 il peut subir une pression de la part de U0 et de U2. La date T1 peut convenir à U2 mais pas T2, il peut subir une pression de U0 (mais ressentie moins fortement que U1).
Exemple numérique • Pour la suite du dialogue on a : • 1-U0 : je vous propose une réunion sur le sujet S, à la date T1 • Cet acte propose un intérêt pour le sujet S et fait subir une pression sur U1 et U2 pour la date T1 • G0(T1) = 1– 0 = 1 • G1(T1) = -0.5 + 0.8 –0.8 = -0.5, G1(T2) = 0.5 • G2(T1) = 0.5 + 0.6 -0.5 = 0.6 • 2-U1 : désolé je ne peux pas à T1 mais plutôt à T2 • Cet énoncé exprime l’état G1(T1) et fait subir une pression sur U2 mais pas sur U0 (car la concession est nulle) • G0(T1) = 1– 0 = 1 • G1(T1) = -0.5 • G2(T1) = 0.6 -0.4 = 0.2, G2(T2) = -0.5 • 3-U0 : pourtant il faudrait que tout le monde soit présent • Cet énoncé exprime une insistance de U0 sur U1 • G1(T1) = -0.5 + 0.8 = 0.3
Exemple numérique • 4-U1 : OK mais j’aimerais aussi que u2 soit présent • Le gain G1 devient positif donc U1 acquiesce mais exerce une pression sur U2 pour augmenter son gain conjoint • G2(T1) = 0.2 + 0.2 = 0.4, G2(T2) = -0.5 + 0.4 = -0.1 • 5-U2 : pour moi pas de problème à T1 mais impossible à T2 • Fait état de son gain positif et répond à U1 • G1(T1) = 0.3 + 0.5 = 0.8 • 6-U1 : bon, je vais m’arranger pour venir • La réunion a donc lieu à T1 avec les trois participants avec les gains (1, 0.8, 0.4)
Discussion Ce modèle de gestion de la négociation est relativement indépendant du modèle de tâche. Il travaille seulement sur l’état du but de dialogue et il permet donc de séparer le gestionnaire de dialogue du gestionnaire de la tâche, c’est-à-dire le quoi et le comment. La théorie des jeux est une alternative intéressante pour modéliser le dialogue et dépasser les deux types de modèles habituellement utilisés, le modèle intentionnel et le modèle conventionnel. Limites : les valeurs des paramètres, la numérisation
Jeu stratégique de dialogue Gestion des buts de dialogue Stratégies de dialogue
U : "dessine un triangle" M : "pouvez-vous préciser ?" U : "équilatéral" M : "de couleur rouge ?" U : "peu importe" M : "OK" Le but du jeu Motive et oriente le dialogue Le but du dialogue est de maintenir une interaction conjointe OK Peu importe De couleur rouge ? Équilatéral Pouvez-vous préciser ? Dessine un triangle
Le but du jeu On appelle but du jeu un état utile que désire atteindre l’usager. Cet état concerne aussi bien un état mental de ce dernier (par exemple connaître une information, acquérir un savoir-faire) qu’un état du monde. On suppose qu’on peut représenter ce but à l’aide d’un prédicat bU, par exemple : • bU = ($x) Ù Cercle(x) Ù Rouge(x) Ù Sur(x, Carré) Mettre un cercle rouge sur le carré • bU = (x) Ù Cercle(x) Ù CU(Ballon(x)) Savoir qu’un cercle représente un ballon
Évolution du but au cours du dialogue • nouveau but : ?b, ce but vient d’être exprimé par X, • but atteint : †b, l’état de la situation rend le prédicat b vrai, • but satisfait : ‡b, X manifeste son accord explicitement ou implicitement sur †b, • but mis en attente : -b, l’usager ou la machine résolvent temporairement un autre problème, • but réparé : b’, à la suite d’une incompréhension le but est modifié, • but déplacé : b’, à la suite d’un compromis le but est modifié, • sous-but : sb, le problème est décomposé en sous-problèmes, • but abandonné : @b, à la suite d’un échec ou d’un souhait d’abandon.
L’action • Les unités élémentaires sont les actes de langage de la forme Fp, avec : • FAp: faire p (action), les effets immédiats obtenus sont p (déclaratif) • FFp : faire-faire p, demande de faire p, les effets p sont différés (directif) • FSp : faire savoir p, les effets sont obtenus immédiatement (assertif, FS(Ø) note un expressif) • FFSp : faire faire-savoir p, demande information sur p, la réponse est différée • FPp : faire pouvoir p, offre un choix fermé, la réplique est attendue parmi p (promissif) • FDp : faire devoir p, oblige une action dont l’effet sera p (directif)
Règles du jeu Consistance de U devant ses buts FSUb ¬b ?b U pose un nouveau but en le manifestant FSUb2 b1 -b1 ?b2 si U manifeste un deuxième but b2 alors qu’un autre but b1 est déjà en cours, on met ce dernier en attente (car on ne traite le dialogue que sur un fil, c’est-à-dire échange par échange) ‡b FSUb@b U n’a pas de raison de maintenir un but satisfait †b ¬FSUb ‡b si un but est atteint et que U ne le conteste pas, il est satisfait de manière implicite †b FSU (¬b) @b si un but est atteint et que U le conteste, on l’abandonne FSU (@b) @b U peut décider d’abandonner un but de propos délibéré
Règles du jeu Consistance de U devant les buts de M b FUples actes a de U sont motivées par le but courant ¬FUp la non-action est une incompréhension FSM b ¬b ?b si elle pose un but, il est accepté par U FPMb FSUb si elle donne un choix à U sur les buts, celui-ci le fait FDMb FAUb si elle donne une obligation à U sur le but, celui-ci le fait Les attentes sont motivées par l’efficacité FAxp Þ Cyp les effets de l’acte sont pris en compte par l’allocutaire FFxp Þ FAyp FFSyp l’acte attendu est une contribution au FF demandé FPxp FDxp Þ FAyp FFyp l’acte attendu est un choix d’action parmi ceux proposés FSxp Þ Cyp FFSyp une information est prise en compte ou clarifiée FFSxp Þ FSyp FFSyp une question motive la réponse ou une demande de clarification
Gestion des buts FSb Ù ¬b Þ ?b un nouveau but est empilé et devient candidat à la résolution b Þ †b le but est atteint et marqué comme tel FS(†b1) Ú (†b1Ù FSb2Ù (b1b2)) Þ ‡b1 le but est satisfait après accord explicite ou implicite de celui qui a posé le but (il est alors dépilé) FSMb’ Ù (b’= sb ) Þ?b’ Ù -b le but est déplacé par M pour des raisons de planification (il est empilé) FSMb’ Ù (b’ sb ) Þ?b’Ù @b le but est déplacé par M pour des raisons motivées par la situation ou suite à un compromis ou à une réparation (il remplace b) ¬CMb Ù ?b Þ @b le but est abandonné car M ne sait pas le résoudre (il est dépilé) ¬ FSUb Ú ‡b Þ @ble but est abandonné si U change d’avis ou s’il est satisfait (il est dépilé)
Stratégie • Manière de gérer un échange pour atteindre et satisfaire le but (les rôles peuvent changer au cours des échanges) • Direction d’ajustement des buts • Soit bX le but de X et by celui de Y en début d’échange. Au cours de l’échange on peut avoir : • @ bx au profit de by : X est réactif (by bx) • Imposition de bx à Y : X est directif (bx by) • Partage des buts : X, Y sont coopératifs (bx by ) • Recherche d’un compromis : X, Y négocient (bxb’ by) • Détour constructif : X, Y font une incidence (bx Ø by)
Gestion du dialogue • Le « jeu de dialogue » est réglé par : • des règles de choix de stratégies, • des règles de comportement, • un mécanisme de contrôle, • des règles de reprise par des sous-dialogues, • une ontologie de jeu (description des sous-jeux ou des étapes).
Réactif (R) Règle :mode réactif si le nombre de tours de parole p depuis la précédente action (FA) dépasse un certain seuil. Ce mode est également activé en cas de refus d’une autre stratégie ou pour conclure un dialogue. Les conditions de complétude, de vérité et de réussite ne sont pas prises en compte. (p > p0) v FSU(réactif) v FSM(clôture) Þ (d = réactif) Comportement : FAUp Þ CMp U fait un acte, M en enregistre les effets FFUp Ù CondF(p) Þ FAMp Ù CMpU fait-faire un acte, M exécute et enregistre les effets ($a) Ù attr(a,p) Ù (a = Ø) Þ Défaut(a) si acte incomplet M complète par défaut ("a) Ù attr(a,p) Ù (a ¬= Ø) Ù p·Plan Þ CondF(p) l’acte doit pouvoir déclencher un Plan FSUpÙ CondS(p) Þ CMpU donne une information, M l’enregistre ($a) Ù attr(a,p) Ù (a¬= Ø) Þ CondS(p) FFSUp) Ù CMpÞ FSMpU pose une question, M y répond si elle connaît la réponse FPUp FDUp Þ FAMp Ù CMp M fait le choix proposé On pose : incomplet(p) = ($a) Ù attr(a,p) Ù (a = Ø), nonvide(p) = ($a) Ù attr(a,p) Ù (a¬= Ø) complet(p) = ("a) Ù attr(a,p) Ù (a ¬= Ø), l’opérateur · se lit « déclencheur de »
Directif (D) Règle :Au début l’initiative est à la machine pour lui permettre de “se” présenter et de connaître son interlocuteur. Elle doit être pour cela en mode directif. Elle revient à ce mode dès qu’une incompréhension surgit (pour éviter le risque de bouclage ou d’impasse). ((p = 0)) v (FSU(directif)) v (FSM(erreur)) Þ (d = directif) Comportement : FAMp Þ CMpÙCM(Cup)M fait un acte et en enregistre les effets FFMp Þ CM(FAUp) Ù CMp M fait-faire un acte, U est supposé exécuter FSMp Þ CM(Cup) M donne une info. et suppose que U l’accepte FFSMp Þ FSUpv FFSUp M pose une question, et attend de U une réponse FSUpÙ CondS(p) Þ CMpU donne une information, M l’enregistre nonvide(p) Þ CondS(p) FSU(contestation)Þ (d =négociation) si U conteste il y a changement de stratégie FFSUp Ù CMp Þ FSMp U pose une question de clarification, M y répond et reprend l’initiative FDMp ÞCM(FAUp) Ù CMp M fait-faire un acte, U est supposé exécuter
Coopératif (C1) Règle :Pour un novice, une action est menée en coopération si elle est incomplètement spécifiée et si le nombre de tours de parole depuis la précédente action n’est pas trop élevée. En situation de non-action, M propose une continuation au dialogue dans ce mode (relance). • ((p < p0) v (FSU(coop.)) Ù (FSUp Ù incomplet(p) Ù CM(u,novice)Þ (d = coopératif) • ¬FUp Þ (d = coopératif) Comportement : FAUp Þ CMp Ù FSMpU fait un acte, M en enregistre les effets et commente FFUp Ù CondF(p) Þ FAMp Ù CMpÙ FSMp U fait-faire un acte, M exécute et commente incomplet(p) Þ FSMp Ù FFSMp si acte incomplet M explicite et questionne alors FFSMp Þ FSUp complet(p) Ù p·Plan Þ CondF(p) l’acte doit pouvoir déclencher un Plan FFUp Ù ¬CondF(p) Þ FSM(¬p) Ù FFSMp’ si l’acte est erroné, M propose un but voisin FSUpÙ CondS(p) Þ CMpÙ FSMp U donne une information, M l’enregistre et commente nonvide(p) Þ CondS(p) FFSUpÞ FSMpU pose une question, M y répond si elle connaît la réponse, informe sinon FPUp FDUp Þ FAMp Ù CMp Ù FSMpM fait le choix proposé et le commente ¬FUÞ FPMpen cas de non action, M propose des choix à U Pour les cas où M a l’initiative voir la stratégie directive
Coopératif (C2) Règle :Pour un expert et chaque fois que cela est possible, mais surtout en début de nouvel échange le dialogue s’établit en mode intentionnel dans le but pour M de se ramener à une situation prototypique. Lorsqu’une situation prototypique est identifiée, acceptée comme telle par U, le plan peut être exécuté. (FSU(coopératif) v (?b Ù CM(u,expert) Þ (d = coopératif) Comportement : FFSMbÙCUb Þ FSUbÙ CMbM pose une question sur le but, U y répond si elle connaît la réponse sinonFPMb Þ FSUb Ù CMbM propose des buts possibles et U choisit CMb Ù b·Plan Ù ¬‡b Þ FAMPlan Ù FFSMb M exécute le plan par anticipation et demande confirmation Pour les autres cas où M a l’initiative voir la stratégie directive Pour les cas où U a l’initiative voir la stratégie coopérative précédente
Négocié (N) Règle :Une action supporte la négociation si elle est incomplètement spécifiée et si le nombre de tours de parole depuis la précédente action n’est pas trop élevée. La négociation est menée jusqu’à son terme, elle ne peut être rompue par la machine. ((p < p0) v FSU(négocié)) Ù FSUp Ù incomplet(p) Þ (d = négocié) Comportement : FAUp v FDUp Þ (d = réactif) U fait un acte qui interrompt d’autorité la négociation FPUp Þ (d = coopératif) U fait un acte qui interrompt d’autorité la négociation FFUpÙ CondNÞ FAMpÙ CMp U fait-faire un acte, M exécute sous condition Incomplet(p) Þ FFSMp si acte incomplet M négocie FFSMp Þ FSUp v (FSU(contestation) Ù FSUp’) (complet(p) Ù p·Plan) v (complet(p’) Ù p’·Plan) Þ CondNl’acte négocié doit pouvoir déclencher un Plan ¬CondNÞ FFSMpsi l’acte n’est pas exécutable, M continue de négocier FSUp Ù CondS(p) Þ CMp U donne une information, M l’enregistre si d’accord nonvide(p) Ù ¬CM(¬p)Þ CondS(p) ¬Cond(p)Þ FSMp(contestation) Ù FFSMp’ si l’information est erronée, M négocie FFSUp Ù CMp Þ FSMp U pose une question, M y répond Pour les cas où M a l’initiative voir la stratégie directive
Constructif (K) Règle :La stratégie constructive sert surtout à alerter l’usager ou à attirer son attention sur des sujets voisins de son propos. Elle peut être utilisée si le thème du dialogue n’a pas évolué depuis un certain temps et qu’aucune action n’est été faite. Elle peut être utilisée enfin comme un moyen de détour. ((p > p0) v (FSU(constructif)) Ù (focus = constant))Þ (d = constructif) Comportement : FUp Þ FSMp Ù FFSMp’ Ù (d = coopératif) pour tout acte de U, M le commente et pose une question dans un propos voisin, puis passe en stratégie coopérative FFSMp’ Þ FSUp’ (FUp Ù (d = réactif))
Ontologie de (sous)jeux élémentaires Un sous-jeu est un jeu (par récursivité)