1 / 23

A q (Algorithme de l’étoile)

A q (Algorithme de l’étoile). Jérôme AZÉ LRI – équipe IA. Plan. Présentation de A q Algorithme Un exemple Défauts de la méthode Solution apportée Application à la génomique. A q (Algorithme de l’étoile). Proposé par R. Michalski (1969) Problème : un ensemble d’attributs

Download Presentation

A q (Algorithme de l’étoile)

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Aq (Algorithme de l’étoile) Jérôme AZÉ LRI – équipe IA

  2. Plan • Présentation de Aq • Algorithme • Un exemple • Défauts de la méthode • Solution apportée • Application à la génomique DEA I3 - Module Génomique

  3. Aq (Algorithme de l’étoile) • Proposé par R. Michalski (1969) • Problème : • un ensemble d’attributs • 2 classes (POS, NEG) • Objectif : • Apprendre une description correcte et complète de la classe POS DEA I3 - Module Génomique

  4. Ensemble d’apprentissage DEA I3 - Module Génomique

  5. Algorithme • Diviser les exemples en deux sous ensembles (POS, NEG) • Choisir un exemple dans POS (le noyau) • Trouver un ensemble de règles générales caractérisant le noyau (l’étoile) • Choisir la meilleure règle dans l’étoile • Itérer s’il reste des exemples non couverts dans POS DEA I3 - Module Génomique

  6. M T N S F3 F4 F6 E3 R E4 E1 F5 X Y Z Changement de représentation (1/4) DEA I3 - Module Génomique

  7. N M T T M N S S F3 F2 F4 F1 F6 E3 R R E2 E4 E1 F5 X X Y Y Z Z Changement de représentation (2/4) DEA I3 - Module Génomique

  8. Changement de représentation (3/4) DEA I3 - Module Génomique

  9. Changement de représentation (4/4) DEA I3 - Module Génomique

  10. Apprentissage (1/4) • Choix du noyau : E1 • Génération de l ’étoile de E1 tel que F1 ne soit pas couvert DEA I3 - Module Génomique

  11. Apprentissage (2/4) F1 • E1 : • (Att1 = Y) • (Att2 = N) • (Att3 = R) • Négation de F1 : • (Att1 = Y v Z) • (Att2 = N) • (Att3 = R v T) E1 DEA I3 - Module Génomique

  12. F2 Apprentissage (3/4) • Prise en considération de F2 • Att3 = R • (Att3 = (R v S)) & (Att1 = (Y v Z)) • Att2 = N DEA I3 - Module Génomique

  13. Apprentissage (4/4) • Prise en considération de F3 (ou F4) • (Att3 = R) & (Att1 = X v Y) • (Att3 = (R v S)) & (Att1 = (Y v Z)) F3 F4 DEA I3 - Module Génomique

  14. Étoile de E1 • La spécialisation des règles conduit à : R1’ : (att1 = X v Y) & (att3 = R) R2’ : (att1 = Y) & (att3 = R v S) DEA I3 - Module Génomique

  15. Critères de sélection des règles dans l’étoile • Maximiser le nombre d ’éléments couverts par la règle retenue • Minimiser le nombre d ’attributs de la règle retenue • Maximiser la capacité à généraliser de la règle retenue • ... DEA I3 - Module Génomique

  16. Critère et règle retenus • Maximiser le nombre d’exemples couverts • Règle retenue : • R1’ : (att1 = X v Y) & (att3 = R) E3 DEA I3 - Module Génomique

  17. Itération de l’algorithme • Exemple non couvert par R1’ : E3 • Étoile de E3 : • R : (att1 = Y) & (att3 = R v S) DEA I3 - Module Génomique

  18. Résultat final • Deux règles permettent de caractériser POS par rapport à NEG • R1 : (att1 = X v Y) & (att3 = R) • R2 : (att1 = Y) & (att3 = R v S) DEA I3 - Module Génomique

  19. Défauts de Aq • Sensibilité au bruit dans les classes • Sensibilité liée à l’imprécision du contexte • Solution proposée par R. Michalski (1990) • approche à deux niveaux (two-tiered approach ) DEA I3 - Module Génomique

  20. Approche à deux niveaux(1/3) • Idée : • découper la description de la classe POS en deux parties : • Représentation de Base du Concept (RBC) • Interprétation Inférentielle du Concept (IIC) • Possibilité d’apprendre des concepts flexibles DEA I3 - Module Génomique

  21. Approche à deux niveaux(2/3) • Algorithme • Utiliser Aq pour obtenir l’ensemble initial de règles • Retenir la règle la plus importante (nombre maximal d’éléments de POS couverts) : RBC • Définir la procédure IIC pour reconnaître les éléments de POS non couverts par RBC DEA I3 - Module Génomique

  22. Approche à deux niveaux(3/3) • Exemple • BCR : si A1 & A2 & … & An alors POS • IIC : au moins 3 conditions parmi A1, …, An doivent être vérifiées IIC BCR DEA I3 - Module Génomique

  23. Application à la génomique • Caractériser des gènes (ou des protéines) par classes de fonctions • Caractériser des séquences d’ADN (ou d’ARN) selon certaines propriétés DEA I3 - Module Génomique

More Related