230 likes | 359 Views
A q (Algorithme de l’étoile). Jérôme AZÉ LRI – équipe IA. Plan. Présentation de A q Algorithme Un exemple Défauts de la méthode Solution apportée Application à la génomique. A q (Algorithme de l’étoile). Proposé par R. Michalski (1969) Problème : un ensemble d’attributs
E N D
Aq (Algorithme de l’étoile) Jérôme AZÉ LRI – équipe IA
Plan • Présentation de Aq • Algorithme • Un exemple • Défauts de la méthode • Solution apportée • Application à la génomique DEA I3 - Module Génomique
Aq (Algorithme de l’étoile) • Proposé par R. Michalski (1969) • Problème : • un ensemble d’attributs • 2 classes (POS, NEG) • Objectif : • Apprendre une description correcte et complète de la classe POS DEA I3 - Module Génomique
Ensemble d’apprentissage DEA I3 - Module Génomique
Algorithme • Diviser les exemples en deux sous ensembles (POS, NEG) • Choisir un exemple dans POS (le noyau) • Trouver un ensemble de règles générales caractérisant le noyau (l’étoile) • Choisir la meilleure règle dans l’étoile • Itérer s’il reste des exemples non couverts dans POS DEA I3 - Module Génomique
M T N S F3 F4 F6 E3 R E4 E1 F5 X Y Z Changement de représentation (1/4) DEA I3 - Module Génomique
N M T T M N S S F3 F2 F4 F1 F6 E3 R R E2 E4 E1 F5 X X Y Y Z Z Changement de représentation (2/4) DEA I3 - Module Génomique
Changement de représentation (3/4) DEA I3 - Module Génomique
Changement de représentation (4/4) DEA I3 - Module Génomique
Apprentissage (1/4) • Choix du noyau : E1 • Génération de l ’étoile de E1 tel que F1 ne soit pas couvert DEA I3 - Module Génomique
Apprentissage (2/4) F1 • E1 : • (Att1 = Y) • (Att2 = N) • (Att3 = R) • Négation de F1 : • (Att1 = Y v Z) • (Att2 = N) • (Att3 = R v T) E1 DEA I3 - Module Génomique
F2 Apprentissage (3/4) • Prise en considération de F2 • Att3 = R • (Att3 = (R v S)) & (Att1 = (Y v Z)) • Att2 = N DEA I3 - Module Génomique
Apprentissage (4/4) • Prise en considération de F3 (ou F4) • (Att3 = R) & (Att1 = X v Y) • (Att3 = (R v S)) & (Att1 = (Y v Z)) F3 F4 DEA I3 - Module Génomique
Étoile de E1 • La spécialisation des règles conduit à : R1’ : (att1 = X v Y) & (att3 = R) R2’ : (att1 = Y) & (att3 = R v S) DEA I3 - Module Génomique
Critères de sélection des règles dans l’étoile • Maximiser le nombre d ’éléments couverts par la règle retenue • Minimiser le nombre d ’attributs de la règle retenue • Maximiser la capacité à généraliser de la règle retenue • ... DEA I3 - Module Génomique
Critère et règle retenus • Maximiser le nombre d’exemples couverts • Règle retenue : • R1’ : (att1 = X v Y) & (att3 = R) E3 DEA I3 - Module Génomique
Itération de l’algorithme • Exemple non couvert par R1’ : E3 • Étoile de E3 : • R : (att1 = Y) & (att3 = R v S) DEA I3 - Module Génomique
Résultat final • Deux règles permettent de caractériser POS par rapport à NEG • R1 : (att1 = X v Y) & (att3 = R) • R2 : (att1 = Y) & (att3 = R v S) DEA I3 - Module Génomique
Défauts de Aq • Sensibilité au bruit dans les classes • Sensibilité liée à l’imprécision du contexte • Solution proposée par R. Michalski (1990) • approche à deux niveaux (two-tiered approach ) DEA I3 - Module Génomique
Approche à deux niveaux(1/3) • Idée : • découper la description de la classe POS en deux parties : • Représentation de Base du Concept (RBC) • Interprétation Inférentielle du Concept (IIC) • Possibilité d’apprendre des concepts flexibles DEA I3 - Module Génomique
Approche à deux niveaux(2/3) • Algorithme • Utiliser Aq pour obtenir l’ensemble initial de règles • Retenir la règle la plus importante (nombre maximal d’éléments de POS couverts) : RBC • Définir la procédure IIC pour reconnaître les éléments de POS non couverts par RBC DEA I3 - Module Génomique
Approche à deux niveaux(3/3) • Exemple • BCR : si A1 & A2 & … & An alors POS • IIC : au moins 3 conditions parmi A1, …, An doivent être vérifiées IIC BCR DEA I3 - Module Génomique
Application à la génomique • Caractériser des gènes (ou des protéines) par classes de fonctions • Caractériser des séquences d’ADN (ou d’ARN) selon certaines propriétés DEA I3 - Module Génomique