1 / 44

Apprentissage Data mining ILP KDD

Apprentissage Data mining ILP KDD. Formal Concept Analysis. Un contexte est un triplet (O,A,I) où O et A sont des ensembles et I  OAest une relation. Correspondance de Galois. • Soit ƒ l’application qui à tout élément o de O associe ƒ(o)={a A / (o,a)  I}

huey
Download Presentation

Apprentissage Data mining ILP KDD

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. ApprentissageData miningILPKDD

  2. Formal Concept Analysis Un contexte est un triplet (O,A,I) où O et A sont des ensembles et I OAest une relation.

  3. Correspondance de Galois • Soit ƒ l’application qui à tout élément o de O associe ƒ(o)={aA / (o,a)  I} g l’application qui à tout élément a de A associe g(a)={oO / (o,a)  I} • ƒ et g sont étendues aux parties de O et de A comme suit: Pour O1O et A1A ƒ(O1)= oO1 ƒ(o) g(A1)= aA1 g(a) • On note h=g o ƒ et h’= ƒ o g

  4. Propriétés des fonctions ƒ, g et h,h’ • ƒ et g sont des applications monotones décroissantes O1  O2  ƒ(O1)  ƒ(O2) • h et h’ sont des applications monotones croissantes, extensives et idempotentes. O1  O2  h(O2)  h(O1) O1  h(O1) h(O1)=h(h(O1))

  5. Concept Pour un contexte (O,A,I) Le couple [01,A1] O1  O, A1  A est un concept ssi ƒ(O1)=A1 et g(A1)=O1 O1 est appelé l’extension du concept A1 est appelé l’intention du concept Exemple pour la relation binaire précédente [{01,02,03,04},{a1,a2,a3,a4}] est un concept [{01,02,03},{a4,a5}] n’est pas un concept en effet ƒ({01,02,03})={a1,a2,a3,a4}≠{a4,a5} de plus g({a3,a4})={01,02,03,04}≠{01,02,03} Remarque Du point de vue de la relation binaire, un concept est un rectangle maximal rempli de ‘1’

  6. Ordre sur les concepts • Pour deux concepts [O1,A1] et [O2,A2] d’un contexte (O,A,I) [O1,A1]≥ [ 02,A2]  A1A2  O2 O1 On dit que le concept [01,A1] est plus général que le concept [O2,A2].

  7. Treillis de Galois (Treillis des concepts) Théorème L’ensemble L de tous les concepts d’un contexte (O,A,I), muni de la relation d’ordre ≥, possède la structure mathématique de treillis et est appelé treillis de Galois (ou des concepts) du contexte (O,A,I). [g(A’),A’=A1A2] [O1,A1] [O2,A2] [O’=O1O2,ƒ(O)]

  8. Complexité • Opération  entre concepts Calcul de l’intersection de deux ensembles A1,A2 O(|A1|+|A2|) si A1 et A2 sont triès Calcul de g(A) O(|ƒ(a)|) aA Ceci peut être fait par des opérations binaires rapides.  Polynomialité du calcul des  (et ) • La taille du treillis peut être en 2k ou k=min(|O|,|A|)

  9. Algorithmes Il y a de nombreux algorithmes Un algorithme Norris (Repris par Godin avec relation d’ordre) Entrées: Une liste L de concepts Un nouvel exemple {e, Ae} Pour Ci:(Oi,Ai)L Si AeAi ajoute e à Oi Sinon Faire Cn=Ci {e, Ae} Si Cn est nouveau ajout à L Si {e, Ae} nouveau (non = Ae) ajout à L Sortie: Nouveau L => algorithme incrémental

  10. Exemple [{01,02,03,04,05,06,07}{a1}] [{01,02,03,04,05,06}{a1,a2}] [{01,02,03,04,06,07}{a1,a3}] [{01,02,03,04,05}{a1,a2,a4}] [{01,02,03,05,06}{a1,a2,a5}] [{01,02,03,04,06}{a1,a2,a3}] [{01,02,04,07}{a1,a3,a6}] [{01,02,03,05}{a1,a2,a4,a5}] [{01,02,03,04}{a1,a2,a3,a4}] [{01,02,03,06}{a1,a2,a3,a5}] [{01,02,05}{a1,a2,a4,a5,a7}] [{01,02,03}{a1,a2,a3,a4,a5}] [{01,02,03}{a1,a2,a3,a4,a6}] [{02,03,06}{a1,a2,a3,a5,a8}] [{01,03}{a1,a2,a3,a4,a5,a7}] [{01,02}{a1,a2,a3,a4,a5,a6}] [{01,03}{a1,a2,a3,a4,a5,a8}] [{03}{a1,a2,a3,a4,a5,a7,a8}] [{01}{a1,a2,a3,a4,a5,a6,a7}] [{02}{a1,a2,a3,a4,a5,a6,a8}] [{}{a1,a2,a3,a4,a5,a6,a8}]

  11. Généralisation

  12. Deux treillis Treillis des classes f g Treillis des descriptions Treillis de Galois

  13. Cas propositionnel Eg  E1  E2Ag=A1 A2 E1 A1 E A E A E2 A2 Es = E1  E2 As  A1  A2 Concepts et Relations. Concepts: Extension Intention Structure de l’espace Ordre partiel E  E’ et A ’ E’ A’

  14. Cas général Eg  E1  E2Dg=D1 D2 E1 D1 E D E D E2 D2 Es = E1  E2Ds ≤ D1  D2 Concepts et Relations. Concepts: Extension Intention Description Structure de l’espace Ordre partiel E  E’ et D D’ E’ D’

  15. L-Langage de description Catégorie Objet: expression du langage de description -> : Ordre partiel (être plus général que)  : Opérateur de généralisation (produit catégoriel) D’ D1  D2 D1 D2 Exemple Langage propositionnel Objet: Liste d’attributs ->:   : 

  16. Relation entre graphes Morphisme Un homomorphisme entre deux graphes étiquettés G1:(V1,E1,L1), G2:(V2,E2,K2à est une application ƒ:V1 -> V2 telle que  v  V1 , L(v)=L(ƒ(v)) et pour (v1,v2)  E1 alors (ƒ(V1),ƒ(V2)) E2 Notation G1 ≥ G2 Complexité NP-Complet pour des graphes quelconques Ordre ?: Pre-ordre entre les graphes (manque l’anti-symétrie)

  17. Graphe irredondant Graphe irredondant (code graph): Un graphe irredondant est un graphe qui n’a pas d’homomorphisme sur un de ses sous-graphes. La relation d’homomorphisme, pour les graphes irredondants, est une relation d’ordre partiel. Théorème La structure de l’ordre partiel basé sur l’homomorphisme entre des graphes irredondants est un treillis.

  18. Graphe -> Graphe irredondant On considére que deux graphes sont équivalents ssi g1 ≥ g2 et g2 ≥ g1. Propriété Pour un ensemble de graphes équivalents il existe un unique graphe irredondant minima (plus petit nombre de sommets). Complexité de la Recherce du graphe minima Réduction: NP-complet Propriété Si, pour une sous-classe spécifique de graphes, l’opération d’homomorphisme est polynomiale alors la complexité de l’opération de réduction est aussi polynomiale.

  19. Homomorphisme polynomial • L’homomorphisme d’un arbre dans un graphe est polynomial • • Un graphe étiquetté G:(V,E) est dit localement injectif ssi • pour chaque sommet vV, • v1,v2 N(v) (voisins de V) alors si v1≠v2, L(v1)≠L(v2) Notation LIG graphe Cette définition peut facilement être étendue au cas des graphes orientés. Propriétés L’homomorphisme entre deux LIG est polynomial. Un LIG connexe est irredondant.

  20. Produit de deux graphes Pour deux graphes étiquetés G1:(V1,E1,L1) G2:(V2,E2,L2) Le produit G(V,E,L)= G1*G2 est défini par: L = L1  L2 V V1 x V2= {v / v=[v1,v2] avec L(v1)=L(v2)=L(v)} U={(v=[v1,v2],v’=[v’1,v’2]) / (v1,v’1)  V1 et (v2,v’2)  V2} Complexité: Polynomiale O(|V1|*|V2|)

  21. Opérateur de généralisation Pour deux graphes irredondants G1,G2 G1G2=Reduction(G1*G2) Propriété L’opération  est un opérateur de généralisation sur les graphes

  22. Questions:Morphisme injectif • Ordre partiel => gestion ensembliste • opérateur de généralisation ???

  23. Exemples de L-Langages

  24. Treillis de Galois Théorème pour un ensemble d’exemples O, un L-langage de description L et une application d de O dans L, l’espace de recherche (classification) est structuré sous la forme d’un treillis de Galois Notation TG(L,O,d)

  25. Treillis de Galois pour L=GLI rectangle rectangle right {0,1} on {1,4} {2,4} on rectangle on square rectangle circle circle right rectangle rectangle on on {0,1,2} {0,1,3} {0,1,4} circle on rectangle rectangle right on circle {0,1,2,3} {0,1,3,4} {0,1,2,4} {0,1,2,3,4}

  26. Propositionnalisation

  27. Propositionnalisation • Passage d’une description structurelle à une description propositionnelle équivalente. Interêt gain en utilisation, réutilisation, explication (création d’une ontologie) • équivalence ? • complexité de la recherche ?

  28. Exemple Structurel / propositionnel Rb(f3),Rn(f7),Fn(c2),Cb(a7),Pb(c6),Pb(h6),Pn(f6),Pn(h4) 1 c7 Bf5 2 Nc6 Bh3 3 Ne7 Bd7 4 h7 Kg7 5 Ng6 Kxh7 6 Nf8+ Egalité matérielle Non Opposition Fou noir 2° Grande Diagonale Cavalier blanc Coin 2 Pions blancs avancés 1 Pion noir avancé Rectangle arrêt Roi blanc ….

  29. Irréductibles irréductible: Elément d’un treillis ayant un seul prédécesseur irréductible : Elément d’un treillis ayant un seul successeur. irréductibles irréductibles

  30. Irréductibles et Treillis A partir de l’ensemble des irréductibles et des irréductibles d’un Treillis T on construit la relation binaire R suivante: A chaque élément irréductibles x on associe l’ensemble R(x) des éléments irréductibles ≥ à x Théorème le Treillis de Galois construit à partir de la relation binaire R et isomorphe au treillis T. (Birkhoff)

  31. Equivalence entre L-langages Définition Deux L-Langages L1 et L2 sont dit équivalent pour un même ensemble d’exemples O  TG(L1,O,d1) TG(L2,O,d2) Théorème Pour tout L-Langage L et un ensemble d’exemple O décrit par des expression de L. Il existe un L-langage propositionnel LP minimal équivalent à L. Ce langage LP est construit à partir de l’ensemble des irréductibles du treillis de Galois TG(L,O)

  32. Irréductibles et Treillis de Galois S1 S2 S3 rectangle rectangle S4 right on on {2,4} rectangle on square {0,1} {1,4} rectangle circle circle right rectangle rectangle on on circle {0,1,2} on rectangle rectangle right on {0,1,3} {0,1,4} circle S5 S6 S7 {0,1,2,3} {0,1,2,4} {0,1,3,4} {0,1,2,3,4}

  33. L-Langage propositionnel

  34. Parcours de l’espace des descriptions Expression de L Etre plus générale que ••• Opérateur de spécialisation S: S(d)=d1 tel que d > d1 Opérateur de spécialisation complet: S(d)=d1 tel que d > d1 et  d2 / d > d2 > d1 -----> Base de certaines méthodes ILP: Parcours Aveugle Spécialisation infinie

  35. Espace de spécialisation et exemple ••• Expression apparaissant En même temps Expression n’apparaissant Pas sur les exemples

  36. Complexité de la recherche des irréductibles Idée 1) Construction du treillis en généralisation construction complète: taille du treillis importante complexité de l’opération -Irréductibles dans le haut du treillis Idée 2) Parcours de l’espace en spécialisation avec utilisation de l’opération 

  37. E1 A1 E2 A2 E2 A3 En An Es = E1  E2 As ≤ A1  A2 Es = E1  En As ≤ A2  An2 Principe …… … • Nécessite A1, A2, ……An Retour au cas propositionnel !! Spécialisation des langages LD1

  38. Langage de décomposition Définition Pour un langage de description L, Un langage de décomposition LD est inclus dans L, il existe un opérateur permettant de trouver les expressions de LD présente dans une expression de L Exemple Langage de description Graphe Langage de décomposition Chemin de longueur k

  39. Algorithme RechIrre Entree : un contexte (E,A,R) (relation binaire) Sortie ; l’ensemble des -irreductibles R=Ø Elimination des égalités (réunion en un seul attribut des attributs tel que e(a1)= e(a2)) Pour chaque attribut a si estIrreductible(a) ajouter a à R retourner Complexité: O(|A]2*|E|)

  40. Exemple chemin longueur 0 -irréductibles [{0,1,4},{right}] [{0,1,3,4},{Circle}] [{2,4},{Square}]

  41. Exemple chemin longueur 1 Recherche des -Irréductibles: Polynomiale ici!!

  42. Complexité La recherche des -irréductibles dépend de la complexité de la recherche des éléments de LD du calcul de la relation d’ordre entre les éléments de LD du calcul de l’appariement d’un élément de LD avec un élément de L Pour une étape k, si ces trois calcul sont polynomiaux / nombre d’exemples et le nombre d’expressions du langage LD alors la méthode est polynomiale Exemple L=graphe et LDk={chemins élémentaires de longueur k} Calcul polynomial à chaque étape (anytime)

  43. Opérateur de spécialisationpour les graphes Produit de Graphes G1:(E1,A1) G2:(E2,A2) On calcule E1xE2 puis on met un arc entre (e1,e2) et (e’1,e’2) (e1,e’1)  A1 et (e2,e’2)  A2 Généralisation de l’opération produit pour n graphes: Principe: Pour un ensemble  de graphes S:(e1,e2,…em) >>>> S’:(e’1,e’2,…e’n) ssi e  S ,  e’  S’ tel que (e,e’)  G  

More Related