1 / 33

Logique et Compression

Logique et Compression. Université Paris II Michel de Rougemont mdr@lri.fr http://www.lri.fr/~mdr. Compression de structure finies : mots, graphes. Définissabilité sur les structures compressées. Définissabilité. Compression.

kyne
Download Presentation

Logique et Compression

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Logique et Compression Université Paris II Michel de Rougemont mdr@lri.fr http://www.lri.fr/~mdr Compression de structure finies : mots, graphes. Définissabilité sur les structures compressées. 30 Avril 2001

  2. Définissabilité Compression • Représentation d’un objet influe sur la complexité d’un problème. A. Wigderson, 1988 • Informatique : schémas de compression : .zip, .jpeg, .mpeg, .mp3 (recherche par le contenu). • Approche logique pour ces schémas? • Nouveaux schémas? 30 Avril 2001

  3. Thèmes et résultats • Compression de mots • Lempel-Ziv: F.O. n’est pas conservé. Caractérisation logique. • Run-length, Antidictionnaire, Aléatoire • Compression de graphes • Programme, OBDDs, Aléatoire • Abstraction et compression 30 Avril 2001

  4. Définissabilité • Logique • FO • SO • Complexité • L, , P • NP, PH • Classes de structures • Mots • Graphes • FO (TC) NL 30 Avril 2001

  5. Compression • Schéma de compression Compresion Decompression • Comparaisons : codage, cryptologie 30 Avril 2001

  6. Schémas de Compression • Universels • Indépendants de la distribution • Lempel-Ziv • …. • Dépendants du type de signal • JPEG • MPEG • MP3 30 Avril 2001

  7. Famille Lempel-Ziv • Universels • LZ77, LZ78,…. • Problèmes Algorithmiques: • Rechercher un sous-mot (Farach,…) • Rechercher une expression régulière 30 Avril 2001

  8. Famille Lempel-Ziv A=({1,2,…,11},<, U) B=({1,2,…5}, <, U, E ) U unaire E binaire B : 0 0 1 1 0 A : 0 00 01 001 010 30 Avril 2001

  9. Définissabilité sur Lempel-Ziv • Propriété de mots: L = 00 11 + + 30 Avril 2001

  10. Définissabilité sur Lempel-Ziv 0 0 0 1 1 1 1 0 00 000 0001 1 11 111 30 Avril 2001

  11. Définissabilité sur Lempel-Ziv • Sur la structure B, on peut écrire: U est faux sur le 1er ordre linéaire et vrai sur le 2ième ordre linéaire + + 30 Avril 2001

  12. Non-Définissabilité • Propriété de mots: L= 0.1.00.10.000.100.0000.1000.00000.1000a.000000 0.1.00.10.000.100.0000.1000.0000a.10000 + + 1 0 0 0 0 0 30 Avril 2001

  13. Versions compressées • B1 et B2 sont k-équivalentes 1 0 0 a 0 0 0 1 0 0 0 a 0 30 Avril 2001

  14. Résultats • Négatif: Théorème : il existe une propriété de mots définissable au 1er ordre qui n’est pas définissable au 1er ordre sur Lempel-Ziv. • Caractérisation logique Théorème : toute propriété de mots définissable au 1er ordre définissable dans le langage FO(TC) sur Lempel-Ziv. 30 Avril 2001

  15. Translation simple • Sur les mots : • Sur Lempel-Ziv : i est déterminé par 2 blocks j,k 1 0 0 0 0 0 k j 30 Avril 2001

  16. Autres Schémas de Compression • Mots • Run-length 000000011111100000 représenté par (0,7)(1,6)(0,5) ou • Antidictionnaire (mots les plus courts qui n’apparaissent pas dans un langage). Approche de Crochemore. 30 Avril 2001

  17. Résultats sur Run-length • Mots • Propriétés au 1er ordre inchangées • Images (Mots en 2 dimension) • Il existe une propriété du 1er ordre qui n’est pas définissable sur la structure compressée. (Forme géométrique comme un carré). 30 Avril 2001

  18. Résultats sur les antidictionnaires • Motivation : algorithmique de mots • Recherche linéaire d’un motif. Génomique. • Approche Shibata, Takeda, Shonohara, Arikawa, 1999 : recherche O(n) ? 30 Avril 2001

  19. Compression approximative • JPEG, MPEG : facteur de résolution • JPEG : précision des coefficients de Fourier • Utilisation : marquage des données 30 Avril 2001

  20. Compression aléatoire • Comment conserver des propriétés de mots avec grande probabilité? • Testeur de N. Alon, Krivelevich, Newman, Szegedy, FOCS99 • Property testing : Goldreich, Goldwasser, Ron, FOCS96, JACM 2001 30 Avril 2001

  21. Testeur • Soit P une propriété de mot ( langage régulier) • Algorithme randomisé tel que: • Si P(w) alors Proba (Accept ) > 2/3 • Si w est de P alors Proba(Reject) >2/3 • Minimiser le nombre de requêtes de U(i). 30 Avril 2001

  22. Testeur AKNS et compression • Echantillonner des sous-mots de longueur m • Une structure finie permet de décider avec grande probabilité si : • P(w) ou • w est de P 30 Avril 2001

  23. II. Compression de graphes • Schéma Universel? • Programme P(x1,x2,…xn) définit un système de transition: • S : états et R sont les transitions • P non déterministe/probabiliste 30 Avril 2001

  24. Vérification par modèle • OBDD (Ordered binary Decision Diagram) • U,G |= true U Accept => G |= F • Spécification O1 • Programme • Vérifier : comparer les OBDDs 30 Avril 2001

  25. OBDD : Oriented Binary Decision Diagram • Branching programs • Succinct representation of relations • Intractable for: • Multiplication • Connectivity, Bipartition v1 v2 vn 0 1 R(v1,v2,….vn) 30 Avril 2001

  26. Communication Complexity • Communication Complexity • Examples: • Avg ( X, Y) where X={x1,….xn} and Y={y1,….yn} • Equality(x,y) A B 30 Avril 2001

  27. Communication Complexity • Communication Complexity of a boolean function : bipartite(x) • C1,C2 : partition of the input ( n^2 bits) • P is the protocol for the partition • COM(bipartite, C1,C2,x ) = #bits exchanged • CC(bipartite)= Min_(C1,C2,P) Max_x COM 30 Avril 2001

  28. Communication Complexity • Communication matrix • M(bipartite, C1,C2) = • G=(x1,x2) is bipartite x2 x1 1 30 Avril 2001

  29. Communication Complexity • CC(f) > log (rank (M)) • M(bipartite,C1,C2) contient une sous matrice de rang élevé. • M(P,P’): ssi P v P’=1 • N(P,P’): P’ P 1 P’ • si 1,2 dans le meme ensemble de P v P’ P 1 30 Avril 2001

  30. Lower bound on the size of OBDDs v1 v2 A OBDD’s width is an instance of 1-way communication protocol. CC(f) < log width B vn 0 1 R(v1,v2,….vn) 30 Avril 2001

  31. Results • Theorem : k-bipartiteness has OBDDs of exponential sizes. • Applications : approximate verification in model-checking. 30 Avril 2001

  32. Probabilistic abstraction • Compressed structure : random subgraphs • Transition system of a program represented by the compressed transition system C(U,G) • Program correct => C(U,G) |= F’ • Program far from correct => Prob [C(U,G) |= not F’]>2/3 • Works for all Sigma_2 formulas (Alon and al. FOCS 99) Collaboration F. Magniez et S. Laplante 30 Avril 2001

  33. Conclusion • Schémas de compression K--> K’ • Propriété F définie sur K dans une logique L est aussi définie sur K’ dans une logique L’. • Complexité descriptive capture un schéma de compression. • Applications : vérification, recherche par contenu 30 Avril 2001

More Related