330 likes | 465 Views
Logique et Compression. Université Paris II Michel de Rougemont mdr@lri.fr http://www.lri.fr/~mdr. Compression de structure finies : mots, graphes. Définissabilité sur les structures compressées. Définissabilité. Compression.
E N D
Logique et Compression Université Paris II Michel de Rougemont mdr@lri.fr http://www.lri.fr/~mdr Compression de structure finies : mots, graphes. Définissabilité sur les structures compressées. 30 Avril 2001
Définissabilité Compression • Représentation d’un objet influe sur la complexité d’un problème. A. Wigderson, 1988 • Informatique : schémas de compression : .zip, .jpeg, .mpeg, .mp3 (recherche par le contenu). • Approche logique pour ces schémas? • Nouveaux schémas? 30 Avril 2001
Thèmes et résultats • Compression de mots • Lempel-Ziv: F.O. n’est pas conservé. Caractérisation logique. • Run-length, Antidictionnaire, Aléatoire • Compression de graphes • Programme, OBDDs, Aléatoire • Abstraction et compression 30 Avril 2001
Définissabilité • Logique • FO • SO • Complexité • L, , P • NP, PH • Classes de structures • Mots • Graphes • FO (TC) NL 30 Avril 2001
Compression • Schéma de compression Compresion Decompression • Comparaisons : codage, cryptologie 30 Avril 2001
Schémas de Compression • Universels • Indépendants de la distribution • Lempel-Ziv • …. • Dépendants du type de signal • JPEG • MPEG • MP3 30 Avril 2001
Famille Lempel-Ziv • Universels • LZ77, LZ78,…. • Problèmes Algorithmiques: • Rechercher un sous-mot (Farach,…) • Rechercher une expression régulière 30 Avril 2001
Famille Lempel-Ziv A=({1,2,…,11},<, U) B=({1,2,…5}, <, U, E ) U unaire E binaire B : 0 0 1 1 0 A : 0 00 01 001 010 30 Avril 2001
Définissabilité sur Lempel-Ziv • Propriété de mots: L = 00 11 + + 30 Avril 2001
Définissabilité sur Lempel-Ziv 0 0 0 1 1 1 1 0 00 000 0001 1 11 111 30 Avril 2001
Définissabilité sur Lempel-Ziv • Sur la structure B, on peut écrire: U est faux sur le 1er ordre linéaire et vrai sur le 2ième ordre linéaire + + 30 Avril 2001
Non-Définissabilité • Propriété de mots: L= 0.1.00.10.000.100.0000.1000.00000.1000a.000000 0.1.00.10.000.100.0000.1000.0000a.10000 + + 1 0 0 0 0 0 30 Avril 2001
Versions compressées • B1 et B2 sont k-équivalentes 1 0 0 a 0 0 0 1 0 0 0 a 0 30 Avril 2001
Résultats • Négatif: Théorème : il existe une propriété de mots définissable au 1er ordre qui n’est pas définissable au 1er ordre sur Lempel-Ziv. • Caractérisation logique Théorème : toute propriété de mots définissable au 1er ordre définissable dans le langage FO(TC) sur Lempel-Ziv. 30 Avril 2001
Translation simple • Sur les mots : • Sur Lempel-Ziv : i est déterminé par 2 blocks j,k 1 0 0 0 0 0 k j 30 Avril 2001
Autres Schémas de Compression • Mots • Run-length 000000011111100000 représenté par (0,7)(1,6)(0,5) ou • Antidictionnaire (mots les plus courts qui n’apparaissent pas dans un langage). Approche de Crochemore. 30 Avril 2001
Résultats sur Run-length • Mots • Propriétés au 1er ordre inchangées • Images (Mots en 2 dimension) • Il existe une propriété du 1er ordre qui n’est pas définissable sur la structure compressée. (Forme géométrique comme un carré). 30 Avril 2001
Résultats sur les antidictionnaires • Motivation : algorithmique de mots • Recherche linéaire d’un motif. Génomique. • Approche Shibata, Takeda, Shonohara, Arikawa, 1999 : recherche O(n) ? 30 Avril 2001
Compression approximative • JPEG, MPEG : facteur de résolution • JPEG : précision des coefficients de Fourier • Utilisation : marquage des données 30 Avril 2001
Compression aléatoire • Comment conserver des propriétés de mots avec grande probabilité? • Testeur de N. Alon, Krivelevich, Newman, Szegedy, FOCS99 • Property testing : Goldreich, Goldwasser, Ron, FOCS96, JACM 2001 30 Avril 2001
Testeur • Soit P une propriété de mot ( langage régulier) • Algorithme randomisé tel que: • Si P(w) alors Proba (Accept ) > 2/3 • Si w est de P alors Proba(Reject) >2/3 • Minimiser le nombre de requêtes de U(i). 30 Avril 2001
Testeur AKNS et compression • Echantillonner des sous-mots de longueur m • Une structure finie permet de décider avec grande probabilité si : • P(w) ou • w est de P 30 Avril 2001
II. Compression de graphes • Schéma Universel? • Programme P(x1,x2,…xn) définit un système de transition: • S : états et R sont les transitions • P non déterministe/probabiliste 30 Avril 2001
Vérification par modèle • OBDD (Ordered binary Decision Diagram) • U,G |= true U Accept => G |= F • Spécification O1 • Programme • Vérifier : comparer les OBDDs 30 Avril 2001
OBDD : Oriented Binary Decision Diagram • Branching programs • Succinct representation of relations • Intractable for: • Multiplication • Connectivity, Bipartition v1 v2 vn 0 1 R(v1,v2,….vn) 30 Avril 2001
Communication Complexity • Communication Complexity • Examples: • Avg ( X, Y) where X={x1,….xn} and Y={y1,….yn} • Equality(x,y) A B 30 Avril 2001
Communication Complexity • Communication Complexity of a boolean function : bipartite(x) • C1,C2 : partition of the input ( n^2 bits) • P is the protocol for the partition • COM(bipartite, C1,C2,x ) = #bits exchanged • CC(bipartite)= Min_(C1,C2,P) Max_x COM 30 Avril 2001
Communication Complexity • Communication matrix • M(bipartite, C1,C2) = • G=(x1,x2) is bipartite x2 x1 1 30 Avril 2001
Communication Complexity • CC(f) > log (rank (M)) • M(bipartite,C1,C2) contient une sous matrice de rang élevé. • M(P,P’): ssi P v P’=1 • N(P,P’): P’ P 1 P’ • si 1,2 dans le meme ensemble de P v P’ P 1 30 Avril 2001
Lower bound on the size of OBDDs v1 v2 A OBDD’s width is an instance of 1-way communication protocol. CC(f) < log width B vn 0 1 R(v1,v2,….vn) 30 Avril 2001
Results • Theorem : k-bipartiteness has OBDDs of exponential sizes. • Applications : approximate verification in model-checking. 30 Avril 2001
Probabilistic abstraction • Compressed structure : random subgraphs • Transition system of a program represented by the compressed transition system C(U,G) • Program correct => C(U,G) |= F’ • Program far from correct => Prob [C(U,G) |= not F’]>2/3 • Works for all Sigma_2 formulas (Alon and al. FOCS 99) Collaboration F. Magniez et S. Laplante 30 Avril 2001
Conclusion • Schémas de compression K--> K’ • Propriété F définie sur K dans une logique L est aussi définie sur K’ dans une logique L’. • Complexité descriptive capture un schéma de compression. • Applications : vérification, recherche par contenu 30 Avril 2001