200 likes | 322 Views
Université de Versailles. Représentation et indexation d’objets mobiles dans un entrepôt de données. Tao Wan, Karine Zeitouni EDA 2006. Contexte. Objet Mobile (OM) Objet dont la localisation change continuellement dans le temps Objet Mobile Contraint par le réseau (OMC)
E N D
Université de Versailles Représentation et indexation d’objets mobiles dans un entrepôt de données Tao Wan, Karine Zeitouni EDA 2006
Contexte • Objet Mobile (OM) • Objet dont la localisation change continuellement dans le temps • Objet Mobile Contraint par le réseau (OMC) • Objet se déplaçant dans un espace restreint (ex : couloirs, réseau) • Ex: voiture, train, avion… • Recherche active en gestion de bases d'objets mobiles • Problème posé ici : Exploitation d’historiques d’objets mobiles dans un but décisionnel Représentation et indexation d’objets mobiles dans un entrepôt de données
Sommaire • Exemples et motivation • Conception et représentation de l’entrepôt • Implémentation optimisée des requêtes OLAP • Résultats d’expérimentation • Conclusion & Perspectives Représentation et indexation d’objets mobiles dans un entrepôt de données
Exemples et motivation • Application réelle: étude sur l’exposition de la population aux facteurs de risques • Requêtes typiques : • “Combien de personnes sont exposées au cours du temps au champ de pollution ?” • “Combien de personnes par catégorie d'âge sont exposées au cour du temps au champ de pollution ?” SELECT p.loc, p.temps, COUNT(DISTINCT m.id_personne) AS nb_personnes FROM mobilité m, pollution p WHERE m.trajectoire INTERSECT (p.loc, p.temps) GROUP BY p.loc, p.temps SELECT p.loc, p.temps, COUNT(DISTINCT m.id_personne) AS nb_personnes FROM mobilité m, pollution p WHERE m.trajectoire INTERSECT (p.loc, p.temps) GROUP BY m.âge, p.loc, p.temps • Ces requêtes sont des agrégats multidimensionnels – type OLAP Représentation et indexation d’objets mobiles dans un entrepôt de données
Sommaire • Exemples et motivation • Conception et représentation de l’entrepôt • Implémentation optimisée des requêtes OLAP • Résultats d’expérimentation • Conclusion & Perspectives Représentation et indexation d’objets mobiles dans un entrepôt de données
Spécificités de la modélisation multidimensionnelle d’objets mobiles • Spécificités • Trajectoires d’objets mobiles forment une variation continue dans le temps et l’espace • Or, les modèles multidimensionnels conventionnels sont basés sur des faits discrets ou discrétisés • Les critères de regroupement ne sont pas forcément connus à l’avance et implique une recherche spatio-temporelle. • Il faut intégrer les dimensions discrètes comme les attributs de l’objet mobiles Représentation et indexation d’objets mobiles dans un entrepôt de données
Travaux liés • Entrepôts de données spatiales ou spatiotemporelles • Entrepôts de données spatiales : [Stefanovic & Han 2000] • Entrepôts de données spatiotemporelles : [Bédard & Marchand 2004] • Intégrer les propriétés d’OMs dans l’analyse : [Wan & Zeitouni 2005] • Entrepôts d’objets mobiles • aRB-tree, double comptage : [Papadias et al. 2002] • Estimation probabiliste : [Tao et al. 2004] Problèmes: Se basant sur des découpages de référence pour l’espace et le temps => Limite aux agrégations spatiotemporelles à cheval Aucune véritable approche existe pour l’analyse en ligne d’objets mobiles ! Problèmes: • Objets mobiles agrégés à l’origine; • ne permet pas de représenter d’autres dimensions que l’espace et le temps; • résultats basés sur des statistiques approximatives Représentation et indexation d’objets mobiles dans un entrepôt de données
Modèle logique • Dimension continue • Est une dimension variant dans un domaine continu sans limite de granularité • Fait continu • Comprend une mesure résultat d’une fonction continue qui dépend d’une ou de plusieurs dimensions continues • Fait mobile • Est un fait continu dépendant de l’objet OMC et défini par une fonction FOMC(t) = s continue du temps dans l’espace Représentation et indexation d’objets mobiles dans un entrepôt de données
r13 r12 r14 r10 r9 r7 r15 r5 r4 r2 r1 r16 r3 Préliminaires - Modèle d’objets mobiles contraints par le réseau • Réseau routier • Composé de : tronçon et nœuds • OMC (Objet Mobile Contraint par le réseau) • OMC(id_obj, attributs, #trajectoires) • Hypothèse : vitesse constante par tronçon • Trajectoire T : • Représentée par une séquence de tronçons ri, traversés dans un sens donné pendant un intervalle de temps donné [ti ti+1]. Représentation et indexation d’objets mobiles dans un entrepôt de données
r3 r2 r1 TR TR Tr3 p2 MO_ID Marie Tr2 pend TT’ 0.2 1.1 2.2 3.0 4.8 Fred Trid4 p3 Trid3 Tr1 Tao p1 Trid2 T Jack Trid1 t1 t2 t3 tend Temps 3.1 3.5 1.1 2.0 Modèle multidimensionnel logique Réduction de dimensionnalité [Pfoser 03] • Avantages • simplification de la représentation de l’espace • optimisation de l’espace de stockage • optimisation des temps de réponses aux requêtes Modèle multidimensionnel logique FOMC(t) = s Représentation et indexation d’objets mobiles dans un entrepôt de données
Sommaire • Exemples et motivation • Conception et représentation de l’entrepôt • Implémentation optimisée des requêtes OLAP • Résultats d’expérimentation • Conclusion & Perspectives Représentation et indexation d’objets mobiles dans un entrepôt de données
Jack Fred Tao Marie 1 0 0 1 TR QS Trid4 R2 Trid3 Trid2 R3 Trid1 R1 Temps 1 0 1 1 1 0 1 0 R4 R1 R2 R3 Index proposé – TTR-tree (Transformed Trajectories R-tree) • Avantages • Recherche similaire au R-tree, plus efficace • Si QS contient x, on retourne directement le bitmap pointé par x • Bitmap évite le double comptage • Permet la combinaison avec les attributs de l’objet Représentation et indexation d’objets mobiles dans un entrepôt de données
Optimisations • Problèmes : • Coût de stockage pour les index bitmap • Coût de la réduction de dimensionnalité • Transformation du réseau • Transformation de requêtes spatiales • Solutions : • Appliquer une technique de bitmap compressé sur les index bitmap : WAH: Word-Aligned Hybrid Code Zhang et al. (2004) • Appliquer l’ordre des tronçons dans un index spatial pour numéroter par proximité ces tronçons et les intervalles de l’axe TR correspondant. Représentation et indexation d’objets mobiles dans un entrepôt de données
Sommaire • Exemples et motivation • Conception et représentation de l’entrepôt • Implémentation optimisée des requêtes OLAP • Résultats d’expérimentation • Conclusion & Perspectives Représentation et indexation d’objets mobiles dans un entrepôt de données
Résultats d’expérimentation (1) • Méthodes comparées • Indexation Pfoser [Pfoser & Jensen 2003] • 3DR-tree • Configuration d’expérimentation • Réseaux routier: Oldenburg 7035 tronçons, San Joaquin 24123 tronçons • Données d’entrée : générées par le générateur Brinkhoff • Jeux de données Représentation et indexation d’objets mobiles dans un entrepôt de données
Résultats d’expérimentation (2) • Coût de stockage • Requêtes d’agrégation • Facteur « espace » qs : 0.5 %, 2 %, 8 %, 16 % et 32% • Facteur « temps » qt : 1 %, 5 %, 10 %, 30 % et 50 % Représentation et indexation d’objets mobiles dans un entrepôt de données
Résultats d’expérimentation (4) Coût en faisant varier l’extension de la requête selon l’espace Représentation et indexation d’objets mobiles dans un entrepôt de données
Résultats d’expérimentation (5) Coût en faisant varier l’extension de la requête selon le temps Représentation et indexation d’objets mobiles dans un entrepôt de données
Contributions et perspectives • Contributions • Modèle multidimensionnel pour objets mobiles contraints par le réseau • Implémentation optimisée pour des requêtes OLAP • Prototype développé et bons résultats expérimentaux • Travaux futurs • Test de la combinaison avec des dimensions discrètes • Extension aux agrégats complexes (spatiotemporels) • Extension aux mesures continues (capteurs embarqués) • Extension à d’autres types de « faits continus » Représentation et indexation d’objets mobiles dans un entrepôt de données