210 likes | 412 Views
Università degli studi di Modena e Reggio Emilia. Facoltà di Ingegneria di Modena Corso di Laurea Specialistica in Ingegneria Informatica. Analisi e valutazione comparativa dei principali sistemi di integrazione dati commerciali rispetto al sistema MOMIS attraverso il benchmark THALIA.
E N D
Università degli studi di Modena e Reggio Emilia Facoltà di Ingegneria di Modena Corso di Laurea Specialistica in Ingegneria Informatica Analisi e valutazione comparativa dei principali sistemi di integrazione dati commerciali rispetto al sistema MOMIS attraverso il benchmark THALIA Relatore Prof.ssa Sonia Bergamaschi Correlatore Prof. Maurizio Vincini Tesi di Laurea di Fabio Romano
Obiettivi Analisi e studio della logica e dei metodi di integrazione dei sistemi commerciali: • Microsoft SQL Server 2005 Integrazione Services • Oracle Data Integrator • WebSphere Information IntegratorContentEdition • MOMIS Valutazione tramite il benchmark THALIA 1
Data Integration System DB • Dati strutturati XML • Dati semi-strutturati DB virtuale DB materializzato 2
Classificazione dei sistemi ETL (Extract, Transform,Load) • Microsoft SQL Server 2005 Integrazione Services • Oracle Data Integrator • WebSphere Information IntegratorContentEdition • MOMIS Aprroccio virtuale 3
Benchmark THALIA Raccolta di 25 fonti di dati diverse (file XML) che rappresentano i cataloghi dei corsi di diverse università mondiali Set di 12 query con l’obiettivo di testare eterogeneità: Sintattiche Semantiche 4
Benchmark THALIA • Sinonimi • Semplice mapping • Tipi unione • Mapping complesso • LanguageExpression 12 query 5
Benchmark THALIA • Valorinulli • Attributi virtuali • Incompatibilità semantica 12 query 5
Benchmark THALIA • Stesso attributo in • strutture differenti • Trattamento di set di valori • Il nome dell’attributo non • ne descrive la semantica 12 query • Composizione di attributi 5
MOMIS 9
Trasformazioni sui dati Metodi e funzioni di trasformazione diversi per ogni sistema di integrazione: CASE WHEN ISNUMERIC(SUBSTRING(COURSE.Times, 1, 2)) = 1 THEN CASE WHEN CAST(SUBSTRING(COURSE.Times, 1, 2) AS int) > 12 THEN CAST(CAST(SUBSTRING(COURSE.Times, 1, 2) AS integer)- 12 AS nvarchar(2)) ELSE SUBSTRING(COURSE.Times, 1, 2) END + SUBSTRING(COURSE.Times, 3, 4) + CASE WHEN CAST(SUBSTRING(COURSE.Times, 7, 2) AS int) > 12 THEN CAST(CAST(SUBSTRING(COURSE.Times, 7, 2) AS integer)- 12 AS nvarchar(3)) ELSE SUBSTRING(COURSE.Times, 7, 2) END + SUBSTRING(COURSE.Times, 9, 3) END MOMIS Funzioni like SQL92 Funzioni personalizzate, in base alla tecnologia DBMS utilizzata Oracle DI 12
Trasformazioni sui dati Metodi e funzioni di trasformazione diversi per ogni sistema di integrazione: Funzioni personalizzate, messe a disposizione dagli script component Microsoft IS • Classe Java transformer: • Metodo PreProcessQuery(); • Metodo PostProcessQuery(); IBM Information Integrator 13
Implementazione benchmark THALIA Sorgenti dati Sorgenti dati S.I. Mapping F.d.T Sorgenti dati Sorgenti dati 15
Conclusioni 19