270 likes | 419 Views
Data pod kontrolou. Řešení datového skladu v prostředí Celní správy ČR. Ondřej Vít o ndrej.vit @adastracorp.com. Konference ISSS 3.4.2006. Adastra. Adastra je česká společnost s tuzemskými i mezinárodními referencemi (ČR, SK, Kanada, Neměcko)
E N D
Data pod kontrolou Řešení datového skladu v prostředí Celní správy ČR Ondřej Vít ondrej.vit@adastracorp.com Konference ISSS 3.4.2006
Adastra • Adastra ječeská společnost s tuzemskými i mezinárodními referencemi (ČR, SK, Kanada, Neměcko) • Adastra je technologicky nezávislou konzultační společností • Adastra se specializuje na Business Intelligence, což zahrnuje: • Datové sklady (Data Warehousing) • Management Information Systems MIS • Customer Intelligence • Data Mining (Dolování dat) • Specifická řešení • Samostatnou kompetencí je oblast aplikačního vývoje • 300+zaměstnanců, 200+ v České republice, 70 v Kanadě • Obrat více než 500 mil Kč ročně • Růst více než 40% ročně • ISO 9001:2000 certified by Moody’s
Adastra – ocenění 2004 TOP10 system integrator (CZ) 2004 TOP Professional Business Intelligence & Data Warehouse project (CZ) 2004 Oracle Consulting Award (CEE) 2002 Oracle Partner of the Year (CZ) Microsoft Gold Certified Partner for Business Intelligence (CEE) 2002 Best Practicesin CRM 2001 Best Practicesin DataWarehousing The Best Data Warehouse 2000 2000 Innovator Award in Data Warehousing 1999 Excellence in Business Information Award
Hlavní moto 1/2 Je pěkné mít data nashromážděná, ještě lepší je však mít data vhodně uspořádaná a dostupná
Hlavní moto 2/2 • Shromažďování dat • Obvykle není problém • Starost primárních systémů • Vhodné uspořádání dat • Často problematické • Starost datového skladu • Dostupnost dat • Problematické • Starost datového skladu
Situace před nasazením datového skladu – hlavní charakteristiky • Data jsou rozmístěna po několika až mnoha primárních systémech • Vzájemná provázanost primárních systémů je na nízké úrovni • Požadavky na datové výstupy (reporty, exporty, datové pohledy, …) jsou řešeny prostřednictvím tzv. „tvůrců reportů“ (informatici, správci systémů, administrátoři, …)
Situace před nasazením datového skladu - nevýhody • Obtížné/problémové/nemožné vytváření konsolidovaných datových výstupů • Obtížná porovnatelnost datových výstupů z různých oblastí (primárních systémů) • Velké nároky na „tvůrce reportů“ • Dlouhá doba na uspokojování požadavků (dny, týdny) • Nemožnost zadávání mlhavých požadavků • Nemožnost analýzy dat
Hlavní přínosy datového skladu pro CS ČR • Konsolidace dat • Možnost analýzy dat • Jediná verze pravdy • Snadná dostupnost dat • Nové reporty a pohledy na data • Podpora čištění dat • Odlehčení primárním systémům • DS jako zdroj pro specializované aplikace • Centralizace dat
Konsolidace dat 1/2 • Konsolidace číselníků • Např. číselníky organizací
Konsolidace dat 2/2 • Konsolidace oblastí / agend / evidencí
Možnost analýzy dat • DS obsahuje data ve strukturách podporujících efektivní analýzu dat • Podpora analytických funkcí • Zajištění rychlé odezvy • DS je věcně orientovaný • Analytik neztrácí čas studiem datových struktur, vztahů mezi daty, … • DS obsahuje analytické nástroje umožňující efektivně využívat data v DS pro provádění analýz. • Uživatelské rozhraní • Analytické funkce • Grafické výstupy • DS umožňuje zadávat mlhavé dotazy a postupně je zpřesňovat • DS umožňuje zadávat ad-hoc dotazy
Jediná verze pravdy • Pravda může mít mnoho verzí • Výstupy z různých systémů mohou být obtížně porovnatelné • Datový sklad definuje společné principy, pravidla a algoritmy, kterými jsou zpracována veškerá data
Snadná dostupnost dat • Data v datovém skladu mohou být snadno dostupná všem pracovníkům organizace • Stačí pouze přidělit patřičná přístupová oprávnění • Pomocí klientských analytických nástrojů a obecného dotazovacího nástroje si může uživatel během několika sekund vytvořit vlastní datové výstupy (reporty, datové pohledy, …)
Nové reporty a pohledy na data 1/2 • Nové možnosti DS (konsolidace dat, možnost zadávání mlhavých dotazů a možnost ad-hoc dotazování, …) umožňují vznik novým reportům a pohledům na data
Nové reporty a pohledy na data 2/2 • Ukázka vývoje dovozu a vývozu ČR(Dovoz, Vývoz, Intrastat)
Podpora „čištění“ dat 1/2 • Primární data vykazují různou „čistotu“ • Překlepy ve jménech, názvech, … • Odkazy na neexistující číselníkové záznamy a neexistující dokumenty • Zjevně nesprávné hodnoty (např. budoucí data, prehistorické data, …) • Nezadané hodnoty • … • DS „nečistotu“ identifikuje • DS umožňuje kvantifikovat objem chybných dat
Podpora čištění dat 2/2 • Ukázka kvantifikace chybně zadaných kódů zboží na dovozních JSD • Absolutní počty “Neuvedených“ a „Neznámých“ kódů zboží • Relativní počty „Neznámých“ a „Neuvedených“ kódů zboží
Odlehčení primárním systémům • DS přebírá úlohu reportingu a exportingu • Do nasazení DS je reporting a exporting zpravidla řešen primárními systémy
DS jako zdroj pro specializované aplikace • DS bývá vhodným zdrojem pro další specializované aplikace vyžadující konsolidovaná data • Příklady: • Datamainingové aplikace • Analýza rizik celních deklarací
Centralizace dat • Data z různých oblastí jsou dostupná na jednom místě, jednotným způsobem a prostřednictvím jednotného uživatelského rozhraní
Problematika řešená datovým skladem CS ČR Dovoz Tranzit Vývoz Intrastat Spotřební daně Vzorky Dluhy Finanční analýza Delikty Kontroly (fyzické, následné, dokumentační, …) Globální záruky ...
Základní komponenty datového skladu CS ČR Obecné dotazování Standardní aplikace pro podporu rozhodování Specializované aplikace Reporting Exporting Analytické prostory Dotazovací oblasti QDS Exporty Reporty Data mining Riziková analýza Databáze datového skladu Datový sklad ??? Zdrojové systémy Vývoz Intrastat Vzorky TARIC SPD Dovoz ... Kontrolní protokoly Delikty CesDic
Použité technologie • Relační vrstva • Microsoft SQL Server 2000 Enterprise Edition 64 bit databázový stroj (Failover cluster) • ETL • Microsoft SQL Server 2000 DTS, Job Agent • Multidimenzionální vrstva • Server: Microsoft SQL Server 2000 Analysis Services (Failover cluster) • Klient: • Microsoft Excel Add-in for SQL Server Analysis Services • ProClarity • Reporty • Reportovací server: Microsoft SQL Server 2000 Reporting Services • Klient: Internet Explorer • Exporty • bcp utilita • Uživatelské rozhraní: Reporting Services, Internet Explorer • Obecný dotazovací nástroj • QDS – Na zakázku vyrobený systém
Adastra Corporation 8500 Leslie St., Markham Ontario, L3T 7M8 Canada Tel. 905 881 7946 Fax 905 881 4782 info@adastracorp.com www.adastracorp.com Adastra, s.r.o. Benešovská 10, Praha 10 Tel. 271-733-303 Fax 271-735-296 info@adastra.cz www.adastra.cz