610 likes | 844 Views
Business Intelligence Semantic Model. Tomislav Piasevoli. SoftPro Tetral d.o.o. Sadržaj predavanja. Što je BISM? PowerPivot SQL Server „Denali” Značaj BISM-a Smjernice. Preduvjeti. interes za BI radoznalost . Za početak par pitanja . tko je dosad radio u PowerPivotu?
E N D
Business Intelligence Semantic Model Tomislav Piasevoli SoftPro Tetral d.o.o.
Sadržaj predavanja Što je BISM? PowerPivot SQL Server „Denali” Značaj BISM-a Smjernice
Preduvjeti interes za BI radoznalost
Za početak par pitanja ... • tko je dosad radio u PowerPivotu? • tko je koristio PowerPivot na SharePointu? • tko ima iskustva u izradi OLAP kocaka? • tko je za izvještavanje koristio OLAP?
1 Što je BISM?
Analitički sustavi • pretvaraju podatke u informacije • ciljevi njihove arhitekture • optimizacija pristupa izvornim podacima • prilagodba podataka za analizu
I - Optimizacija pristupa podacima • pohraniti podatke u strukture optimizirane za analizu i ad-hoc izvještavanje ili ih ostaviti kakvi jesu na izvoru • osigurati • dobre performanse • fleksibilnost • skalabilnost • ... • koju tehnologiju koristiti?
MOLAP, ROLAP, HOLAP • retkovno organizirane baze • MOLAP = multidimenzijska • ROLAP = relacijska • HOLAP = hibridna (samo za mjerne grupe) • performanse na temelju agregacija • particioniranje • kompresija podataka (MOLAP) • nisu ograničene raspoloživom memorijom
II - Prilagodba podataka za analizu • omogućiti analizu podataka kao da svi dolaze iz jednog izvora • izvori mogu biti različiti • relacijske baze podataka • Excel datoteke • tekstualne datoteke • RSS feeds, ... • gdje napraviti povezivanje podataka iz distribuiranih sustava? • dati poslovno tumačenje podacima • kako ih učiniti razumljivim za krajnje korisnike?
Semantički model podataka • sloj metapodataka nad podacima • opisuje koncepte (entitete) i veze (relacije) među njima • korisnički-orijentiran • prikazuje ono što podaci i veze predstavljaju u stvarnom svijetu semantika = izučavanje značenja/smisla
UDM • postojeći semantički model za BI • došao sa SQL Server 2005 • omogućuje povezivanje podataka iz različitih izvora • postavljanje relacija među tablicama • izrada kalkulacija • u tablicama - kalkulirani stupci (T-SQL) • nad cijelim modelom – MDX skripta (MDX) • kalkulacija nisu povezane (različiti jezici)
SQL Server 2005 Analysis Services MDX MDX MDX MDX MDX
SQL Server 2008 Analysis Services MDX MDX MDX MDX
SQL Server 2008 R2 Analysis Services MDX MDX MDX MDX
2 PowerPivot
PowerPivot • SQL Server 2008 R2 Analysis Services u integriranoj verziji • pokriva personal i team BI segmente
SharePoint 2010 Integracija Excel 2010 besplatan dodatak za Excel 2010 (www.powerpivot.com) dolazi kao 32-bitna i 64-bitna aplikacija dolazi u sklopu SQL Server 2008 R2 x64 prilikom instalacije odabire se stavka SQL Server PowerPivot for SharePoint
VertiPaq in-memory stupčasto organizirana baza vrlo visoka kompresija podataka skalira linearno s brojem jezgri ne zahtjeva postavljanje agregacija, indekse i ostala podešavanja osmišljen da podržava particioniranje i paging za velike količine podataka (ali to ne radi u PowerPivotu)
BISM v1 • novi semantički model za BI • došao sa SQL Server 2008 R2 (za PowerPivot!) • omogućuje povezivanje podataka iz različitih izvora • postavljanje relacija među tablicama • dodatne kalkulacije, na dva mjesta: • u tablicama - kalkulirani stupci (DAX) • nad cijelim modelom – kalkulirane mjere (DAX) • kalkulacija se mogu povezati (isti jezik)
BISM v1 • nastao spajanjem sadašnjeg analitičkog (UDM = SSAS) i izvještajnog (SDML = SSRS) modela podataka s ciljem da s vremenom objedini • izvještavanje, analize, dashboard-e i scorecard-e • osobni, timski i korporacijski BI • radi u cached (VertiPaq) modu
DEMO BISM v1 u SQL Server 2008 R2
Sažetak demo-a • PowerPivot je zapakirana SSAS baza • DAX funkcije su skrivene unutar MDX funkcija • SharePoint upravlja sa BISM instancom SSAS-a • novi DMV-ovi za BISM instance na SharePointu • BISM modeli podržavaju MDX • SQL Profiler VertiPaq SE events
3 SQL Server „DENALI”
BISM v2 • jedan model za sve • izvještavanje, analize, dashboard-e i scorecard-e • osobni, timski i korporacijski BI • ima relacijski i multidimenzijski API • najavljeno je da će podržavati i cached (VertiPaq) i pass-through* (realtime) mod rada * samo za SQL Server izvore, zasad
Pass-through baza podataka ne postoji podaci ostaju u izvornim strukturama idealno za realtime analizu
Analysis Services „Denali” - UDM MDX MDX MDX ? MDX MDX
Analysis Services „Denali” - BISM MDX MDX ? DAX MDX DAX MDX DAX
Najavljena poboljšanja BISM-a* • hijerarhije, KPI, parent-child, drillthrough, perspektive • dodatne DAX funkcije (RankX, DistinctCount, GroupBy, Lookup, ...) • security (role-based prema Active Directory-ju, column/row based) * ne znači da će se zaista i pojaviti u „Denali“-ju
Što BISM u „Denali”-ju neće imati? • neke od mogućnosti UDM-a • skripte, akcije, prijevodi, role-playing dimenzije • objektni model • write-back • ostalo • realtime za ne-SQL Server baze • MDX query podrška za realtime
UDM poboljšanja u „Denali”-ju • uglavnom izvan GUI-a • ukidanje 4GB string store limita • bolja podrška za PowerShell • bolje mogućnosti monitoringa (XEvents) • razne optimizacije engine-a • cilj je povećanje skalabilnosti SSAS baza (UDM instanci)
4 Značaj BISM-a
Prednosti BISM modela relativno jednostavan model (nema kocaka, dimenzija, mjera, ...) brzi odziv bez obzira na detaljnost izvještavanja fleksibilan (svaki stupac je ujedno i mjera i dimenzija) DAX kalkulacije nalik Excel formulama relacijski model i oblik rezultata je bliži i razumljiviji većini ljudi
Skalabilnost Excel SharePoint „Denali”
Ostale prednosti BISM modela • brži razvoj nego UDM • izrada prototipa od strane samih korisnika • oni najbolje znaju što žele od podataka i što oni poslovno znače (semantika!) • lakše izmjene modela • smanjenje troškova izrade konačnog BI rješenja
Nove mogućnosti u modeliranju • Izdvojeni primjeri s blogova • Marco Russo – ad-hoc joins • Thomas Ivarsson – master-detail design • Alberto Ferrari – point-in-time, SCD-2, rank • Marco Russo – ETL?
5 SMJERNICE
Pozicioniranje BISM-a Skalabilnost* izvor: Thomas Kejser, SQLCAT ROLAP ColumnStore 50 TB Skalabilnost = - dobra podrška za istovremene upite - neovisnost o raspoloživoj memoriji - dobre mogućnosti održavanja 5 TB MOLAP 100 GB BISM 2 GB PowerPivot Jednostavnost korištenja