380 likes | 522 Views
1 /128. Mateusz Cicheński Artur Jaworski Hurtownie danych, 16.06.2011. Data visualization in Business Intelligence and ETL process. 2 /128. Zastosowanie hurtowni danych Istotność zagadnienia wizualizacji danych Klasyczne podejścia Temporal data Jak to wszystko ogarnąć? Po ludzku
E N D
1/128 Mateusz Cicheński Artur Jaworski Hurtownie danych, 16.06.2011 Data visualizationin Business Intelligenceand ETL process
2/128 Zastosowanie hurtowni danych Istotność zagadnienia wizualizacji danych Klasyczne podejścia Temporal data Jak to wszystko ogarnąć? Po ludzku Wizualizacja kostki danych Wspomaganie prezentacji danych Plan prezentacji
3/128 Zastosowanie hurtowni danych Istotność zagadnienia wizualizacji danych Klasyczne podejścia Temporal data Jak to wszystko ogarnąć? Po ludzku Wizualizacja kostki danych Wspomaganie prezentacji danych Plan prezentacji („co oferuje Excel”) (Theme River, Lap Chart) (Fisheye, TableLenses) (ChernoffFaces) (Augmented Reality)
4/128 Archiwizacja i agregacja danych Przetwarzanie analityczne Wspomaganie decyzji Analiza efektywności Wsparcie dla systemów CRM (CustomerRelation Management) Zastosowanie hurtowni danych
5/128 Ułatwia analizę danych Uwypukla trendy, zależności Wspomaga podejmowanie decyzji Umożliwia zaprezentowanie informacji dla szerszego grona w sposób intuicyjny i łatwy do interpretacji Wizualizacja danych
6/128 Odpowiednia forma prezentacji danych Percepcja człowieka Kolor! Przestrzeń i głębia Wielowymiarowość danych Interakcja, nawigacja, zoom „Focus” i kontekst Skalowalność Wizualizacja danych – problemy towarzyszące
7/128 Mindmap Informacje Dane Powiązania między informacjami Wizualizacja danych – popularne formy
8/128 Diagram słupkowy/kolumnowy Diagram punktowy/liniowy Diagram kołowy Klasyczne podejścia
9/128 Specjalizacja do konkretnego typu danych Statyczna prezentacja danych Możliwość prezentacji tylko jednej cechy Trudność w przedstawieniu dużej ilości danych na jednym wykresie Klasyczne podejścia – OGRANICZENIA
10/128 Unikaj tworzenia diagramów kołowych Używaj diagramów kołowych tylko dla danych, które sumują się do sensownej całości Nigdy nie używaj trójwymiarowych diagramów kołowych – są jeszcze gorsze niż dwuwymiarowe Unikaj porównań pomiędzy więcej niż jednym diagramem kołowym ZASADY DOBRYCH WYKRESÓW– DIAGRAM KOŁOWY
11/128 Minimalizuj „ilość tuszu”– nie używaj efektu 3D Posortuj dane wg najbardziej znaczącej zmiennej Użyj diagramu słupkowego dla więcej niż 8-10 kategorii Umieść legendę wewnątrz lub poniżej obszaru kreślenia Przy więcej niż jednej serii danych uważaj na różnice w skalowaniu ZASADY DOBRYCH WYKRESÓW– DIAGRAM KOLUMNOWY
12/128 Czas prawie zawsze powinien być przedstawiony na osi OX od lewej do prawej Pokaż jak najwięcej danych używając jak najmniej atramentu Upewnij się, że osoba czytająca wykres może odróżnić linie poszczególnych serii danych Uważaj na efekty skalowania Pokazując dane finansowe lub walutowe, zwykle najlepiej jest wyświetlać dane znormalizowane (względem inflacji lub PKB) ZASADY DOBRYCH WYKRESÓW– DIAGRAM LINIOWY
13/128 • Histogram dla zbioru danych Castro • Trudno wyciągać wnioski dotyczące porównań poszczególnych serii danych! Histogram
14/128 • Ten sam histogram w postaci „rzeki” • łatwość śledzenia poszczególne trendów • zachowane są właściwości histogramu Themeriver
15/128 Atrybuty zmapowane są jako „prądy” rzeki płynącej w czasie Grubość prądu – siła atrybutu Długość prądu – znaczenie atrybutu Mapowanie wydarzeń, łatwa analiza porównawcza atrybutów Themeriver– w analizie (1)
16/128 Możliwość połączenia z histogramem Łatwość porównania dwóch „rzek” Themeriver– w analizie (2)
17/128 Zgodność z „teorią Gestalta” (postrzeganie całości, a nie poszczególnych elementów) Nakładające się prądy rzeki umożliwiają porównanie między atrybutami Płynne przejścia między kolejnymi punktami na osi czasu (uwaga: przekłamania wynikające z interpolacji!) Łatwość utworzenia wykresu (jak histogram) Themeriver– w analizie (3)
18/128 Rozkład wydatków w firmie Aktywność poszczególnych placówek firmy (wyrażona jako wypracowany zysk, liczba dokonanych transakcji, wielkość sprzedaży) Popularność sprzedawanych produktów W ogólności: analiza danych zmieniających się w czasie Themeriver– zastosowanie w hurtowniach danych
19/128 Inspirowany Formułą I Przedstawianie zależności między sekwencjami w kolejnych chwilach czasowych Zgodny z koncepcją focus – pomija nieistotne dane LAP Chart
LOGISTYKA KONTROLA JAKOŚCI LAP CHART - przykład
21/128 Porównanie sekwencji produktów na linii produkcyjnej Analiza zmieniających się preferencji klientów W ogólności: analiza danych tworzących sekwencje zmieniające się w czasie LAP CHART – zastosowanie w hurtowniach danych
22/128 Obiektywy typu „rybie oko” o dużym kącie widzenia w fotografii Zgodność z koncepcją „focus” – ważne dane są powiększone, nieistotne dane są małe Rozwiązanie dla małej przestrzeni prezentacji danych Fisheye
23/128 Fisheye- przykład
24/128 Prezentowanie tabelarycznych danych numerycznych w dużych ilościach Koncepcja „fisheye” Dane numeryczne prezentowane w formie graficznej Korelacja między atrybutami! 30-100x więcej danych na ekranie! Tablelenses
25/128 Tablelenses- przykład
26/128 Analiza zależności między popularnością produktu a jego parametrami Zysk na pokojach w hotelu w stosunku do jakości wyposażenia, położenia w obiekcie W ogólności: poszukiwanie relacji pomiędzy wymiarami i faktami FISHEYE&Tablelenses – zastosowanie w hurtowniach danych
27/128 Zdolność człowieka do rozpoznawania twarzy „Łatwość” w wychwyceniu drobnych różnic Mapowanie atrybutów do cech opisujących twarz (uwaga: pewne cechy są ważniejsze od innych!) Analiza porównawcza Problem z przygotowaniem danych CHERnofffaces
28/128 CHERnofffaces- przykład
29/128 Stan życia ludzi w poszczególnych dzielnicach Zadowolenie klientów z obsługi w punktach sprzedaży Jakość leczenia pacjentów W ogólności: dane, które mogą być interpretowane jako emocje wyrażane przez mimikę twarzy (trudne do stwierdzenia!!!) CHERnofffaces – zastosowanie w hurtowniach danych
30/128 Kostka danych
31/128 Kostka danych – POPULACJA STANÓW ZJEDNOCZONYCH
32/128 Kostka danych – ANALIZA MATRYC DNA
33/128 Czas na krótki film … Augmented reality
34/128 „Milestones in the history of thematic cartography, statistical graphics, and data visualization” Michael Friendly (2008) „Data Visualization: Modern Approaches”Graphics, August 2nd, 2007 University of British Columbia, Faculty of Computer Science, InformationVisualizationcourses (http://www.cs.ubc.ca/~tmm/courses) Gallery of Data Visualization: The Best and Worst of Statistical Graphics (http://www.datavis.ca/gallery) „ThemeRiver: Visualizing Thematic Changes in Large Document Collections” SusanHavre, Elizabeth Hetzler, Paul Whitney, Lucy Nowell. IEEE Transactions on Visualization and Computer Graphics, 8(1), pp 9-20, 2002. TheContinuous Zoom: A ConstrainedFisheyeTechnique for Viewing and NavigatingLargeInformationSpaces L. Bartram, A. Ho, J. Dill and F. Henigman, UIST '95, pp. 207-216. DateLens: A FisheyeCalendarInterface for PDAs Benjamin B. Bederson, Clamage, A., Czerwinski, M. P., & Robertson, G. G. ACM Transactions on Computer-HumanInteraction (TOCHI), March 2004, 11(1), pp 59-89. „The Use of Faces to Represent Points in K-Dimensional Space Graphically” Herman Chernoff, Journal of the American Statistical Association (American Statistical Association) 68 (342): 361–368 „Constructing Good Charts and Graphs” Gary Klass, Illinois StateUniversity, 2002 http://lilt.ilstu.edu/gmklass/pos138/datadisplay/sections/goodcharts.htm „MultiscaleVisualization Using Data Cubes” Chris Stolte, Diane Tang, Pat Hanrahan, Stanford University, 2002. Referencje
35/128 http://www.informationarchitects.jp/en/ia-trendmap-2007v2 http://marumushi.com/projects/newsmap http://www.time.com/time/covers/20061030/where_we_live/ http://www.crazyegg.com/ http://www.munterbund.de/visualisierung_textaehnlichkeiten/essay.php http://flare.prefuse.org/demo http://www.whc.ki.se/index.php http://strangepaths.com/en/ http://joshualedwell.typepad.com/usability_blog/files/final_vizualization.pdf Wizualizacje
…/128 Pytania?
128/128 Dziękujemy za uwagę!