1 / 37

Data visualization in Business Intelligence and ETL process

1 /128. Mateusz Cicheński Artur Jaworski Hurtownie danych, 16.06.2011. Data visualization in Business Intelligence and ETL process. 2 /128. Zastosowanie hurtowni danych Istotność zagadnienia wizualizacji danych Klasyczne podejścia Temporal data Jak to wszystko ogarnąć? Po ludzku

kellsie
Download Presentation

Data visualization in Business Intelligence and ETL process

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 1/128 Mateusz Cicheński Artur Jaworski Hurtownie danych, 16.06.2011 Data visualizationin Business Intelligenceand ETL process

  2. 2/128 Zastosowanie hurtowni danych Istotność zagadnienia wizualizacji danych Klasyczne podejścia Temporal data Jak to wszystko ogarnąć? Po ludzku Wizualizacja kostki danych Wspomaganie prezentacji danych Plan prezentacji

  3. 3/128 Zastosowanie hurtowni danych Istotność zagadnienia wizualizacji danych Klasyczne podejścia Temporal data Jak to wszystko ogarnąć? Po ludzku Wizualizacja kostki danych Wspomaganie prezentacji danych Plan prezentacji („co oferuje Excel”) (Theme River, Lap Chart) (Fisheye, TableLenses) (ChernoffFaces) (Augmented Reality)

  4. 4/128 Archiwizacja i agregacja danych Przetwarzanie analityczne Wspomaganie decyzji Analiza efektywności Wsparcie dla systemów CRM (CustomerRelation Management) Zastosowanie hurtowni danych

  5. 5/128 Ułatwia analizę danych Uwypukla trendy, zależności Wspomaga podejmowanie decyzji Umożliwia zaprezentowanie informacji dla szerszego grona w sposób intuicyjny i łatwy do interpretacji Wizualizacja danych

  6. 6/128 Odpowiednia forma prezentacji danych Percepcja człowieka Kolor! Przestrzeń i głębia Wielowymiarowość danych Interakcja, nawigacja, zoom „Focus” i kontekst Skalowalność Wizualizacja danych – problemy towarzyszące

  7. 7/128 Mindmap Informacje Dane Powiązania między informacjami Wizualizacja danych – popularne formy

  8. 8/128 Diagram słupkowy/kolumnowy Diagram punktowy/liniowy Diagram kołowy Klasyczne podejścia

  9. 9/128 Specjalizacja do konkretnego typu danych Statyczna prezentacja danych Możliwość prezentacji tylko jednej cechy Trudność w przedstawieniu dużej ilości danych na jednym wykresie Klasyczne podejścia – OGRANICZENIA

  10. 10/128 Unikaj tworzenia diagramów kołowych Używaj diagramów kołowych tylko dla danych, które sumują się do sensownej całości Nigdy nie używaj trójwymiarowych diagramów kołowych – są jeszcze gorsze niż dwuwymiarowe Unikaj porównań pomiędzy więcej niż jednym diagramem kołowym ZASADY DOBRYCH WYKRESÓW– DIAGRAM KOŁOWY

  11. 11/128 Minimalizuj „ilość tuszu”– nie używaj efektu 3D Posortuj dane wg najbardziej znaczącej zmiennej Użyj diagramu słupkowego dla więcej niż 8-10 kategorii Umieść legendę wewnątrz lub poniżej obszaru kreślenia Przy więcej niż jednej serii danych uważaj na różnice w skalowaniu ZASADY DOBRYCH WYKRESÓW– DIAGRAM KOLUMNOWY

  12. 12/128 Czas prawie zawsze powinien być przedstawiony na osi OX od lewej do prawej Pokaż jak najwięcej danych używając jak najmniej atramentu Upewnij się, że osoba czytająca wykres może odróżnić linie poszczególnych serii danych Uważaj na efekty skalowania Pokazując dane finansowe lub walutowe, zwykle najlepiej jest wyświetlać dane znormalizowane (względem inflacji lub PKB) ZASADY DOBRYCH WYKRESÓW– DIAGRAM LINIOWY

  13. 13/128 • Histogram dla zbioru danych Castro • Trudno wyciągać wnioski dotyczące porównań poszczególnych serii danych! Histogram

  14. 14/128 • Ten sam histogram w postaci „rzeki” • łatwość śledzenia poszczególne trendów • zachowane są właściwości histogramu Themeriver

  15. 15/128 Atrybuty zmapowane są jako „prądy” rzeki płynącej w czasie Grubość prądu – siła atrybutu Długość prądu – znaczenie atrybutu Mapowanie wydarzeń, łatwa analiza porównawcza atrybutów Themeriver– w analizie (1)

  16. 16/128 Możliwość połączenia z histogramem Łatwość porównania dwóch „rzek” Themeriver– w analizie (2)

  17. 17/128 Zgodność z „teorią Gestalta” (postrzeganie całości, a nie poszczególnych elementów) Nakładające się prądy rzeki umożliwiają porównanie między atrybutami Płynne przejścia między kolejnymi punktami na osi czasu (uwaga: przekłamania wynikające z interpolacji!) Łatwość utworzenia wykresu (jak histogram) Themeriver– w analizie (3)

  18. 18/128 Rozkład wydatków w firmie Aktywność poszczególnych placówek firmy (wyrażona jako wypracowany zysk, liczba dokonanych transakcji, wielkość sprzedaży) Popularność sprzedawanych produktów W ogólności: analiza danych zmieniających się w czasie Themeriver– zastosowanie w hurtowniach danych

  19. 19/128 Inspirowany Formułą I Przedstawianie zależności między sekwencjami w kolejnych chwilach czasowych Zgodny z koncepcją focus – pomija nieistotne dane LAP Chart

  20. LOGISTYKA KONTROLA JAKOŚCI LAP CHART - przykład

  21. 21/128 Porównanie sekwencji produktów na linii produkcyjnej Analiza zmieniających się preferencji klientów W ogólności: analiza danych tworzących sekwencje zmieniające się w czasie LAP CHART – zastosowanie w hurtowniach danych

  22. 22/128 Obiektywy typu „rybie oko” o dużym kącie widzenia w fotografii Zgodność z koncepcją „focus” – ważne dane są powiększone, nieistotne dane są małe Rozwiązanie dla małej przestrzeni prezentacji danych Fisheye

  23. 23/128 Fisheye- przykład

  24. 24/128 Prezentowanie tabelarycznych danych numerycznych w dużych ilościach Koncepcja „fisheye” Dane numeryczne prezentowane w formie graficznej Korelacja między atrybutami! 30-100x więcej danych na ekranie! Tablelenses

  25. 25/128 Tablelenses- przykład

  26. 26/128 Analiza zależności między popularnością produktu a jego parametrami Zysk na pokojach w hotelu w stosunku do jakości wyposażenia, położenia w obiekcie W ogólności: poszukiwanie relacji pomiędzy wymiarami i faktami FISHEYE&Tablelenses – zastosowanie w hurtowniach danych

  27. 27/128 Zdolność człowieka do rozpoznawania twarzy „Łatwość” w wychwyceniu drobnych różnic Mapowanie atrybutów do cech opisujących twarz (uwaga: pewne cechy są ważniejsze od innych!) Analiza porównawcza Problem z przygotowaniem danych CHERnofffaces

  28. 28/128 CHERnofffaces- przykład

  29. 29/128 Stan życia ludzi w poszczególnych dzielnicach Zadowolenie klientów z obsługi w punktach sprzedaży Jakość leczenia pacjentów W ogólności: dane, które mogą być interpretowane jako emocje wyrażane przez mimikę twarzy (trudne do stwierdzenia!!!) CHERnofffaces – zastosowanie w hurtowniach danych

  30. 30/128 Kostka danych

  31. 31/128 Kostka danych – POPULACJA STANÓW ZJEDNOCZONYCH

  32. 32/128 Kostka danych – ANALIZA MATRYC DNA

  33. 33/128 Czas na krótki film … Augmented reality

  34. 34/128 „Milestones in the history of thematic cartography, statistical graphics, and data visualization” Michael Friendly (2008) „Data Visualization: Modern Approaches”Graphics, August 2nd, 2007 University of British Columbia, Faculty of Computer Science, InformationVisualizationcourses (http://www.cs.ubc.ca/~tmm/courses) Gallery of Data Visualization: The Best and Worst of Statistical Graphics (http://www.datavis.ca/gallery) „ThemeRiver: Visualizing Thematic Changes in Large Document Collections” SusanHavre, Elizabeth Hetzler, Paul Whitney, Lucy Nowell. IEEE Transactions on Visualization and Computer Graphics, 8(1), pp 9-20, 2002. TheContinuous Zoom: A ConstrainedFisheyeTechnique for Viewing and NavigatingLargeInformationSpaces L. Bartram, A. Ho, J. Dill and F. Henigman, UIST '95, pp. 207-216. DateLens: A FisheyeCalendarInterface for PDAs Benjamin B. Bederson, Clamage, A., Czerwinski, M. P., & Robertson, G. G. ACM Transactions on Computer-HumanInteraction (TOCHI), March 2004, 11(1), pp 59-89. „The Use of Faces to Represent Points in K-Dimensional Space Graphically” Herman Chernoff, Journal of the American Statistical Association (American Statistical Association) 68 (342): 361–368 „Constructing Good Charts and Graphs” Gary Klass, Illinois StateUniversity, 2002 http://lilt.ilstu.edu/gmklass/pos138/datadisplay/sections/goodcharts.htm „MultiscaleVisualization Using Data Cubes” Chris Stolte, Diane Tang, Pat Hanrahan, Stanford University, 2002. Referencje

  35. 35/128 http://www.informationarchitects.jp/en/ia-trendmap-2007v2 http://marumushi.com/projects/newsmap http://www.time.com/time/covers/20061030/where_we_live/ http://www.crazyegg.com/ http://www.munterbund.de/visualisierung_textaehnlichkeiten/essay.php http://flare.prefuse.org/demo http://www.whc.ki.se/index.php http://strangepaths.com/en/ http://joshualedwell.typepad.com/usability_blog/files/final_vizualization.pdf Wizualizacje

  36. …/128 Pytania?

  37. 128/128 Dziękujemy za uwagę!

More Related