1 / 80

Zastosowanie informatyki w analizie i wizualizacji danych ekonomicznych

Zastosowanie informatyki w analizie i wizualizacji danych ekonomicznych. Cel przedmiotu.

lewis
Download Presentation

Zastosowanie informatyki w analizie i wizualizacji danych ekonomicznych

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Zastosowanie informatyki w analizie i wizualizacji danych ekonomicznych

  2. Cel przedmiotu • Celem przedmiotu jest zaznajomienie studentów z możliwościami zastosowań szeroko rozumianej informatyki w analizie i wizualizacji danych ekonomicznych, a także wskazanie roli i znaczenia informacji w podejmowaniu decyzji w procesie zarządzania obiektem gospodarczym.

  3. Treści kształcenia Wykład • Rodzaje danych, sposoby ich pozyskiwania i kodowania. • Narzędzia analizy ekonomicznej w przedsiębiorstwie. • Rola informacji wizualnej w procesie podejmowania decyzji. • Charakterystyka narzędzi pozwalających zrealizować wizualizację • Charakterystyka procesu przygotowania prezentacji graficznej. • Zaawansowane techniki wizualizacji w zastosowaniach ekonomicznych. • Przegląd studium przypadków odzwierciedlający, zarówno w przekroju podmiotowym (różne poziomy decyzyjne), jak i przedmiotowych (m.in. inwestycje, działalność produkcyjna, analiza ekonomiczna kosztów i efektów) analizę danych oraz wykorzystanie wizualizacji informacji ekonomicznej.

  4. Literatura: Brandt S.: Analiza danych: metody statystyczne i obliczeniowe, Wydawnictwo Naukowe PWN, Warszawa 1998. Dobosz M.: Wspomagana komputerowo statystyczna analiza wyników badań, Akademicka Oficyna Wydawnicza "Exit", Warszawa 2004 Dudycz H.: Wizualizacja danych jako narzędzie zarządzania przedsiębiorstwem. Wydawnictwo Akademii Ekonomicznej, Wrocław 1998. Dudycz H., Niedzielska E.: Prezentacja graficzna zastosowań informatyki ekonomicznej. [w:] Informatyka ekonomiczna. Pod. red. E. Niedzielskiej. Wydawnictwo Akademii Ekonomicznej, Wrocław 1999. Jajuga K.: Statystyczna analiza wielowymiarowa. Wydawnictwo Naukowe PWN, Warszawa 1993. Jajuga K., Walesiak M.: Klasyfikacja i analiza danych: teoria i zastosowania Wydawnictwo Akademii Ekonomicznej. Wrocław 2004. Kolenda M.: Taksonomia numeryczna: klasyfikacja, porządkowanie i analiza obiektów wielocechowych. Wydawnictwo Akademii Ekonomicznej, Wrocław 2006. Łukasik-Makowska B.: Prezentacje graficzne w komunikacji gospodarczej. [w:] Komunikacja gospodarcza. Techniki i technologie. Pod red. A. Małachowskiego. Wydawnictwo Akademii Ekonomicznej, Wrocław 1998. http://wizualizacje.edu.pl/kontakt.php

  5. Efekty kształcenia • umiejętność praktycznego zastosowania wybranych narzędzi programowych do przygotowania różnych form graficznej prezentacji danych; • umiejętność doboru metod i form prezentacji w zależności kategorii danych; • znajomość przez studenta rozwiązań sprzętowo-programowych z obszaru wizualizacji informacji ekonomicznej.

  6. Prowadzący: • Wykład: • Dr inż. Izabela Cichocka, pok. 222, tel. (17) 86 86 158; e-mail: icichocka@wsiz.rzeszow.pl • Laboratorium i projekt: • Dr Aldona Migała-Warchoł, pok. 222, tel. (17) 86 86 158; e-mail: amigala@wsiz.rzeszow.pl Wykład – 14 godzin + 2 godz. egzamin (7 lipca 2011r.) Laboratorium – 16 godzin Projekt – 30 godzin

  7. Informatyka - definicja • Informatyka (łac. informatio - "wyobrażenie", "wizerunek", "pomysł", ang. computer science, computing science, information technology, informatics) – dziedzina nauki i techniki zajmująca się przetwarzaniem informacji – w tym technologiami przetwarzania informacji oraz technologiami wytwarzania systemów przetwarzających informacje. Pierwotnie część matematyki, została rozwinięta do osobnej dyscypliny nauki, pozostaje jednak nadal w ścisłym związku z matematyką, która dostarcza jej podstaw teoretycznych.

  8. Informatyka c.d. • Informatykę można podzielić na dwie główne dziedziny. Pierwsza z nich – analiza – obejmuje analizowanie informacji przepływających w świecie rzeczywistym. Druga zajmuje się tworzeniem oraz używaniem systemów służących do przetwarzania informacji, co obejmuje: projektowanie systemów informatycznych, programowanie oraz korzystanie z systemów informatycznych.

  9. Informatyka c.d. • Angielską nazwę computer science można by dosłownie tłumaczyć jako nauka o komputerze, co jest mylące i krytykowane w środowiskach akademickich i informatycznych. • W języku polskim termin ten zaproponował w październiku 1968 r. Romuald Marczyński w Zakopanem na ogólnopolskiej konferencji poświęconej "maszynom matematycznym" na wzór fr. informatique i niem. Informatik.

  10. Informatyzacja - definicja • Informatyzacja - termin ten jest mylnie utożsamiany z komputeryzacją czyli wprowadzaniem komputerów do biur i urzędów, zastępując tym samym ręcznie uzupełniane formularze przez formularze elektroniczne, papierowe archiwa przez bazy danych i wprowadzając pocztę elektroniczną lub komunikator internetowy jako systemu komunikacji. Informatyzacja polega na racjonalnym wykorzystaniu uprzednio wprowadzonych już danych do systemów informatycznych w możliwie największym dopuszczalnym zakresie przez inne systemy informatyczne.

  11. Analiza danych - definicja • Analiza danych – proces przetwarzania danych w celu uzyskania na ich podstawie użytecznych informacji i wniosków. W zależności od rodzaju danych i stawianych problemów, może to oznaczać użycie metod statystycznych, eksploracyjnych i innych.

  12. Analiza danych – metody statystyczne • Metody statystyczne stosuje się wszędzie tam, gdzie chodzi o poznanie prawidłowości w zakresie zjawisk masowych – tam, gdzie bada się problemy demograficzne, ekonomiczne, socjologiczne; choć także w innych naukach. Metoda statystyczna jest jedną z metod badań naukowych. • Działania statystyczne stosuje się do opisu zjawisk masowych. Zestawienia danych do opisu zjawisk masowych dostarczają między innymi urzędy statystyczne przez spisy powszechne. Zestawienia te mają postać tabel, z których można dowiedzieć się, w jakim procencie dane zjawisko występuje; tabel publikowanych między innymi w rocznikach statystycznych. • Dzięki owym danym można ustalić zmienność zjawisk masowych, tendencji ich przekształceń w czasie. Sporządza się w tym celu wykresy, ilustrujące krzywą rozwoju danego zjawiska czy też to, jaką część stanowi większej całości. Część danych dostarcza badanie metodą grup reprezentacyjnych: zbiera się dane nie od wszystkich, ale od odpowiednio wybranej grupy, określanej jako grupa reprezentatywna.

  13. Analiza danych – metody statystyczne • Celem analizy statystycznej jest pozyskanie jak największej wiedzy z pozyskanych danych. Aby zbiór danych był dobrą bazą do analizy statystycznej należy: • zaplanować badanie • podsumować zbiór danych z obserwacji, podkreślając tendencje, ale rezygnując ze szczegółów • uzgodnić, jaką wiedzę o badanym zjawisku mają dostarczyć dane.

  14. Analiza danych – metody statystyczne • Istnieje również wiele metod służących analizie danych statystycznych: • analiza wariancji • analiza korelacji • analiza regresji • analiza czynnikowa • analiza dyskryminacyjna • analiza szeregów czasowych • analiza kanoniczna

  15. Analiza dyskryminacji Poszukiwanie zależności między zmienną nominalną a innymi zmiennymi. Przykłady zmiennych zależnych w analizie dyskryminacji: • „chory”/ „zdrowy” – przewidywanie szansy zachorowania na podstawie wskaźników • „kupił”/”nie kupił” – skłonność do zakupu na podstawie danych demograficzno – społecznych • „zagłosował na prawicę/ zagłosował na lewicę / nie poszedł na wybory” – zachowanie wyborcze w ostatnich wyborach a dane społ.-dem. • „chłopiec/dziewczyna” – (zależność nie jest tu rozumiana jako wpływ!!! Możemy odgadnąć płeć na podstawie odpowiedzi na pytania – jeśli jakieś pytanie pomaga nam w odgadywaniu – to znaczy, że istnieje zależność między daną kwestią a płcią)

  16. Etapy analizy dyskryminacyjnej • Analiza dyskryminacji dla zmiennej Płeć w zależności od emocji odczuwanych w szkole • Tego typu analiza jest niejako „odwrotna” do zazwyczaj rozważanych problemów przy analizie dyskryminacji. Zmienną zależną jest najczęściej zmienna „wynikowa”, a niezależnymi są czynniki wpływające na wynik lub wskaźniki wystąpienia tego wyniku (co wiemy dzięki teorii, nie dzięki danym!). • Na przykład o chorobie mogą świadczyć temperatura, występowanie kaszlu itp., a mała waga, niedożywienie mogą być czynnikami wpływającymi na wystąpienie choroby. • Natomiast w przypadku gdy rozważamy płeć jako zmienną zależną, oczywiste jest, że nie jest ona wynikiem różnych czynników. Traktujemy tu zmienne niezależne jako wskaźniki opinii czy też odczuć typowych dla dziewcząt lub chłopców i spodziewamy się silnej zależności tam, gdzie de facto odpowiedź na pytanie zależy od płci, a nie odwrotnie.

  17. Etap I – określenie celu analizy, dobór zmiennych • Na przykład : • Hipoteza: dziewczęta i chłopcy mają różne hierarchie wartości, cenią różne cechy u rówieśników • Cele analizy dyskryminacji: • sprawdzenie czy na podstawie wybranych przez ucznia cech charakteryzujących lidera (P17) można „odgadnąć” jakiej uczeń jest płci czyli czy istnieje zależność między płcią a hierarchią pożądanych cech • określenie, które cechy są bardziej cenione przez chłopców, a które przez dziewczęta

  18. Analiza danych – metody eksploracyjne • Eksploracja danych (spotyka się również określenie drążenie danych, pozyskiwanie wiedzy, wydobywanie danych, ekstrakcja danych) (ang.data mining) - jeden z etapów procesu odkrywania wiedzy z baz danych (ang. Knowledge Discovery in Databases, KDD). Idea eksploracji danych polega na wykorzystaniu szybkości komputera do znajdowania ukrytych dla człowieka (właśnie z uwagi na ograniczone możliwości czasowe) prawidłowości w danych zgromadzonych w hurtowniach danych.

  19. Analiza danych – metody eksploracyjne • Istnieje wiele technik eksploracji danych. • Techniki i metody służące eksploracji danych wywodzą się głównie z obszaru badań nad sztuczną inteligencją. Główne przykłady stosowanych rozwiązań należą do następujących zakresów: • wizualizacje na wykresach • metody statystyczne • sieci neuronowe • metody uczenia maszynowego • metody ewolucyjne • logika rozmyta • zbiory przybliżone

  20. Jeden obraz wart jest tysiąca słów Z drugiej jednak strony niektórych treści, np. abstrakcyjnych pojęć, nie da się łatwo i czytelnie przedstawić w formie graficznej. Najdoskonalszym wyjściem wydaje się więc połączenie tych dwóch warstw – tekstu i grafiki – w jedną narrację. W takim przypadku odpowiednio zastosowana grafika będzie pomagać czytelnikowi w zrozumieniu czytanej przez niego treści. Takie rozwiązanie pozwala autorowi nie rezygnować ze szczegółowości opracowania, a jednocześnie ułatwia czytelnikowi lepsze zrozumienie czasem trudnego materiału. Wizualizacja pozwala również na łatwiejsze dostrzeżenie pewnych prawidłowości w analizowanych danych.

  21. Wizualizacja - definicja • Przez termin „wizualizacja” rozumieć należy analogowe bądź cyfrowe przedstawienie danych numerycznych, porządkowych lub klasyfikacyjnych w formie graficznej. Obojętnie czy przyjmie ona formę wykresu słupkowego, diagramu, ilustracji, mapy, planu sytuacyjnego czy animacji, wizualizacja ma za zadanie uzupełnienie, podsumowywanie oraz zaprezentowanie w czytelny sposób obszernych zbiorów danych, objaśnianie związków i korelacji występujących pomiędzy informacjami zawartymi w tekście.

  22. Proces percepcji Człowiek odbiera za pomocą” • Wzroku – 87% informacji; • Słuchu – 1o% informacji’ • Pozostałych zmysłów – 3% informacji

  23. Dane • W języku polskim termin dane nie posiada liczby pojedynczej. Dlatego w sytuacji, gdy jednak zachodzi konieczność (wcale nie rzadka) zastosowania go w liczbie pojedynczej dość powszechnie zamiennie stosuje się określenie: informacja. Jest to o tyle niefortunne, że  oba pojęcia nie są wcale tożsame i stosowanie ich wymiennie może w pewnych okolicznościach prowadzić do nieporozumień. Dane bez kontekstu nie są informacją i jako takie stanowią raczej surowiec, punkt startu do jej uzyskania. • Równoważność obydwu terminów sugeruje nawet Słownik Języka Polskiego PWN, CD-ROM, Tom 1 A-K, „dane ...rzeczy, fakty, na których można się oprzeć w wywodach; informacja, wiadomości, rzad. przesłanki, motywy”. Potrzeby praktyczne sprawiły, iż ostatnio w literaturze naukowej, zwłaszcza informatycznej coraz częściej używa się terminu dane w liczbie pojedynczej – dana. Można przypuszczać, że z czasem język polski uwzględni tą modyfikację.

  24. Informacja stanowi pochodną sposobu, w jaki dane zostały zorganizowane i zaprezentowane, dzięki czemu przekazuje ich treść lub przynajmniej sposób interpretacji. Innymi słowy musi zawierać w sobie elementy koncepcyjne, związane z ludzkim intelektem. Przetworzenie danych na informacje polega więc na zinterpretowaniu wielkości (danych) istniejących w sensie fizycznym (w realnym świecie) do  postaci informacji w sensie intelektualnym (będących efektem operacji umysłowych i nie mających swojego fizycznego substytutu). Przykładowo dane historyczne dotyczące stanów liczbowych armii polskiej stają się informacją przydatną w badaniach dopiero wtedy gdy przedstawione zostaną w stosownym dla tych badań kontekście np. czasu (skala wysiłku mobilizacyjnego, stopień zagrożenia), przestrzeni (przestrzeń operacyjna, kierunki działań, przeciwnik), funkcji jaką armia ma spełniać (obrona, atak, akcja dywersyjna) itd. • W praktyce dane najczęściej odnoszą się do faktów, zaś informacje – do procesów i zjawisk.

  25. Po prawej stronie trójkąta widocznego na rysunku są zamieszczone definicje danych, informacji i wiedzy, natomiast po lewej – przykładowe ich zastosowanie. Cena 4,30 PLN jest daną. Jeżeli ta cena zostanie umieszczona w kontekście kursu walut, np. w stosunku do 1 EUR, wówczas stanie się informacją. Jeżeli z kolei ta informacja zostanie użyta jako ilustracja mechanizmu określającego działania rynku walutowego, wówczas mamy do czynienia z wiedzą.

  26. Duzy wybór danych ekonomicznych: http://www.for.org.pl/pl/bazy-danych • Jak cenne są dane ;-) http://www.euro-info-service.com/

  27. Dane jakościowe ilościowe (niemierzalne) (mierzalne) Dane w ujęciu przestrzennym w ujęciu czasowym

  28. Źródła danych pierwotne wtórne każda publikacja, która nie stanowi opisu oryginalnych badań, obserwacji, spostrzeżeń, teorii lub hipotez własnych autora, lecz gromadzi i prezentuje dane pochodzące od innych autorów. każda publikacja, która zawiera oryginalny opis badań, obserwacji, spostrzeżeń, teorii, hipotez własnych autora.

  29. Pierwotne źródła danych - przykłady • reporterskie (sprawozdania, reportaże, publikacje oparte na bezpośrednich relacjach naocznych świadków) • wywiady prasowe • ogłoszenia prasowe • reklamy prasowe i telewizyjne • bazy danych gromadzące dane zbierane "wprost z natury" – np. książki telefoniczne, kodowe i adresowe, katalogi stron WWW, słowniki biograficzne do których dane dostarczają bezpośrednio opisywane osoby • oryginalne teksty dzieł literackich • oryginalne dzieła sztuki, filmy fabularne, utwory muzyczne, pokazy multimedialne • wszelka dokumentacja techniczna – instrukcje obsługi, plany i oryginalne opisy wynalazków, budynków i maszyn, teksty patentów i wniosków racjonalizatorskich • wszelka dokumentacja medyczna – specyfikacje leków publikowane przez producentów, opisy chorób, itp. • wszelkie dane statystyczne – statystyki publikowane przez GUS i jego zagraniczne odpowiedniki, statystyki publikowane przez uznane ośrodki badania opinii publicznych

  30. Wtórne źródła danych - przykłady • naukowe publikacje przeglądowe (przeglądy piśmiennictwa) • książki naukowe o charakterze przeglądowym • podręczniki • większość encyklopedii, słowników itp. • wszelkie bazy danych gromadzące dane, które nie są oparte na bezpośrednich obserwacjach i eksperymentach, lecz tworzone w oparciu o informacje ze źródeł pierwotnych • opracowania źródłowych tekstów historycznych, o ile nie zawierają oryginalnych teorii i hipotez stawianych przez autora opisu na podstawie tychże tekstów • artykuły prasowe nie posiadające charakteru dokumentalnego (reportażowego ani wywiadu), tj. felietony, eseje, recenzje, komentarze prasowe, "słowa od redakcji", itp. • teksty techniczne pisane na podstawie źródeł pierwotnych, np.: przeglądy patentów, zbiorcze opisy rozwiązań technicznych, wtórne teksty instruktażowe pisane na podstawie zbiorów instrukcji oryginalnych, itp.

  31. Źródła pierwotne a źródła wtórne • Należy zastrzec, że różne nauki bazując na własnych metodologiach mogą niekiedy w różny sposób klasyfikować dany materiał jako pierwotny lub będący źródłem wtórnym. Innym czynnikiem mogącym zmienić status źródła jest upływ czasu i związana z nim zmiana perspektywy naukowej. Źródła wtórne pełnią przede wszystkim rolę dydaktyczną i popularyzatorską w nauce. • Zaletą pracy na danych wtórnych są niższe koszty ich pozyskania, co wiąże się z większą dostępnością. Wśród wad tych materiałów należy wymienić częste: niedostosowane do określonych potrzeb informacyjnych lub niekompletność, a także nieaktualność.

  32. Kodowanie danych www.ewd.edu.pl (kalkulator EWD)

  33. Dane ekonomiczne mogą być przedstawione: : 1) za pomocą tablic i wykresów 2) w postaci szeregów czasowych danych 3) jako dane przekrojowe 4) za pomocą wskaźników (wielkości nominalne i realne)

  34. Tablice - służą do prezentowania danych w łatwo zrozumiałej formie. Dane w postaci szeregów czasowych są to wartości danej zmiennej w różnych momentach (okresach). Wykresy - w sposób graficzny pokazują zależności między dwiema zmiennymi przy założeniu pozostałych wielkości nie zmienionych (ceteris paribus).

  35. Wyróżniamy: • wykresy punktowe, które ukazują zależność między dwoma zmiennymi przedstawionymi graficznie w układzie współrzędnych za pomocą naniesionych nań punktów o odpowiednich wartościach, oraz • wykresy liniowe (w postaci prostej lub krzywej)– jest to połączenie zaznaczonych na wykresie punktów linią łamaną bądź ciągłą i/lub naszkicowanie linii ciągłej “wypośrodkowującej” rozkład punktów. (oczywiście to tylko wybrane typy wykresów)

  36. Wykres relacji obserwowanej między dwiema zmiennymi może: • wznosić się – zależność dodatnia • opadać – zależność ujemna • przyjmować kształt linii prostej – zależność liniowa • przyjmować kształt krzywej – zależność nieliniowa

  37. Dane w postaci szeregów czasowych - są to wartości danej zmiennej w różnych momentach (okresach). Dane w ujęciu przekrojowym - odnoszą się do tego samego momentu i wyrażają różne wartości danej zmiennej charakteryzujące różne elementy/ grupy danej populacji. Przykładem danych przekrojowych jest zestawienie budżetów rodzinnych lub dane Spisu Powszechnego.

  38. Schematy (diagramy) odzwierciedlają nieilościowe informacje oraz prezentują zależności czasowe i/lub przestrzenne miedzy różnymi działami, służą raczej do pokazania fizycznych lub konceptualnych zależności, nie zaś wielkości numerycznych.

  39. N i e d a j m y s i ę o s z u k a ć ! A teraz kilka przykładów pokazujących jak łatwo można nabrać się na umiejętnie spreparowane wykresy.

  40. Kilka osób z rady nadzorczej firmy „ABC” uznało, że należy zmienić zarząd. Na posiedzeniu przedstawili dotychczasowe wyniki produkcji za pomocą wykresu, twierdząc, że w „ABC” od lat panuje stagnacja. W tym momencie wtrącił się prezes. Twierdził, że jest wręcz przeciwnie – w „ABC” widać dynamiczny wzrost produkcji. I przedstawił inny wykres prezentujący te same dane.

  41. Produkcja prawie nie rośnie (wykres rady) Produkcja wspaniale rośnie (wykres prezesa)

  42. Który z wykresów był sfałszowany? Żaden, a mimo to zasugerowały zupełnie inne stanowisko na temat produkcji w firmie. Różnie dobrane skale na osi pionowej dały dwie różne prezentacje tych samych informacji!

More Related