350 likes | 629 Views
Tema 3: Skladi štenje podataka i inteligentni agenti. SISTEMI ZA PODRŠKU ODLUČIVANJU doc dr Vladislav Mi š kovic Fakultet za informatiku i menadžment 2009/2010. Tema 3 : Skladištenje podataka i inteligentni agenti. Uvod Skladišta podataka Razvoj skladišta podataka
E N D
Tema 3: Skladištenje podataka i inteligentni agenti SISTEMI ZA PODRŠKU ODLUČIVANJU doc dr Vladislav Miškovic Fakultet za informatiku i menadžment 2009/2010
Tema 3:Skladištenje podatakai inteligentni agenti • Uvod • Skladišta podataka • Razvoj skladišta podataka • Zaštita i administracija • Inteligentni agenti • Primeri
1. UVOD • Poslovna inteligencija • Skladište podataka • Osnovna svojstva • Struktura i komponente
Poslovna inteligencija (business intelligence) • Sastoji se od • skladišta podataka (data warehouse, DW) i • skupa korisničkih alata za kreiranje upita i izveštaja i njihovu analizu i vizualizaciju (business analytics, BA) • metoda za otkrivanje netrivijalnih relacija u podacima (data mining i Web mining) • metoda i alata za upravljanje performansama poslovanja (business performance management, BPA)
Skladište podataka • skup podataka proizvedenih radi podrške odlučivanju • mesto prikupljanja tekućih i istorijskih podataka, potencijalno od interesa za različite menadžere u organizaciji • podaci su strukturisani na način pogodan za različite analitičke obrade
Osnovna svojstvaskladišta podataka • neophodni za analitičko procesiranje (OLAP), koje omogućava korisniku udobnije, manje formalne načine postavljanja složenih upita • različito od klasičnog procesiranja transakcija (OLTP) • suprotstavljeni ciljevi izgradnje operativnih baza i analitičkih baza podataka (neefikasnost) • skladište proizvedenih informacija • informacije iz više izvora (baza podataka) • neophodne za održavanje tržišne prednosti • primena u izgradnji brendova, lojalnosti mušterija, ...
2. SKLADIŠTA PODATAKA • Osnovne definicije • Proces skladištenja • Arhitekture skladištenja • Integracija podataka
Osnovne definicije • Skladište podataka (Data Warehouse) • integrisana, pojmovno orijentisana, vremenski promenljiva i neizbrisiva kolekcija podataka, koja pruža podršku odlučivanju • Data Mart • mali podskup skladišta posvećen nekoj tematici i namenjen određenoj grupi ljudi • Operational Data Store (ODS) • dinamička, privremena skladišta, za brzo donošenje odluka • Enterprise Data Warehouses (EDW) • velika skladišta podataka, za celu organizaciju
Proces skladištenja • Osnovne komponente • izvori podataka (data sources) - transakcione baze, datoteke, eksterni izvori • ekstakcija • punjenje • baza podataka • metapodaci • middleware
Arhitekture skladištenja • dvoslojna ili troslojna, prema tome kako su raspoređeni • podaci i softver skladišta • softver za prikupljanje podataka (ekstrakciju, konsolidaciju, sumiranje i punjenje skladišta) • klijent • Web sistemi • postoje različite varijante arhitekture skladišta, od centralizovanih do decentralizovanih rešenja, gde se samo dele različiti pogledi (DataMarts)
Različite arhitekture skladištenja a) centralizovano b) Web c) decentralizovano
Integracija podataka • priprema podataka za upotrebu od strane drugih alata za skladištenje (DW) • pristup (access) različitim izvorima podataka • objedinjavanje (federation) podataka iz različitih izvora/sistema - internih i eksternih • izdvajanjepromena (change capture) • Tehnologije koje se koriste u integraciji • Enterprise application integration (EAI) • Service-oriented architecture (SOA) • Enterprise information integration (EII) • Extract, transformation and load (ETL)
ETL proces • Ekstrakcija - čitanje više baza (transakcione baze podataka, fajlovi, elektronske tabele, lične baze podataka) • Transformacija - promena oblika podataka • Punjenje (load) - smeštanje u skladište • Koristi se pomoćna, privremena baza podataka • Poslovna pravila su smeštena centralizovano, kao metapodaci • Koriste se namenski alati (Microsoft, Oracle, IBM, Informatica, Tibco) ili se pišu se posebni programi
3. RAZVOJ SKLADIŠTA • Primer • Poznati proizvođači softvera • Različiti pristupi razvoju • Struktura skladišta (zvezda) • Implementacija • Masivna skladišta • Skladištenje u realnom vremenu
Primer • avioprevoznik u finansijskim problemima (7. u svetu) • 2300 letova dnevno • 227 destinacija • problem organizacije i zadovoljenja potreba putnika • više različitih baza podataka i nasleđenih zastarelih sistema, spori upiti • izgrađeno integrisano skladište podataka kompanije (EDW) • informacije u realnom vremenu (putnici, osoblje, bezbednost, proces letenja) • osim redukcije troškova, eliminisane i zloupotrebe • investicija od 30 miliona (u toku 6 godina), povećanje prihoda 500 miliona
Poznati proizvođači softvera • Computer Associates (www.ca.com) • Hyperion Solutions (www.hyperion.com) • IBM (www.ibm.com) • Informatica (www.informatica.com) • Microsoft (www.microsoft.com) • Oracle (PeopleSoft, Siebel) www.oracle.com • SAS Institute (www.sas.com) • Sybase (www.sybase.com) • Teradata (www.teradata.com)
Različiti pristupi razvoju • Centralizovani pristup (EDW) • jedinstven pogled na celu organizaciju • koristi metode i alate za razvoj baza podataka (ERD, spiralni razvoj) • Decentralizovani pristup (Data Mart) • "planirati celinu, graditi postupno" • podaci se prvo organizuju prema problematici pojedinih organizacionih celina • često prvi korak ka razvoju centralizovanog skladišta (EDW)
Struktura skladišta (zvezda) • modeliranje dimenzija - sistem pristupa podacima velikog obima • struktura zvezde je način implementacije modela dimenzija • centralna tabela - posmatrani poslovni podaci i njihovi atributi, analitički (mere performansi), deskriptivni, ključevi • tabele dimenzija (klasifikacija i agregacija informacija o podacima) • granulacija - nivo detaljnosti (optimizuje se)
Implementacija • poseban projekt, veliki broj različitih pristupa • niz faktora i kriterijuma (na vežbama) • osnovni alati za integraciju podatakasu deo softvera poznatih proizvođača DBMS/BI alata, npr. • SSIS - SQL Server Integration Services
Masivna skladišta • performanse opadaju porastom veličine skladišta • veličina skladišta podataka raste eksponencijalno (danas petabajti) • skalabilnost skladišta je svojstvo da vreme pristupa linearno zavisi od veličine skladišta
Skladištenje u realnom vremenu • tradicionalna skladišta podataka se ažuriraju periodično (npr. nedeljno) • važni aspekti poslovanja zahtevaju donošenje odluka u realnom vremenu • za potrebe korisnika koji direktno komuniciraju s kupcima i dobavljačima, EDW su evoluirali u real time data warehousing (RTDW) ili active warehousing (ADW) • omogućena je upotreba skladišta podataka i na taktičkom nivou
4. ZAŠTITA I ADMINISTRACIJA • Metodi zaštite i administracije informacionih sistema i baza podataka • Administrator skladišta podataka • komunikacija sa donosiocima odluka • potrebno znanje iz informacionih sistema, baza podataka, mreža i sistema za podršku odlučivanju
5. INTELIGENTNI AGENTI • Inteligentniagent - računarski program koji pomaže korisniku u obavljaju rutinskih poslova na osnovu utvrđenih pravila i baze znanja [1] • agent - osoba koja sarađuje s drugim licima radi obavljajnja određenih poslova • softverski agent (software daemon, software agent), čarobnjak (wizzard) = softverski robot (softbot, chatterbot, shopbot, knowbot, mailbot, spambot)
Podela prema primeni • autonomni agenti • biološki agenti • robotski agenti • računarski agenti • softverski agenti • određene namene • za zabavu • virusi • veštački živi agenti
Podela prema svojstvima (dimenzijama) • agencija - stepen autonomije (asinhronost) • inteligencija - stepen zaključivanja i sposobnost učenja • mobilnost - sposobnost premeštanja u mrežnom okruženju • učestvuju u procesima i u vreme kad korisnik nije na mreži (npr. višednevne aukcije)
Internet agenti • e-mail agenti (mailbot) • web browsing asistenti • inteligentni pretraživači • indeksiranje informacija, robots, spiders, wanderers • softboti (pronalaženje informacija) • google.com, hotjobs.yahoo.com • agenti za upravljanje i nadzor • e-commerce agenti • bestwebbuys.com, ebay.com • ostali agenti (inteligentni interfejsi, učenje, preporučivanje, profilisanje, Web mining, ...)
6. PRIMERI Primeri projekata na sajtovima • Oracle www.oracle.com • Microsoft www.microsoft.com • IBM www.ibm.com • Hyperion www.hyperion.com • Harvard Bussines School Case Collection www.harvardbussinesonline.hbsp.harvard.edu Inteligentni agenti i interfejsi • www.botspot.com
Literatura • Nastavni materijali (prezentacije i uputstva) • Turban E., Aronson J.E., Liang T., Sharda R., Decision Support and Business Intelligence Systems, 8th Ed, Pearson Education,Inc, 2007 • Seref M., Ahuja R.,Winston W., Developing Spreadsheet-based Decision Support Systems, Dynamic Ideas, 2007 • Adam F., Humphreys P., Encyclopedia of Decision Making and Decision Support Technologies, IGI Global, 2008
SISTEMI ZA PODRŠKU ODLUČIVANJUTema 3: Skladištenje podataka i inteligentni agenti KRAJ