140 likes | 302 Views
Adatbányászat oktatása a SAS rendszerrel a Debreceni Egyetemen. Ispány Márton DE, Informatikai Kar. Az előadás vázlata. A Debreceni Egyetem és a SAS Rövid történeti áttekintés A SAS ma a Debreceni Egyetemen Mi és hogyan érhető el a SAS-ból ? SAS az oktatásban Karok, t á rgyak , hallgatók
E N D
Adatbányászat oktatása a SAS rendszerrel a Debreceni Egyetemen Ispány Márton DE, Informatikai Kar SAS Felsőoktatási Fórum
Az előadás vázlata • A Debreceni Egyetem és a SASRövid történeti áttekintés • A SAS ma a Debreceni EgyetemenMi és hogyan érhető el a SAS-ból? • SAS az oktatásbanKarok, tárgyak, hallgatók • Az adatbányászat oktatásaMit, hogyan és főként miért SAS-sal oktassunk? SAS Felsőoktatási Fórum
A kapcsolat főbb állomásai • SAS 6.04, 1992:az első SAS(5.25” disk)Modulok:STAT,GRAPH,ETS,FSP,OR,AF,IML,QC • Bécs, 1992:az első SEUGI • SAS 6.08, 1994:+ACCESS, ASSIST, LAB(3.5” disk) • SAS 6.11, 1996:új média -CD • Egyetemi program:SAS 8, 2000.12.11.Analitikai és információtechnológiai modulok, Enterprise Miner, Risk Dimension,CFO Vision • Konferencia és szakképzési támogatások SAS Felsőoktatási Fórum
SAS a Debreceni Egyetemen, 2006 • Egyetemi program:1000 munkaállomás • Modulok:BASE, GRAPH, ETS, FSP, AF, OR, IML, SHARE, QC, STAT, EM Server, EM Thin Client, CONNECT, OLE DB, EIS, Enterprise Miner for Text, PC File Formats, ODBC, SHARE*NET, IntrNet Compute Services, Enterprise Miner, MDDB Server common products, AppDev Studio, Integration Technologies • Operációs rendszerek:WINDOWS, LINUX, AIX, SOLARIS • Helyi képviselő • Hallgatóknak Student-verzió SAS Felsőoktatási Fórum
SAS az oktatásban • Informatikai KarKomputerstatisztika Adatbányászat Statisztika II. • Közgazdaságtudományi KarDöntéstámogatási rendszerek SAS üzleti intelligencia Többváltozós statisztika • Agrártudományi CentrumAgrárinformatika SAS Felsőoktatási Fórum
Enterprise Guide • Első ismerkedés a SAS rendszerrel A SAS alapfogalmai • Oktatható tárgyak:Statisztika, Gazdaságstatisztika, SAS Üzleti Intelligencia, Többváltozós statisztika • Használat: előadás (projektoros bemutató) szeminárium (önálló gyakorlati munka) • Tapasztalatok Pozitív:magyar nyelv, jó menü, HTML outputNegatív:pár fontos, oktatandó próba hiánya SAS Felsőoktatási Fórum
Adatbányászat • Tárgya:nagyméretű adatállományok feldolgozása • Célja:korábban nem ismert, nem triviális és potenciálisan hasznos információ • Eszköze:haladott matematikai, statisztikai és mesterséges intelligencia modellek • Módja:automatikus vagy félig automatikus SAS Felsőoktatási Fórum
Miért aktuális? • Piaci igényadatbázisrendszerek üzleti intelligencia • StandardizálódásIBM, Microsoft, Oracle Corporation, SAP, SAS, Salford Systems, StatSoft • Független szervezetekACM SIGKDD, DMG • Projektek és konzorciumokPMML, JDMAPI, XMLA • Elérhető és használható szoftver(egyetemi program) SAS Felsőoktatási Fórum
Az oktatás feltételei • Kiknek oktassuk?Alkalmazott matematikus Közgazdász Programtervező informatikus • Ki oktasson?matematikus, informatikus, közgazdász • Hogyan oktassunk? Előfeltételek: informatika, matematikaTechnikai feltételek: jegyzet, labor, szoftver SAS Felsőoktatási Fórum
Egy félév vázlata • Bevezetés + példák • Az adatbányászat definíciója • Az 5 lépcsős folyamat (SEMMA) • Adatbányászati feladatok. Felügyelt:osztályozás, becslés és előrejelzésNemfelügyelt:társítás, csoportosítás és leírás • Kiértékelésstatisztikai mutatók:ASE, RMSE, AIC, BICgrafikus eszközök: lift-görbe, ROI-görbe SAS Felsőoktatási Fórum
Adatbányászati modellek I. • Lineáris és logisztikus regresszió(REG) • Döntési fák(Tree) • Neurális hálók(Neural Network) • Vásárlói kosár elemzés(Association) • Automatikus klaszterezés(Clustering) • Legközelebbi társ módszer(Memory-Based Reasoning) • Példák:SPAM,HP, Palo Alto,ftp.ics.uci.eduCalifornia Housing,STATLIB SAS Felsőoktatási Fórum
Adatbányászati modellek II. • Kohonen-féle leképezések(SOM-Kohonen) • Genetikus algoritmusok(IML Workshop) • Kapcsolat elemzés (link-analysis) • Support Vector Machines(nem támogatott) • Ensemble modellek(bagging, boosting) • Szövegbányászat (Parsing, SVD, EM-Clustering) • Web-bányászat (link-analysis,Webhound) • Idősorok(Time Series) SAS Felsőoktatási Fórum
Enterprise Miner • Könnyen használható grafikus felület • Jó alapbeállítások • Teljes adatbányászati eszköztár • Integráltság (külső SAS kódok) • Nyitottság (pl. HTML output) SAS Felsőoktatási Fórum
Általános tapasztalatok • Népszerű tárgy, de a hallgatók nincsenek tisztában a tárgy összetettségével Következmény: lemorzsolódás • Fontos a könnyen használható szoftver • Gyakorlati példák, valós adatállományok Nincs királyi út! SAS Felsőoktatási Fórum