1 / 14

Adatbányászat oktatása a SAS rendszerrel a Debreceni Egyetemen

Adatbányászat oktatása a SAS rendszerrel a Debreceni Egyetemen. Ispány Márton DE, Informatikai Kar. Az előadás vázlata. A Debreceni Egyetem és a SAS Rövid történeti áttekintés A SAS ma a Debreceni Egyetemen Mi és hogyan érhető el a SAS-ból ? SAS az oktatásban Karok, t á rgyak , hallgatók

ouida
Download Presentation

Adatbányászat oktatása a SAS rendszerrel a Debreceni Egyetemen

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Adatbányászat oktatása a SAS rendszerrel a Debreceni Egyetemen Ispány Márton DE, Informatikai Kar SAS Felsőoktatási Fórum

  2. Az előadás vázlata • A Debreceni Egyetem és a SASRövid történeti áttekintés • A SAS ma a Debreceni EgyetemenMi és hogyan érhető el a SAS-ból? • SAS az oktatásbanKarok, tárgyak, hallgatók • Az adatbányászat oktatásaMit, hogyan és főként miért SAS-sal oktassunk? SAS Felsőoktatási Fórum

  3. A kapcsolat főbb állomásai • SAS 6.04, 1992:az első SAS(5.25” disk)Modulok:STAT,GRAPH,ETS,FSP,OR,AF,IML,QC • Bécs, 1992:az első SEUGI • SAS 6.08, 1994:+ACCESS, ASSIST, LAB(3.5” disk) • SAS 6.11, 1996:új média -CD • Egyetemi program:SAS 8, 2000.12.11.Analitikai és információtechnológiai modulok, Enterprise Miner, Risk Dimension,CFO Vision • Konferencia és szakképzési támogatások SAS Felsőoktatási Fórum

  4. SAS a Debreceni Egyetemen, 2006 • Egyetemi program:1000 munkaállomás • Modulok:BASE, GRAPH, ETS, FSP, AF, OR, IML, SHARE, QC, STAT, EM Server, EM Thin Client, CONNECT, OLE DB, EIS, Enterprise Miner for Text, PC File Formats, ODBC, SHARE*NET, IntrNet Compute Services, Enterprise Miner, MDDB Server common products, AppDev Studio, Integration Technologies • Operációs rendszerek:WINDOWS, LINUX, AIX, SOLARIS • Helyi képviselő • Hallgatóknak Student-verzió SAS Felsőoktatási Fórum

  5. SAS az oktatásban • Informatikai KarKomputerstatisztika Adatbányászat Statisztika II. • Közgazdaságtudományi KarDöntéstámogatási rendszerek SAS üzleti intelligencia Többváltozós statisztika • Agrártudományi CentrumAgrárinformatika SAS Felsőoktatási Fórum

  6. Enterprise Guide • Első ismerkedés a SAS rendszerrel A SAS alapfogalmai • Oktatható tárgyak:Statisztika, Gazdaságstatisztika, SAS Üzleti Intelligencia, Többváltozós statisztika • Használat: előadás (projektoros bemutató) szeminárium (önálló gyakorlati munka) • Tapasztalatok Pozitív:magyar nyelv, jó menü, HTML outputNegatív:pár fontos, oktatandó próba hiánya SAS Felsőoktatási Fórum

  7. Adatbányászat • Tárgya:nagyméretű adatállományok feldolgozása • Célja:korábban nem ismert, nem triviális és potenciálisan hasznos információ • Eszköze:haladott matematikai, statisztikai és mesterséges intelligencia modellek • Módja:automatikus vagy félig automatikus SAS Felsőoktatási Fórum

  8. Miért aktuális? • Piaci igényadatbázisrendszerek  üzleti intelligencia • StandardizálódásIBM, Microsoft, Oracle Corporation, SAP, SAS, Salford Systems, StatSoft • Független szervezetekACM SIGKDD, DMG • Projektek és konzorciumokPMML, JDMAPI, XMLA • Elérhető és használható szoftver(egyetemi program) SAS Felsőoktatási Fórum

  9. Az oktatás feltételei • Kiknek oktassuk?Alkalmazott matematikus Közgazdász Programtervező informatikus • Ki oktasson?matematikus, informatikus, közgazdász • Hogyan oktassunk? Előfeltételek: informatika, matematikaTechnikai feltételek: jegyzet, labor, szoftver SAS Felsőoktatási Fórum

  10. Egy félév vázlata • Bevezetés + példák • Az adatbányászat definíciója • Az 5 lépcsős folyamat (SEMMA) • Adatbányászati feladatok. Felügyelt:osztályozás, becslés és előrejelzésNemfelügyelt:társítás, csoportosítás és leírás • Kiértékelésstatisztikai mutatók:ASE, RMSE, AIC, BICgrafikus eszközök: lift-görbe, ROI-görbe SAS Felsőoktatási Fórum

  11. Adatbányászati modellek I. • Lineáris és logisztikus regresszió(REG) • Döntési fák(Tree) • Neurális hálók(Neural Network) • Vásárlói kosár elemzés(Association) • Automatikus klaszterezés(Clustering) • Legközelebbi társ módszer(Memory-Based Reasoning) • Példák:SPAM,HP, Palo Alto,ftp.ics.uci.eduCalifornia Housing,STATLIB SAS Felsőoktatási Fórum

  12. Adatbányászati modellek II. • Kohonen-féle leképezések(SOM-Kohonen) • Genetikus algoritmusok(IML Workshop) • Kapcsolat elemzés (link-analysis) • Support Vector Machines(nem támogatott) • Ensemble modellek(bagging, boosting) • Szövegbányászat (Parsing, SVD, EM-Clustering) • Web-bányászat (link-analysis,Webhound) • Idősorok(Time Series) SAS Felsőoktatási Fórum

  13. Enterprise Miner • Könnyen használható grafikus felület • Jó alapbeállítások • Teljes adatbányászati eszköztár • Integráltság (külső SAS kódok) • Nyitottság (pl. HTML output) SAS Felsőoktatási Fórum

  14. Általános tapasztalatok • Népszerű tárgy, de a hallgatók nincsenek tisztában a tárgy összetettségével Következmény: lemorzsolódás • Fontos a könnyen használható szoftver • Gyakorlati példák, valós adatállományok Nincs királyi út! SAS Felsőoktatási Fórum

More Related