1 / 12

AGENDA

KLASTERANALÜÜS SPSS CLEMENTINE ABIL Aimar Arak Infosüsteemide analüüsi õppekava Juhendaja: Jüri Kuusik. AGENDA. Teema valik Töö eesmärk T öö struktuur Tulemused. MIKS?. Autori huvi andmekaeve ja klasteranalüüsi vastu ning tegelemine töökohal

waseem
Download Presentation

AGENDA

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. KLASTERANALÜÜSSPSS CLEMENTINE ABILAimarArakInfosüsteemide analüüsi õppekava Juhendaja: Jüri Kuusik

  2. AGENDA Teema valik Töö eesmärk Töö struktuur Tulemused

  3. MIKS? Autori huvi andmekaeve ja klasteranalüüsi vastu ning tegelemine töökohal SPSS Clementine kasutamise võimalus Eestikeelset lugemist klasteranalüüsi kohta väga vähe

  4. TÖÖ EESMÄRK Andalugejaleülevaadeandmekaevest, selleprotsessistjaerinevatestandmekaevemeetoditest Tutvustadalugejale klasteranalüüsi mõistet, erinevaid klastrite moodustamiseviisejaerinevaid klastrite tüüpe Vaadeldalähemaltkolmeklasteranalüüsi meetoditjakirjeldadanendealgoritmidetööpõhimõtet Viialäbi klasteranalüüs SPSS Clementinegajakirjeldadasaadudtulemusi

  5. STRUKTUUR: Peatükk 1 • Ülevaade andmekaevest • Standardiseeritud andmekaeve protsessi kirjeldus (CRISP-DM, kõrvaloleval joonisel) • Ülevaade andmekaeve- meetoditest

  6. STRUKTUUR: 2.peatükk 1 • Klasteranalüüsi mõiste • Erinevad klasterdamise viisid • Erinevad klastrite tüübid

  7. STRUKTUUR: 2.peatükk 2 Klasteranalüüsi meetodid: • K-keskmiste meetod (kõrvaloleval joonisel) • Kohoneni SOM meetod • Hierarhiline kokkuliitev meetod • SPSS Clementines sisalduvad Algoritm: k-keskmiste algoritm. Sisend: Klastrite arv k, andmestik n objektiga. Väljund: k klastrit. Meetod: 1.Valida juhuslikult k objekti tsentroidideks; 2. korrata 3. moodustada k klastrit, paigutades objekt temale lähima tsentroidiga klastrisse; 4. arvutada klastrite tsentroidide väärtused ümber; 5. kuni tsentroidide asukohad ei muutu.

  8. STRUKTUUR: 3.peatükk 1 Klasteranalüüs kasutades andmekaevevahendit SPSS Clementine • Näidisandmestik: kindlustusfirma kliendid - 5822 rida, 86 atribuuti • Andmete ülevaatus ja ettevalmistamine • Ülesandepüstitus • Kasutatava metoodika tutvustus

  9. STRUKTUUR: 3.peatükk 2 • Klasteranalüüsi läbiviimine kasutades: • K-keskmiste meetodit • Kohoneni SOM meetodit • Kaheastmelist meetodit (BIRCH + hierarhiline kokkuliitev meetod) • Vastavalt ülesandepüstitusele klientide kirjeldamine

  10. STRUKTUUR: 3.peatükk 3 Järeldused: • Kasutada erinevaid klasteranalüüsi meetodeid • Lahendatava ülesande sisu mõistmise olulisus • Kasutaja intuitsiooni ja interpreteerimisvõime rakendamine • SPSS Clementine töövahendina lihtne ja loogiline

  11. TULEMUSED Tutvustatudandmekaevevaldkondajaprotsessi Tutvustatud klasteranalüüsi mõistet ja olemust Kirjeldatuderinevate klasteranalüüsi meetoditealgoritme Lahendatudülesanne klasteranalüüsi läbiviimiseteel SPSS Clementinega Praktilise ülesande läbiviimine ja järelduste väljatoomine Loodetavasti vajalik materjal klasteranalüüsist huvituvale Eesti lugejale

  12. TÄNAN KUULAMAST!

More Related