120 likes | 315 Views
KLASTERANALÜÜS SPSS CLEMENTINE ABIL Aimar Arak Infosüsteemide analüüsi õppekava Juhendaja: Jüri Kuusik. AGENDA. Teema valik Töö eesmärk T öö struktuur Tulemused. MIKS?. Autori huvi andmekaeve ja klasteranalüüsi vastu ning tegelemine töökohal
E N D
KLASTERANALÜÜSSPSS CLEMENTINE ABILAimarArakInfosüsteemide analüüsi õppekava Juhendaja: Jüri Kuusik
AGENDA Teema valik Töö eesmärk Töö struktuur Tulemused
MIKS? Autori huvi andmekaeve ja klasteranalüüsi vastu ning tegelemine töökohal SPSS Clementine kasutamise võimalus Eestikeelset lugemist klasteranalüüsi kohta väga vähe
TÖÖ EESMÄRK Andalugejaleülevaadeandmekaevest, selleprotsessistjaerinevatestandmekaevemeetoditest Tutvustadalugejale klasteranalüüsi mõistet, erinevaid klastrite moodustamiseviisejaerinevaid klastrite tüüpe Vaadeldalähemaltkolmeklasteranalüüsi meetoditjakirjeldadanendealgoritmidetööpõhimõtet Viialäbi klasteranalüüs SPSS Clementinegajakirjeldadasaadudtulemusi
STRUKTUUR: Peatükk 1 • Ülevaade andmekaevest • Standardiseeritud andmekaeve protsessi kirjeldus (CRISP-DM, kõrvaloleval joonisel) • Ülevaade andmekaeve- meetoditest
STRUKTUUR: 2.peatükk 1 • Klasteranalüüsi mõiste • Erinevad klasterdamise viisid • Erinevad klastrite tüübid
STRUKTUUR: 2.peatükk 2 Klasteranalüüsi meetodid: • K-keskmiste meetod (kõrvaloleval joonisel) • Kohoneni SOM meetod • Hierarhiline kokkuliitev meetod • SPSS Clementines sisalduvad Algoritm: k-keskmiste algoritm. Sisend: Klastrite arv k, andmestik n objektiga. Väljund: k klastrit. Meetod: 1.Valida juhuslikult k objekti tsentroidideks; 2. korrata 3. moodustada k klastrit, paigutades objekt temale lähima tsentroidiga klastrisse; 4. arvutada klastrite tsentroidide väärtused ümber; 5. kuni tsentroidide asukohad ei muutu.
STRUKTUUR: 3.peatükk 1 Klasteranalüüs kasutades andmekaevevahendit SPSS Clementine • Näidisandmestik: kindlustusfirma kliendid - 5822 rida, 86 atribuuti • Andmete ülevaatus ja ettevalmistamine • Ülesandepüstitus • Kasutatava metoodika tutvustus
STRUKTUUR: 3.peatükk 2 • Klasteranalüüsi läbiviimine kasutades: • K-keskmiste meetodit • Kohoneni SOM meetodit • Kaheastmelist meetodit (BIRCH + hierarhiline kokkuliitev meetod) • Vastavalt ülesandepüstitusele klientide kirjeldamine
STRUKTUUR: 3.peatükk 3 Järeldused: • Kasutada erinevaid klasteranalüüsi meetodeid • Lahendatava ülesande sisu mõistmise olulisus • Kasutaja intuitsiooni ja interpreteerimisvõime rakendamine • SPSS Clementine töövahendina lihtne ja loogiline
TULEMUSED Tutvustatudandmekaevevaldkondajaprotsessi Tutvustatud klasteranalüüsi mõistet ja olemust Kirjeldatuderinevate klasteranalüüsi meetoditealgoritme Lahendatudülesanne klasteranalüüsi läbiviimiseteel SPSS Clementinega Praktilise ülesande läbiviimine ja järelduste väljatoomine Loodetavasti vajalik materjal klasteranalüüsist huvituvale Eesti lugejale