280 likes | 475 Views
Kemometri - et personligt syn Carsten Ridder, Lattec I/S dsk.2008.konference. torsdag.den.10.januar.2008. Find et skjult fænomen i dette billede!. Det skjulte (eller latente) fænomen er “alder”.
E N D
Kemometri- et personligt syn • Carsten Ridder, Lattec I/S • dsk.2008.konference. torsdag.den.10.januar.2008.
Find et skjult fænomen i dette billede! Det skjulte (eller latente)fænomen er “alder”
Folkeskolekarakterer m.v. for elever på en handelskole Find et skjult fænomen i dette “billede”! Med kemometri (eller latentik) omdanner vi tal til grafik ... ligesom musikere omdanner noder til musik
Kemometri er • en filosofisk retning inden for (analytisk) kemi • en måde at opfatte naturen på • en måde at tænke på • at tænke på fænomener i stedet for detaljer • at finde og udnytte latente strukturer i ‘kaos’ • at bruge latentik på kemiske data Latentik kunne defineres som: “Læren om det skjulte” “At uddrage skjulte fænomer fra det tilsyneladende kaos”
Det såkaldte geni – er blot den, der ser mønsteret i detaljernes forvirring lidt før gennemsnittet. Fra ”Mind Map - til hverdag og fest”, www.dieu.dk Ved Konsulent Kirsten Andersen, underviser hos DIEU Det såkaldte geni – er blot den, der ser mønsteret i detaljernes forvirring lidt før gennemsnittet.
Folkeskolekarakterer m.v. for elever på en handelskole Dumpet! Bestået!
dumpet/bestået er ikke inkluderet som en variabel Et skjult fænomen (i tabellen) er ‘Bestået’ (til venstre) og ‘Dumpet’ (til højre)
Matematisk Sproglig Lad os finde årsager … Disse variable er positivt korrelleret til ‘Bestået’ … gruppen kan opdeles i to fænomener
Matematisk Sproglig Sådan kunne tabellen altså oversættes til grafik
ikke-selektive data ind latentik Analysen genererer hypotesen, at man kan opdele eleverne i to hovedgrupper: de der har gode sproglige færdigheder og de der har gode matematiske færdigheder. information viden teori hypoteser
Jeg ved en lærkerede Jeg ved en lærkerede Solen er så rød, mor Mester Jakob Højt på en gren Oles nye autobil Mæ, si'r det lille lam Juletræet med sin pynt Tommelfinger, ... Nu lukker sig mit øje Den lille Ole Kan melodier klassificeres på baggrund af deres latente struktur? Se den lille kattekilling
loadings spektrum C anvendes i 44% af melodienG7 anvendes i 25% af melodienF/Dm anvendes i 19% af melodien Anvendelse af latentik på melodier Hvor meget scorer harmonierne i denne melodi?
Mængde af principale harmonier Hvor meget scorer hver harmoni? C G7 F Dm Am Em . . . . Jeg ved en lærkerede Jeg ved en lærkerede Solen er så rød, mor Mester Jakob Højt på en gren Oles nye autobil Mæ, si'r det lille lam Juletræet med sin pynt Tommelfinger, ... Nu lukker sig mit øje Den lille Ole Kan melodier klassificeres på baggrund af deres latente struktur? C Se den lille kattekilling G7 F Dm Am Em Hm7b5 D7 etc. De principale harmonier eller latente strukturer (loadings) ordnet efter vigtighed ("orthogonale" harmonier)
... ... 44 25 13 6 6 0 65 20 0 5 5 0 39 36 11 7 0 4 63 25 13 0 0 0 70 25 0 0 5 0 56 44 0 0 0 0 46 29 8 0 8 0 31 16 6 23 9 0 28 8 6 6 50 0 67 21 4 0 8 0 81 6 13 0 0 0 0 25 0 0 75 0 37 29 6 13 8 0 34 26 15 0 15 0 C G7 F Dm Am Em Principale harmonier 1 2 3 4 5 6 Jeg ved en lærkerede (bog) 50 31 6 0 6 0 Jeg ved en lærkerede (CR) Højt på en gren en krage Stork, stork langeben Mæ, bæ hvide lam Mæ, si'r det lille lam Se den lille kattekilling Den lille Ole Solen er så rød mor Jeg en gård jeg bygge vil Oles nye autobil Tommelfinger, tommelfinger Mester Jakob Nu lukker sig mit øje Juletræet med sin pynt mean 55% 24% 8% 4% 5% 0% cumulated mean 55% 79% 87% 91% 96% 96% Scores-plot (mængde af PH1 vs. mængde af PH2 = 79% af variationen) 50 Se den lille kattekilling 40 Stork, stork langeben Jeg ved en lærkerede (bog) Nu lukker sig mit øje 30 Mæ, bæ hvide lam Den lille Ole Juletræet med sin pynt Mæ, si'r det lille lam Mængde af G7 (24% af variationen) Jeg ved en lærkerede (CR) 20 Oles nye autobil mean Jeg en gård jeg bygge vil Højt på en gren en krage Solen er så rød mor 10 Tommelfinger, tommelfinger Mester Jakob 0 20 40 60 80 100 Mængde af C (55% af variationen) Hvor ville en tyrkisk eller kinesisk sang være i dette plot? (tilhører andre populationer => 'outlier')
Harmonier er latente (musikalske) strukturer i melodierne … ligesom partiprogrammer er latente (politiske) strukturer i samfundet … ligesom loadingser latente (kemiske) strukturer i NIR-spektre De latente strukturer er fælles for alle objekter (melodier, personer, spektre) Hvert objekt har forskellig score (eller præference) for de forskellige latente strukturer • De latente strukturer har forskellig vigtighed: • Musik: I C-dur er rækkefølgen (faldende vigtighed) harmonierne C, G, F/Dm, Am, … (kvintcirklen) • Politik: Det største politiske parti (eller -isme), det næststørste politiske parti, osv. • Kemometri: Den første principale komponent (PC), den anden principale komponent, osv.
MusikHVOR MANGE harmonier skal vi bruge? (vuggestue eller jazz?) • PolitikHVOR MANGE partier i folketinget? (engelsk eller polsk parlament?) • KemiHVOR MANGE principale komponenter?
Validering … at finde den optimale kompleksitet
Koncentration (M) Tid (sekunder) Rådata (fra en kemisk reaktion) Rådata (fra komponisten)
Concentration (M) Time (seconds) For kompliceret – lad os prøve noget mere simpelt …
Concentration (M) Time (seconds) For simpelt – lad os prøve noget mere musikalsk …
Concentration (M) Time (seconds) lad os prøve uden melodien …
De optimale harmonier er latente (musikalske) strukturer i melodierne I musik finder man optimum ved at bruge sine ører I politik justerer man optimum ved at ændre på spærregrænsen I kemometri finder man optimum ved f.eks. at bruge krydsvalidering … pas på både under- og over-fit!
Opsummering af kemometrisk dataanalyse • lyt til melodierne mål spektrene (sine mange variable) • gå hen til klaveret gå hen til computeren • find harmonierne beregn loadings (PCA-model) • tæl harmonierne beregn scores • nyd musikken … ! lav plots, generer hypoteser, udtræk information, bliv klogere … ! Tak for opmærksomheden!