440 likes | 604 Views
P. S i C. artage. onnaissance. nformel. éminaire. P. roblèmes. KmL : K- Means pour données Longitudinales. Christophe Genolini Bruno Falissard. Définition. Deux trajectoires. Dix trajectoires. Trop de trajectoires. Problème…. Solution : clusters.
E N D
P S i C artage onnaissance nformel éminaire P roblèmes
KmL: K-Means pour données Longitudinales Christophe Genolini Bruno Falissard
Trop de trajectoires... Problème…
Comment clusteriser ? • Algorithmes paramétriques • Algorithmes non paramétriques
Comment clusteriser ? • Algorithmes paramétriques • Exemple : proc traj • Basés sur la vraisemblance • Algorithmes non paramétriques • K means (KmL)
Vraisemblance pour la taille Taille = 5.9 Petite vraisemblance Grance vraisemblance
Algorithmesparamétriques • Nombre de clusters • Forme des trajectoires • Forme des distributions (poisson, normal…) Maximisation de la vraisemblance
algorithme Non Parametrique • Nombre de clusters Maximisation d’un critère (distance)
Celamarche-t-il ? > KmF(cld3,4,1,print="all")
Bilan > KmF(cld4,2:4,10,print="all") > choice(cld4)
Perspective : Joint trajectories • plot(ld7,col=rep(1,120)) • plot(ld7,col=rep(2:7,20))
Perspective : Regroupersur les silhouettes Classique Silhouettes
Perspective:Missing values for joinT trajectories • Can we measure once every two years?