140 likes | 265 Views
Plan d’expérience dynamique pour la maximisation. Aspect théorique Mise en œuvre expérimentale. Choix de l’algorithme ? Choix de la fonction ?. Présence ou absence de bruit ? Choix du paramètre ?. Aspect théorique. f est très coûteuse à évaluer
E N D
Plan d’expérience dynamique pour la maximisation Aspect théorique Mise en œuvre expérimentale • Choix de l’algorithme ? • Choix de la fonction ? • Présence ou absence de bruit ? • Choix du paramètre ?
Aspect théorique • f est très coûteuse à évaluer • f est supposée régulière, lisse Optimisation stochastique : Donc :
La borne du regret cumulé dépend de la rapidité d’obtention du gain d’information. • Mathématiquement T Etablit une nouvelle connexion entre GP-UCB et ED
GP-UCB • Partie théorique: • Description du modèle • Gain d’information et Experimental Design • Algorithme GP-UCB • Partie expérimentale: • Comparaison avec GP- UCB et ED • Influence de plusieurs maxima • Hypothése de régularité • Influence du bruit • Exemple en dimension 2
Aspect théorique Calcul de la moyenne, de la covariance et de la variance Où et et
Aspect théorique • Objectif : Trouver le maximum de fen l’évaluant le minimum de fois • Ce que l’on sait faire : Pour chaque x, calculer simplement et • Stratégie : Choisir soigneusement (grâce à une borne de confiance) le prochain x à évaluer
Aspect théorique x2 x1 x3 Le prochain x que l’on évaluera sera donc
Aspect théorique Algorithme • Initialisation : On dispose du GP Prior, selon lequel f est supposée être échantillonnée, et des valeurs aux bords f(0) et f(1). • Itérations : Tant que l’on est trop loin du maximum théorique, on calcule (soit par ED soit par GB-UCB) puis puis et
Aspect théorique Mais comment choisir ? cf. Théorème 1 de GaussianProcessOptimization in the Bandit Setting: No Regret and Experimental Design Soit et alors le regret cumulé est en
Expérimentations Lequel des 2 algorithmes choisir ? GP-UCB T = 8 T = 44 GP - Upper Confidence Bound (GP-UCB) Experimental Design (ED)
Expérimentations Quelle « régularité » pour f ? (avec GP-UCB) T = 8 T = 3 T = 6 T = 12 Fonction trop irrégulière : Ne converge pas !
Expérimentations Influence d’un bruit additif gaussien ? T = 18 T = 28 Plus d’évaluations Moins de précision
Expérimentations Choix de et influence de cette constante sur le nombre d’itérations T : / n ? Nombre d’évaluations de f en fonction de n
CONCLUSION • Intérêt : obtention du maximum • Rapidement • Précisément • Limites : • L’hypothèse fonction « régulière » est indispensable. • On n’a pas une idée « globale » de la fonction.