190 likes | 350 Views
Programmes de maîtrise et de doctorat en démographie Modèles de risque et de durée Cours 11 Séance du 18 avril 2014. Benoît Laplante, professeur. Plan. L’hétérogénéité non observée La vulnérabilité comme effet aléatoire L’événements renouvelable
E N D
Programmes de maîtrise et de doctorat en démographieModèles de risque et de duréeCours 11Séance du 18 avril 2014 Benoît Laplante, professeur
Plan L’hétérogénéité non observée • La vulnérabilité comme effet aléatoire L’événements renouvelable • La vulnérabilité partagée comme effets aléatoire
L’hétérogénéité non observée et la vulnérabilité Question : Imaginons un échantillon tiré d’une population dont la moitié des individus partagent une caractéristique qui les rend plus vulnérables au risque étudié. Imaginons que l’on ne dispose pas de la variable qui correspond à cette caractéristique. Comment les résultats de l’analyse sont-ils affectés?
L’hétérogénéité non observée et la vulnérabilité Réponse : Les individus les plus vulnérables changent d’état plus rapidement. La composition du groupe à risque change au fil du temps : il contient de moins en moins d’individus vulnérables. Le risque de base décroît donc au fil du temps.
L’hétérogénéité non observée et la vulnérabilité Dans les modèles de risque (ou de durée, ou de survie), la composante aléatoire représente l’évolution du risque au fil du temps net des effets des variables indépendantes. On lit souvent que dans ces modèles, la composante aléatoire peut être interprétée comme un terme d’erreur (cette interprétation est plus évidente ou plus claire dans les modèles de durée), mais qu’elle n’a pas — comme elle l’a dans la régression conventionnelle — la propriété de représenter ou capter les effets des variables indépendantes absentes.
L’hétérogénéité non observée et la vulnérabilité Ceci est sûrement vrai dans la mesure où la loi de probabilité qui représente l’évolution du risque au fil du temps ne représente pas la somme d’un nombre infini de tirages aléatoires indépendants régis par une loi de Bernouilli comme le fait la loi normale. Ceci peut prêter à confusion si on oublie que le rôle que la loi normale joue dans la régression conventionnelle ne permet d’obtenir des résultats sans biais que si l’équation n’omet aucune variable indépendante importante…
L’hétérogénéité non observée et la vulnérabilité Le modèle de vulnérabilité Le modèle à vulnérabilité ajoute à l’équation un élément aléatoire, régi par une loi de probabilité, qui « capte », dans le processus d’estimation, la part « régulière » de la variation de la variable dépendante qui n’est pas expliquée par les variables indépendantes.
L’hétérogénéité non observée et la vulnérabilité Le modèle de vulnérabilité On peut représenter comme suit la fonction de risque du modèle de vulnérabilité : et somme suit sa fonction de séjour :
L’hétérogénéité non observée et la vulnérabilité Le modèle de vulnérabilité La vulnérabilité constitue une « deuxième composante aléatoire » du modèle. Elle suit une loi de probabilité. En pratique, on lui fait suivre généralement • soit la loi Gamma: la dispersion de la vulnérabilité dans le groupe à risque demeure constante au fil du temps même si ce groupe devient plus homogène (si le problème de l’hétérogénéité non observée se pose). • Soit la loi de Wald: la dispersion de la vulnérabilité dans le groupe à risque diminue au fil du temps alors que ce groupe devient plus homogène (si le problème de l’hétérogénéité non observée se pose).
L’hétérogénéité non observée et la vulnérabilité Le modèle de vulnérabilité Avec Stata on ne peut utiliser le modèle de vulnérabilité qu’avec les modèles paramétriques. En pratique, la vulnérabilité ne présente d’intérêt que lorsqu’on l’utilise dans le modèle exponentiel par parties. On peut estimer un modèle équivalent en utilisant le modèle logistique ou le modèle de Poisson par parties à effet aléatoire.
L’événement renouvelable La typologie de Hosmer et Lemeshow Hosmer et Lemeshow proposent une typologie de l’étude des processus qui régissent les événements renouvelables qui repose sur trois critères . Le processus • utilise une seule « horloge » ou bien une « horloge » par rang; • utilise une seule fonction de risque de base ou bien une fonction de risque de base par rang; • répartit le risque en plusieurs épisodes ou le regroupe en un seul épisode.
Le’événement renouvelable La typologie de Hosmer et Lemeshow
Les événements renouvelables La typologie de Hosmer et Lemeshow La modélisation de l’événement renouvelable se ramène donc d’abord et avant à l’arrangement des données et l’écriture de l’équation En principe, ce travail se pratique avec tout modèle de risque ou de durée et les modèles s’estiment avec les procédures ordinaires des logiciels.
L’événement renouvelable Il reste cependant un problème Les épisodes vécus par le même individus sont corrélés. Problème d’estimation de la variance des estimations, même avec un échantillon aléatoire simple. Solution: estimateur de Huber-White.
L’événement renouvelable Il reste cependant encore un problème La source des différences entre les informations contenues dans les observations ne se limite pas à la différence entre les valeurs des variables indépendantes. Il est presque certain qu’il existe des similitudes entre les observations d’un individu et des différences entre les observations d’individus différents qui ne sont pas captées par les variables indépendantes. Il nous manque un terme d’erreur à estimer au niveau de l’individu.
L’événement renouvelable Les observations corrélées La vulnérabilité partagée : • le risque de chaque individu dépend vraisemblablement d’un ensemble de facteurs dont on cherchera à résumer les effets dans un terme d’erreur qui suit une loi de probabilité. On peut interpréter le modèle à vulnérabilité partagée comme un modèle à effet aléatoire ou un modèle multiniveau. Le modèle peut s’exprimer comme suit :
L’événement renouvelable La vulnérabilité partagée Avec Stata, s’estime avec le modèle semi-paramétrique de Cox et avec certains modèles paramétriques. Avec le modèle de Cox • l’estimation fait un usage intensif des dérivées numériques; • le processus est très long, voire impossible, avec les échantillons de la taille qu’on utilise habituellement en sciences sociales.. Beaucoup plus rapide à estimer avec les modèles paramétriques. En pratique, comme pour la vulnérabilité « simple », la vulnérabilité partagée ne présente d’intérêt que lorsqu’on l’utilise dans le modèle exponentiel par parties. Comme pour la vulnérabilité « simple », on peut estimer un modèle équivalent en utilisant le modèle logistique ou le modèle de Poisson par parties à effet aléatoire.