1 / 17

Régression segmentée pour l’analyse de données longitudinales interrompues

Régression segmentée pour l’analyse de données longitudinales interrompues. Aurélien VESIN – U823 – Equipe 11 : « Epidémiologie des cancers et affections graves ». Introduction. Comment mesurer l’effet d’un ou plusieurs évènements sur une série de mesures répétées dans le temps :

matty
Download Presentation

Régression segmentée pour l’analyse de données longitudinales interrompues

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Régression segmentée pour l’analyse de données longitudinales interrompues Aurélien VESIN – U823 – Equipe 11 : « Epidémiologie des cancers et affections graves »

  2. Introduction • Comment mesurer l’effet d’un ou plusieurs évènements sur une série de mesures répétées dans le temps : • …Si en plus il n’est pas possible d’avoir un groupe contrôle en parallèle (pour raisons éthiques, financières ou autres) • Effet de la mise en vente du vaccin pour la prévention du cancer du col de l’utérus sur l’incidence des dépistages de ces cancers • Effet de l’attentat du World Trade Center sur l’indice du Dow Jones • L’évènement peut être : • Intervention volontaire (ex : campagne de prévention) • Imprévu (ex : un attentat) • La variable d’intérêt peut être quantitative : • Continue (ex : Taux d’infections) • Discrète (ex : Nombre de naissances) • La variable d’intérêt doit être mesurée à intervalles réguliers dans le temps

  3. Concepts • Série chronologique : Séquence de valeurs d’une mesure particulière prise à intervalle réguliers dans le temps Taux d’infections nosoc. Temps

  4. Concepts • Segment : Portion de série chronologique. Les segments sont reliés aux points de transitions («Change points») Taux d’infections nosoc. Temps

  5. Concepts • Points de transitions : Point spécifiques où les valeurs montrent des changements de comportement liés à des évènements précis (intervention…) Campagne nationale de prévention des infections nosocomiales Taux d’infections nosoc. Temps

  6. Concepts • Chaque segment est défini par : • Le niveau (level, baseline) • Une tendance (trend) • Le principe de la régression segmentée est de mesurer les changements de niveau et de tendance qui suivent une intervention Intervention

  7. Organisation des données • Collectées à intervalles réguliers (ex: toutes les années, mois, semaines…) • Dans le cas de données orientées Patient (1 observation = 1 patient), il est nécessaire d’agréger en données orientées Temps (1 observation = 1 mois) • Ex : Age du patient p  Age moyen des patients dans la semaine s • La variable d’intérêt (Outcome) peut être une moyenne, un taux, une proportion… • Un nombre suffisant d’observations « contrôles » cad avant l’intervention (et entre les interventions)

  8. Régression segmentée standard • Modèle de régression linéaire • /!\ Fait l’hypothèse d’un lien linéaire entre le temps et la variable d’intérêt dans chaque segment • Considérons 1 seule intervention • Le modèle s’écrit sous la forme :

  9. Régression segmentée standard Yt β2 = Variation immédiate suivant l’intervention β3 = Variation de la tendance β1 après intervention β1 = Variation de Y pour 1 unité de temps β0 = Niveau initial t

  10. Exemple Intervention à t = 15

  11. Exemple procreg data=reg; model yt = t intervention t2; run; C’est beau !

  12. Améliorations possibles : Auto-corrélation • Le modèle de régression fait une hypothèse d’indépendance entre les observations ! • Peu réaliste pour des données longitudinales • Sous estime les écarts types  Sur estime la significativité des estimateurs • Comment le vérifier ? • Représenter graphiquement les résidus Vs le temps, une tendance suggère une autocorrélation • Calculer la statistique de Durbin-Watson pour tester la présence d’autocorrélation (sous SAS proc autoreg) • Comment y remédier ? • Estimer le paramètre d’autocorrélation et l’introduire dans le modèle si nécessaire • Il est possible de corriger pour des autocorrélations saisonnières

  13. Autres améliorations possibles • La variable d’intérêt peut être influencée par des facteurs autres que l’intervention et le temps • Ex : Nombre d’interventions chirurgicales est lié au taux d’ infections nosocomiales • On peut introduire des co-variables d’ajustement • Possibilité de faire des analyses stratifiées en sous groupes • Possibilité d’introduire plusieurs interventions

  14. Etapes de développement d’un modèle de régression segmentée (Suggestions) • Observer graphiquement les données • Construire un modèle complet • Supprimer les variables non significatives • Ajouter les variables d’ajustement • Tester autocorrélation et ajouter un terme si besoin • Vérifier autres points de contrôles spécifiques au modèle (résidus, normalité…)

  15. Conclusion • Avantages • Quand il est impossible d’avoir un groupe contrôle en parallèle • Simple à mettre en place • Méthodologie et résultats intelligibles • Coefficients = variation immédiate et dans le temps • Obtention d’intervalles de confiance pour les variations associées aux interventions • Présentation sous forme graphique • Facilement extensible : • Plusieurs interventions possibles • Prise en compte saisonnalité, auto corrélation, ajustements • Transformation de variables en cas de non linéarité ou non normalité

  16. Inconvénients • Inconvénients : • Contraintes liées aux hypothèses du modèle : • Relation linéaire entre le temps et la variable d’intérêt • Normalité • Agrège les données patients en données temps • Perte d’information (précision) • Ne permet pas d’ajuster par des variables orientées patient mais des variables agrégées • Nombre d’observation conseillé  min .10 obs par variables rentrées dans le modèle • Alternative : Modèles ARIMA

  17. Bibliographie • A.K Wagner and al. ; « Segmented regression analysis of interrupted time series studies in medication use research » ; Journal of clinical Pharmacy an Therapeutics (2002) 27,299-309 • Weinberg and al. ; « Reducing infections among women undergoing cesarean section in columbia by means of continuous quality improvment methods » ; Arch Intern Med (2001) 161, 2357-2365 • Ansari and al. ; « Outcomes of an intervention to improve hospital antibiotic prescribing : Interrupted time series with segmented regression analysis » ; Journal of antimicrobial chemotherapy (2003) 52, 842-848 • Morgan and al. ; « Interrupted time-series analysis of regulations to reduce paracetamol (acetainophen) poisoning » ; PLOS medicine (2007) 4, 654-659 • Shardell and al. ; « Statistical analysis and application of Quasi Experiments to antimicrobial resistance intervention Studies » ; Antimicrobial resistance (2007) 45, 901-907

More Related