1 / 56

Exploitation des données

Symposium satellite SRLF 16 Janvier 2009: Dossier informatisé en réanimation: Pourquoi? Comment?. Exploitation des données. Jean-François TIMSIT Réanimation médicale CHU Grenoble Inserm U823. Exploitation des données. Pour quoi faire? Comment? Choix des variables? Qualité des données

sorena
Download Presentation

Exploitation des données

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Symposium satellite SRLF 16 Janvier 2009: Dossier informatisé en réanimation: Pourquoi? Comment? Exploitation des données Jean-François TIMSIT Réanimation médicale CHU Grenoble Inserm U823

  2. Exploitation des données • Pour quoi faire? • Comment? • Choix des variables? • Qualité des données • Exploitation statistique? • Par qui? • Base de données multicentriques? • Feedback? • Quels résultats? • Entrepôts de données en réanimation

  3. « des quantités de données disponibles… » Cliniciens Managers • On en a: • Informatisation de l’information • Base de données opérationnelles • Ne pas re-saisir ce qui est déjà saisi… • Liens entre les BDD • On en a besoin: • Dossiers, prescription informatisés • Actes, diagnostics, coûts • Tableau de bord, Infections nosocomiales • Recherche facteur pronostiques • Biomarqueurs, traitement individualisés Consommateurs Chercheurs

  4. Web Bases de connaissances PMSI Groupage Dossier hôpital Services externes Laboratoires Imagerie médicale Tutelles Outils de text Mining Calcul de score Aide à la décision Aide au codage CRH automatiques… Modèles pronostiques Outils de prédiction Et d’aide à la décision Dossier réanimation Monitoring Entrepôt de données (multicentrique) Tableau de bord Prescription Vigilances Unités d’hygiène Réanimation Epidémiologie Dénombrement Pharmacie Biomédical Recherche Hôpital

  5. XML Appareils biomédicaux (Respirateurs, dialyseurs, p.seringue …) Résultats Laboratoires HL7 , HPRIM Import documentaire XML SIH (identité patients) DMC (données patients) Prescriptions PDF,DOC,PNG,JPG … HL7 , HPRIM Outil client Export via requêtes Export documentaire HL7 , PDF Monitorage Philips Import thésaurus (actes, diagnostics,médicaments) PNG HL7 XML, API Import iconographique (courbes,ecg 12D) depuis IIC Philips, ou copier/coller

  6. Pratique clinique Probabilités de différents évènements dans différentes populations Processus décisionnel: docteurs, patients et familles Administration hospitalière Adaptation des besoins aux ressources Analyses epidémiologiques de sous groupe Grand nombre de patients BDD HauteQualité • Audit: locaux et nationaux • Localement: • Données précises, bien définies, comparaisons avec les autres • centres ayant un sens • à plus grande échelle: • Audit comparatifs entre hôpitaux, groupement etc.. Comparaisons ajustées Données sur les facteurs confondants connus Création d’indicateurs composites

  7. Biobanques- Biomarqueurs, protéomique, génomique • > 1000 « signaux » pour les bactéries • > 100 000 signaux pour l’homme COMPARAISONS MULTIPLES, erreurs de mesure (erreur de type 1 et de type 2) Signal 1 Signal 2.. Pat 1 Pat 2 Pat 3 Pat 4 Pat 5 Pat 6 Pat 7 Pat 8 Pat 9 Pat 10 Pat 11 Pat 12 …….. Signal 1 Signal 2 Signal 3 Signal 4 signal 5 Signal 6 Signal 7… Pat 1 Pat 2 Pat 3 Pat 4 Pat 5  Mutualisation des données, mondialisation, validations extérieures

  8. Validité externe des études randomisées?? • Mortalité du groupe contrôle

  9. Prowess: si on avait eu une base de données informatisée bien exploitée… • 1690 pts/ 11 pays/ 164 Rea!!!! • Un tout petit % des patients avec un sepsis sévère • Pas de contrôle de la prise en charge globale des patients Système expert (traitement homogène) Saisie automatique des données Tableau de bord automatisé de l’étude Groupe contrôle non randomisé Validité externe?

  10. BDD comme vecteurs d’études randomisées BDD Stimuler la réalisation d’études randomisées Prise de conscience des niveaux d’incertitude Cahier de saisie déjà en place Centres investigateurs plus larges  démocratisation de la recherche Généralisation des résultats des études randomisées Représentativité de la population Fort taux de participation à la saisie de données Panels larges d’hôpitaux  Encourage l’application des résultats dans la pratique

  11. Exploitation des données • Pour quoi faire? • Comment? • Choix des variables? • Qualité des données • Exploitation statistique? • Par qui? • Base de données multicentriques? • Feedback? • Quels résultats? • Entrepôts de données en réanimation

  12. Outil « client »: types de données « patient » disponibles Tests Notes et enregistrements Autres Prescriptions Résultats d’examens spécifiques Echo, colo, EEG etc…. Dossier, consultations, administration Médicaments Examens Consultation Évènements Projet thérapeutique Communication Recherche Données cliniques (constante) Soins Résultats biochimie et immunologie Données cliniques scores Classification, actes Résultats radiologiques Comment gérer? Principes de base Solution? Micro-biologie Administration de soins et de médicaments Données « machine »

  13. Définition Reproductibilité intra et inter-codeurs, Repro inter-centre? Poids de forme, d’entrée? Estimé? Mesuré? Avec quel balance? Quel hôpital? Heure vraie ou heure saisie dans l’UF? Classification utilisée?par qui? Comment?

  14. Paramètre avec une classification et un lexique unique sans synonymes (constantes, bio…) Valeur = Valeur vraie (unité et format fixe) + Variabilité mesure (machine, conditions de prélèvt) + Variabilité dans le temps (granularité limitée) + hasard Nouveaux examens Nouvelles préoccupations…

  15. Paramètre avec une classification et un lexique unique avec synonymes et/ou faux amis (I nosoc, iatrogénie, CIM10) Valeur = Valeur vraie (unité et format fixe) + Variabilité mesure (machine, conditions de prélèvt) + Variabilité clinique mesure (antibiothérapie, délai acheminement) Variabilité dans le temps (granularité limitée) + hasard Méthode de réalisation homogène Examens reproductibles?…

  16. Par qui? Avec quelle source? Pour quoi faire? Pour certains codes un libellé différent Quel thesaurus?

  17. Paramètre avec une classification et un lexique fixe mais un format variable entraînant une interprétation différente (radio, scopes…) Valeur = Valeur vraie (unité et format fixe) + Variabilité de précision (archivage)+ Variabilité mesure (machine) + Variabilité dans le temps (granularité limitée) + Variabilité d’interprétation (analyse d’images, reconnaissance de formes) + hasard Choix à priori (poids des données) Outils d’analyse de signal (CR semi-directif > libre Outils de text-mining)

  18. Saisie automatique ou manuelle? Quelle valeur? Toutes? Toutes les validées? À heure fixe? Granularité générale de la base de données? Quand?

  19. Traitement du signal

  20. Saisie électronique ou saisie manuelle (IMPACT) *: 2 digit and 4 digit granularity of the ICD 10 codes Cook SF et al – Crit Care Med 2002; 30:2765

  21. Paramètre textuel avec une classification et un lexique multiple et une sémantique complexe Valeur = Valeur vraie (unité et format fixe) + Variabilité de l’unité sémantique (archivage)+ Variabilité mesure (machine) + Variabilité dans le temps (granularité limitée) + Variabilité d’interprétation (inter-radiologues, intra-observateurs)+ Variabilité du reporting hasard CR semi-directif (lexique limité=structuré) > libre Outils de text-mining

  22. Texte structuré éventuellement requétable

  23. Outils de text-mining.. Projet CIREA E. Métais, D. Nakache et J.-F. Timsit. WSEAS Transactions on information scienc, 3(8): 1565-1572, 2006. Extraction automatique des codes CIM 10 à partir des comptes rendus d’hospitalisation

  24. Un environnement incertain Misset et al – Critical Care 2008, 12:R95

  25. Constitution du corpus et des bases de données • Nous avons recueilli environ 33 000 comptes rendus médicaux exploitables provenant de nombreux établissements hospitaliers en France. • Nous avons constitué une base de données de 543 418 mots, 100 882 concepts médicaux, 957 acronymes médicaux fréquents, 224 mots stop (antidictionnaire), 1445 préfixes et suffixes médicaux.

  26. EDA : étape 1 • transformation en minuscules, • séparation des caractères ligaturés ('cœur' devient 'coeur') et des traits d'unions, • suppression des signes diacritiques (exemple : accents 'dégénéré' devient 'degenere'), • suppression des doubles lettres, • remplacer 'ck', 'cqu', 'qu', et 'c' par 'k', et 'y' par 'i'. E. Métais, D. Nakache et J.-F. Timsit. WSEAS Transactions on information scienc, 3(8): 1565-1572, 2006.

  27. EDA : étape 2 • Constatant la structure sémantique très forte du langage naturel et la structure hiérarchique de la CIM10 par organes, nous avons choisi d’enrichir le compte rendu en fonction des préfixes, suffixes et affixes. E. Métais, D. Nakache et J.-F. Timsit. WSEAS Transactions on information scienc, 3(8): 1565-1572, 2006.

  28. Enrichir le compte rendu en fonction des préfixes, suffixes et affixes. E. Métais, D. Nakache et J.-F. Timsit. WSEAS Transactions on information scienc, 3(8): 1565-1572, 2006.

  29. Approche textmining CIREA Concept 1 Concept 2 … Concept i Document 1 Document 2 …. Document j Classe 1 Classe 2 …. Classe k Modèle Cirea : Un document = plusieurs classes et plusieurs concepts. L’enjeu devient de trouver un lien direct entre concepts et classes E. Métais, D. Nakache et J.-F. Timsit. WSEAS Transactions on information scienc, 3(8): 1565-1572, 2006.

  30. Copie écran CIREA E. Métais, D. Nakache et J.-F. Timsit. WSEAS Transactions on information scienc, 3(8): 1565-1572, 2006.

  31. Mesure du critère de jugement Précis Reproductible Reflet de ce que l’on veut mesurer ..des paroles en l’air?….

  32. Nouveau traitement prévenant l’ILC « True » 0R=0.49, p=0.000045 Sp=p[T+]/[D+]= 100% Se=p[T-]/[D-]= 100% True rate of CRI: 5% RR=2 Qu’st ce qui arrive si le critère de jugement n’est pas parfait?

  33. =True CRI * Se + True no CRI*(1-Sp) =50*1 + 950*0.1=145!!!! Estimated effect of a new treatment 145 Sp=p[T+]/[D+]= 90% Se=p[T-]/[D-]= 100% True rate of CRI: 5% RR=2 « True » 0R=2.05, p=0.000045

  34. Estimated effect of a new treatment Estimated 0R=0.82, P value= 0.051 Sp=p[T+]/[D+]= 90% Se=p[T-]/[D-]= 100% True rate of CRI: 5% RR=2 « True » 0R=0.49, p=0.000045

  35. Measurement errors • If the prevalence of the event is low, you need a very specific test to avoid measurement error of the treatment effect • If the prevalence is high, you need a very sensitive one….

  36. Hiérarchie des données Pays (ressource % PIB, remboursements…) Région (SROS, nb lits/habitant, géographie, climat) Ville (Taille….) Hôpital (taille , vocation, CHU, chu, PSPH, Privé… Réanimation (med, chir, poly, ped, neonat, USC, USI, nb lits, personnel, matériel….) Patients

  37. Exploitation des données • Pour quoi faire? • Comment? • Choix des variables? • Qualité des données • Exploitation statistique? • Par qui? • Base de données multicentriques? • Feedback? • Quels résultats? • Entrepôts de données en réanimation

  38. BDD est vivante Historisation des données, des variables • Variation du nombre de centres • Variation du nombre de variables • Obsession permanente de maintien de la qualité des données • Communication avec les centres • Site internet: FAQ, Forums, e-learning • Réunions investigateurs périodiques • Réponses aux demandes • Bulletin d’information • Comité de pilotage • Politique: gestion financière, sécurité • Technique: • informatique, sauvegarde, sécurité • Biostatistique: méthodologie, analyse, écriture Audit, évolutivité

  39. BDD…peut-on tout faire? • Attention à l’esprit de la BDD • BDD orientée recherche ou recherche sur BDD… • Objectif initial • Dans quel(s) objectif (s), les variables sont elles colligées? Administratif, PMSI, pharmacie… • Pour quel type de variables ou Pour quelle utilisation l’énergie dépensée est elle maximale?… (performance, coût, infections nosocomiales, événements indésirables, prédiction pronostique)

  40. Attention aux limites!!: • Difficulté à saisir des évènements ou des facteurs de risques rares • Sensibilisation excessive à la saisie de certaines variables (PMSI, SMR, ASA, NNIS etc…)

  41. La BDD de Haute qualité: est coût-efficace mais est coûteuse Coût relativement bas Les systèmes de saisie sont déjà en place Les coûts sont répartis sur plusieurs études et partagés avec d’autres applications: (pratique clinique, management, audit) Qui paye? Pratique clinique: hôpital, CNAM Recherche: Médicale: public, privée (propriété des données, confidentialité) Informatique: entrepôt de données !! Le financeur peut modifier l’objectif de la BDD

  42. Faut il augmenter la taille des bases de données? • Augmentation de la puissance • Augmentation de la représentativité? • Augmentation de l’exhaustivité • Mais • Augmentation du nombre de codeurs • Augmentation du nombre de personnes non directement impliqué dans la BDD • Augmentation de la variabilité des définitions • Augmentation des coûts

  43. Exploitation des données • Pour quoi faire? • Comment? • Choix des variables? • Qualité des données • Exploitation statistique? • Par qui? • Base de données multicentriques? • Feedback? • Quels résultats? • Entrepôts de données en réanimation

  44. Systèmes experts Patient data management system A knowledge acquisition tool Création d’une requête Nom de la requête, auteur Type de requête: intermédiaire ou rappel Validation: test ou production Explications (ref, documents) Message Expression: IF digoxine AND potassium<3 mMol/l THEN  «  » À partir d’une ontologie et d’un lexique (classification ordonnée) Expert system Vérification sémantique, erreurs logiques, conflits avec d’autres requêtes Test rétrospectif sur patients préalables Classification des rappels par un expert: correct, incorrect, NSP Outils de compilation de cette classification Transcodage de la requête (si besoin) Requete approuvée par tous les utilisateur  installation dans le PDMS

  45. Systèmes experts Bonne acceptation par les utilisateurs de l’éditeur de connaissance et du système de rappel 58 guidelines créés Test sur 803 séjours 31: aucune alarme 27: au moins une  406 rappels 356 (88%) alarmes vraies 50 (12%) fausse : requête trop générique Aucune requête stupide De Clercq et al – J Clin Monitor 1999; 109-117

  46. Systèmes experts • Appropriation de l’outil par l’équipe • Collaboration de l’équipe • Système d’aide à la décison ne nécessitant pas de saisir des données particulières • Mais •  Utilisant les données déjà saisies (alarmes critiques) • Nécessite donc une saisie en temps réel • Alarmes trop fréquentes • Ralentissement du système De Clercq et al – J Clin Monitor 1999; 109-117

  47. Outils d’aide à la décision Revue systématique: 100 études D’autant plus efficace que: Outils s’activant automatiquement (73% vs 47%) Utilisateur=développeur (74% vs 28%) Garg et al – JAMA 2005; 293: 1223

  48. Reporting journalier automatique pour l’amélioration de la qualité des soins • Utilisation d’une requête sur base de données pour diffusion journalière des indicateurs de processus en réa: • Outil de reporting journalier avec • Prophylaxie MTE • Prophylaxie H dig • Épreuve de sevrage • ½ assis 30° • Contrôle glycémique si une valeur de glycémie > 1.5 g/l Coût = 0 mais pas d’archivage informatique des données… Wall et al - Surgery 2006;140:684-90.)

More Related