570 likes | 691 Views
Symposium satellite SRLF 16 Janvier 2009: Dossier informatisé en réanimation: Pourquoi? Comment?. Exploitation des données. Jean-François TIMSIT Réanimation médicale CHU Grenoble Inserm U823. Exploitation des données. Pour quoi faire? Comment? Choix des variables? Qualité des données
E N D
Symposium satellite SRLF 16 Janvier 2009: Dossier informatisé en réanimation: Pourquoi? Comment? Exploitation des données Jean-François TIMSIT Réanimation médicale CHU Grenoble Inserm U823
Exploitation des données • Pour quoi faire? • Comment? • Choix des variables? • Qualité des données • Exploitation statistique? • Par qui? • Base de données multicentriques? • Feedback? • Quels résultats? • Entrepôts de données en réanimation
« des quantités de données disponibles… » Cliniciens Managers • On en a: • Informatisation de l’information • Base de données opérationnelles • Ne pas re-saisir ce qui est déjà saisi… • Liens entre les BDD • On en a besoin: • Dossiers, prescription informatisés • Actes, diagnostics, coûts • Tableau de bord, Infections nosocomiales • Recherche facteur pronostiques • Biomarqueurs, traitement individualisés Consommateurs Chercheurs
Web Bases de connaissances PMSI Groupage Dossier hôpital Services externes Laboratoires Imagerie médicale Tutelles Outils de text Mining Calcul de score Aide à la décision Aide au codage CRH automatiques… Modèles pronostiques Outils de prédiction Et d’aide à la décision Dossier réanimation Monitoring Entrepôt de données (multicentrique) Tableau de bord Prescription Vigilances Unités d’hygiène Réanimation Epidémiologie Dénombrement Pharmacie Biomédical Recherche Hôpital
XML Appareils biomédicaux (Respirateurs, dialyseurs, p.seringue …) Résultats Laboratoires HL7 , HPRIM Import documentaire XML SIH (identité patients) DMC (données patients) Prescriptions PDF,DOC,PNG,JPG … HL7 , HPRIM Outil client Export via requêtes Export documentaire HL7 , PDF Monitorage Philips Import thésaurus (actes, diagnostics,médicaments) PNG HL7 XML, API Import iconographique (courbes,ecg 12D) depuis IIC Philips, ou copier/coller
Pratique clinique Probabilités de différents évènements dans différentes populations Processus décisionnel: docteurs, patients et familles Administration hospitalière Adaptation des besoins aux ressources Analyses epidémiologiques de sous groupe Grand nombre de patients BDD HauteQualité • Audit: locaux et nationaux • Localement: • Données précises, bien définies, comparaisons avec les autres • centres ayant un sens • à plus grande échelle: • Audit comparatifs entre hôpitaux, groupement etc.. Comparaisons ajustées Données sur les facteurs confondants connus Création d’indicateurs composites
Biobanques- Biomarqueurs, protéomique, génomique • > 1000 « signaux » pour les bactéries • > 100 000 signaux pour l’homme COMPARAISONS MULTIPLES, erreurs de mesure (erreur de type 1 et de type 2) Signal 1 Signal 2.. Pat 1 Pat 2 Pat 3 Pat 4 Pat 5 Pat 6 Pat 7 Pat 8 Pat 9 Pat 10 Pat 11 Pat 12 …….. Signal 1 Signal 2 Signal 3 Signal 4 signal 5 Signal 6 Signal 7… Pat 1 Pat 2 Pat 3 Pat 4 Pat 5 Mutualisation des données, mondialisation, validations extérieures
Validité externe des études randomisées?? • Mortalité du groupe contrôle
Prowess: si on avait eu une base de données informatisée bien exploitée… • 1690 pts/ 11 pays/ 164 Rea!!!! • Un tout petit % des patients avec un sepsis sévère • Pas de contrôle de la prise en charge globale des patients Système expert (traitement homogène) Saisie automatique des données Tableau de bord automatisé de l’étude Groupe contrôle non randomisé Validité externe?
BDD comme vecteurs d’études randomisées BDD Stimuler la réalisation d’études randomisées Prise de conscience des niveaux d’incertitude Cahier de saisie déjà en place Centres investigateurs plus larges démocratisation de la recherche Généralisation des résultats des études randomisées Représentativité de la population Fort taux de participation à la saisie de données Panels larges d’hôpitaux Encourage l’application des résultats dans la pratique
Exploitation des données • Pour quoi faire? • Comment? • Choix des variables? • Qualité des données • Exploitation statistique? • Par qui? • Base de données multicentriques? • Feedback? • Quels résultats? • Entrepôts de données en réanimation
Outil « client »: types de données « patient » disponibles Tests Notes et enregistrements Autres Prescriptions Résultats d’examens spécifiques Echo, colo, EEG etc…. Dossier, consultations, administration Médicaments Examens Consultation Évènements Projet thérapeutique Communication Recherche Données cliniques (constante) Soins Résultats biochimie et immunologie Données cliniques scores Classification, actes Résultats radiologiques Comment gérer? Principes de base Solution? Micro-biologie Administration de soins et de médicaments Données « machine »
Définition Reproductibilité intra et inter-codeurs, Repro inter-centre? Poids de forme, d’entrée? Estimé? Mesuré? Avec quel balance? Quel hôpital? Heure vraie ou heure saisie dans l’UF? Classification utilisée?par qui? Comment?
Paramètre avec une classification et un lexique unique sans synonymes (constantes, bio…) Valeur = Valeur vraie (unité et format fixe) + Variabilité mesure (machine, conditions de prélèvt) + Variabilité dans le temps (granularité limitée) + hasard Nouveaux examens Nouvelles préoccupations…
Paramètre avec une classification et un lexique unique avec synonymes et/ou faux amis (I nosoc, iatrogénie, CIM10) Valeur = Valeur vraie (unité et format fixe) + Variabilité mesure (machine, conditions de prélèvt) + Variabilité clinique mesure (antibiothérapie, délai acheminement) Variabilité dans le temps (granularité limitée) + hasard Méthode de réalisation homogène Examens reproductibles?…
Par qui? Avec quelle source? Pour quoi faire? Pour certains codes un libellé différent Quel thesaurus?
Paramètre avec une classification et un lexique fixe mais un format variable entraînant une interprétation différente (radio, scopes…) Valeur = Valeur vraie (unité et format fixe) + Variabilité de précision (archivage)+ Variabilité mesure (machine) + Variabilité dans le temps (granularité limitée) + Variabilité d’interprétation (analyse d’images, reconnaissance de formes) + hasard Choix à priori (poids des données) Outils d’analyse de signal (CR semi-directif > libre Outils de text-mining)
Saisie automatique ou manuelle? Quelle valeur? Toutes? Toutes les validées? À heure fixe? Granularité générale de la base de données? Quand?
Saisie électronique ou saisie manuelle (IMPACT) *: 2 digit and 4 digit granularity of the ICD 10 codes Cook SF et al – Crit Care Med 2002; 30:2765
Paramètre textuel avec une classification et un lexique multiple et une sémantique complexe Valeur = Valeur vraie (unité et format fixe) + Variabilité de l’unité sémantique (archivage)+ Variabilité mesure (machine) + Variabilité dans le temps (granularité limitée) + Variabilité d’interprétation (inter-radiologues, intra-observateurs)+ Variabilité du reporting hasard CR semi-directif (lexique limité=structuré) > libre Outils de text-mining
Outils de text-mining.. Projet CIREA E. Métais, D. Nakache et J.-F. Timsit. WSEAS Transactions on information scienc, 3(8): 1565-1572, 2006. Extraction automatique des codes CIM 10 à partir des comptes rendus d’hospitalisation
Un environnement incertain Misset et al – Critical Care 2008, 12:R95
Constitution du corpus et des bases de données • Nous avons recueilli environ 33 000 comptes rendus médicaux exploitables provenant de nombreux établissements hospitaliers en France. • Nous avons constitué une base de données de 543 418 mots, 100 882 concepts médicaux, 957 acronymes médicaux fréquents, 224 mots stop (antidictionnaire), 1445 préfixes et suffixes médicaux.
EDA : étape 1 • transformation en minuscules, • séparation des caractères ligaturés ('cœur' devient 'coeur') et des traits d'unions, • suppression des signes diacritiques (exemple : accents 'dégénéré' devient 'degenere'), • suppression des doubles lettres, • remplacer 'ck', 'cqu', 'qu', et 'c' par 'k', et 'y' par 'i'. E. Métais, D. Nakache et J.-F. Timsit. WSEAS Transactions on information scienc, 3(8): 1565-1572, 2006.
EDA : étape 2 • Constatant la structure sémantique très forte du langage naturel et la structure hiérarchique de la CIM10 par organes, nous avons choisi d’enrichir le compte rendu en fonction des préfixes, suffixes et affixes. E. Métais, D. Nakache et J.-F. Timsit. WSEAS Transactions on information scienc, 3(8): 1565-1572, 2006.
Enrichir le compte rendu en fonction des préfixes, suffixes et affixes. E. Métais, D. Nakache et J.-F. Timsit. WSEAS Transactions on information scienc, 3(8): 1565-1572, 2006.
Approche textmining CIREA Concept 1 Concept 2 … Concept i Document 1 Document 2 …. Document j Classe 1 Classe 2 …. Classe k Modèle Cirea : Un document = plusieurs classes et plusieurs concepts. L’enjeu devient de trouver un lien direct entre concepts et classes E. Métais, D. Nakache et J.-F. Timsit. WSEAS Transactions on information scienc, 3(8): 1565-1572, 2006.
Copie écran CIREA E. Métais, D. Nakache et J.-F. Timsit. WSEAS Transactions on information scienc, 3(8): 1565-1572, 2006.
Mesure du critère de jugement Précis Reproductible Reflet de ce que l’on veut mesurer ..des paroles en l’air?….
Nouveau traitement prévenant l’ILC « True » 0R=0.49, p=0.000045 Sp=p[T+]/[D+]= 100% Se=p[T-]/[D-]= 100% True rate of CRI: 5% RR=2 Qu’st ce qui arrive si le critère de jugement n’est pas parfait?
=True CRI * Se + True no CRI*(1-Sp) =50*1 + 950*0.1=145!!!! Estimated effect of a new treatment 145 Sp=p[T+]/[D+]= 90% Se=p[T-]/[D-]= 100% True rate of CRI: 5% RR=2 « True » 0R=2.05, p=0.000045
Estimated effect of a new treatment Estimated 0R=0.82, P value= 0.051 Sp=p[T+]/[D+]= 90% Se=p[T-]/[D-]= 100% True rate of CRI: 5% RR=2 « True » 0R=0.49, p=0.000045
Measurement errors • If the prevalence of the event is low, you need a very specific test to avoid measurement error of the treatment effect • If the prevalence is high, you need a very sensitive one….
Hiérarchie des données Pays (ressource % PIB, remboursements…) Région (SROS, nb lits/habitant, géographie, climat) Ville (Taille….) Hôpital (taille , vocation, CHU, chu, PSPH, Privé… Réanimation (med, chir, poly, ped, neonat, USC, USI, nb lits, personnel, matériel….) Patients
Exploitation des données • Pour quoi faire? • Comment? • Choix des variables? • Qualité des données • Exploitation statistique? • Par qui? • Base de données multicentriques? • Feedback? • Quels résultats? • Entrepôts de données en réanimation
BDD est vivante Historisation des données, des variables • Variation du nombre de centres • Variation du nombre de variables • Obsession permanente de maintien de la qualité des données • Communication avec les centres • Site internet: FAQ, Forums, e-learning • Réunions investigateurs périodiques • Réponses aux demandes • Bulletin d’information • Comité de pilotage • Politique: gestion financière, sécurité • Technique: • informatique, sauvegarde, sécurité • Biostatistique: méthodologie, analyse, écriture Audit, évolutivité
BDD…peut-on tout faire? • Attention à l’esprit de la BDD • BDD orientée recherche ou recherche sur BDD… • Objectif initial • Dans quel(s) objectif (s), les variables sont elles colligées? Administratif, PMSI, pharmacie… • Pour quel type de variables ou Pour quelle utilisation l’énergie dépensée est elle maximale?… (performance, coût, infections nosocomiales, événements indésirables, prédiction pronostique)
Attention aux limites!!: • Difficulté à saisir des évènements ou des facteurs de risques rares • Sensibilisation excessive à la saisie de certaines variables (PMSI, SMR, ASA, NNIS etc…)
La BDD de Haute qualité: est coût-efficace mais est coûteuse Coût relativement bas Les systèmes de saisie sont déjà en place Les coûts sont répartis sur plusieurs études et partagés avec d’autres applications: (pratique clinique, management, audit) Qui paye? Pratique clinique: hôpital, CNAM Recherche: Médicale: public, privée (propriété des données, confidentialité) Informatique: entrepôt de données !! Le financeur peut modifier l’objectif de la BDD
Faut il augmenter la taille des bases de données? • Augmentation de la puissance • Augmentation de la représentativité? • Augmentation de l’exhaustivité • Mais • Augmentation du nombre de codeurs • Augmentation du nombre de personnes non directement impliqué dans la BDD • Augmentation de la variabilité des définitions • Augmentation des coûts
Exploitation des données • Pour quoi faire? • Comment? • Choix des variables? • Qualité des données • Exploitation statistique? • Par qui? • Base de données multicentriques? • Feedback? • Quels résultats? • Entrepôts de données en réanimation
Systèmes experts Patient data management system A knowledge acquisition tool Création d’une requête Nom de la requête, auteur Type de requête: intermédiaire ou rappel Validation: test ou production Explications (ref, documents) Message Expression: IF digoxine AND potassium<3 mMol/l THEN « » À partir d’une ontologie et d’un lexique (classification ordonnée) Expert system Vérification sémantique, erreurs logiques, conflits avec d’autres requêtes Test rétrospectif sur patients préalables Classification des rappels par un expert: correct, incorrect, NSP Outils de compilation de cette classification Transcodage de la requête (si besoin) Requete approuvée par tous les utilisateur installation dans le PDMS
Systèmes experts Bonne acceptation par les utilisateurs de l’éditeur de connaissance et du système de rappel 58 guidelines créés Test sur 803 séjours 31: aucune alarme 27: au moins une 406 rappels 356 (88%) alarmes vraies 50 (12%) fausse : requête trop générique Aucune requête stupide De Clercq et al – J Clin Monitor 1999; 109-117
Systèmes experts • Appropriation de l’outil par l’équipe • Collaboration de l’équipe • Système d’aide à la décison ne nécessitant pas de saisir des données particulières • Mais • Utilisant les données déjà saisies (alarmes critiques) • Nécessite donc une saisie en temps réel • Alarmes trop fréquentes • Ralentissement du système De Clercq et al – J Clin Monitor 1999; 109-117
Outils d’aide à la décision Revue systématique: 100 études D’autant plus efficace que: Outils s’activant automatiquement (73% vs 47%) Utilisateur=développeur (74% vs 28%) Garg et al – JAMA 2005; 293: 1223
Reporting journalier automatique pour l’amélioration de la qualité des soins • Utilisation d’une requête sur base de données pour diffusion journalière des indicateurs de processus en réa: • Outil de reporting journalier avec • Prophylaxie MTE • Prophylaxie H dig • Épreuve de sevrage • ½ assis 30° • Contrôle glycémique si une valeur de glycémie > 1.5 g/l Coût = 0 mais pas d’archivage informatique des données… Wall et al - Surgery 2006;140:684-90.)