580 likes | 1.18k Views
Les approches statistiques pour la qualité. F. KOHLER SPI-EAO – Fac. Médecine - UHP Nancy k ohler@spieao.u-nancy.fr. Typologie des outils. Avec les normes ISO 9000 les méthodes statistiques sont utilisées pour maîtriser la qualité : Analyse descriptives des données Diagramme et graphiques
E N D
Les approches statistiques pour la qualité F. KOHLER SPI-EAO – Fac. Médecine - UHP Nancy kohler@spieao.u-nancy.fr
Typologie des outils • Avec les normes ISO 9000 les méthodes statistiques sont utilisées pour maîtriser la qualité : • Analyse descriptives des données • Diagramme et graphiques • Modèles probabilistes et plans d’échantillonnage • Tests d’hypothèses • Cartes de contrôles • Plans d’expérience et analyse multivariée
Outils de représentations • Pareto –ABC • Diagramme des causes effets (Ishikawa) • Graphes, Feuilles de relevé, Histogrammes • Représentation de 2 variables quantitatives • Carte de contrôle
Pareto • Lors d’une enquête sur la qualité du dossier patient on a repéré les éléments suivants :
Pareto • 1) Trié le tableau par ordre décroissant de problème • 2) Calcul du % par rapport aux anomalies
Pareto 3) Calcul des pourcentages cumulés 4) Représentation graphique
Démarche pour élaborer un diagramme de Pareto • Identifier la situation problématique • Élaborer une typologie des anomalies • Préciser la période de collecte des données et les modalité de collecte • Dépouiller les données • Procéder au traçage • Par exemple en utilisant excel
Diagramme d’Ishikawa • Diagramme dit de cause effet • Élaboré à partir de discussion de groupe de travail sur un problème de qualité • Permet d’identifier les causes possibles d’une situation de non qualité • Ces causes sont habituellement regroupées en 5 catégories • Milieu • Main d’œuvre • Matériaux • Machine • Méthodes • Ce n’est pas une méthode statistique
Logigrame • C’est un diagramme de procédé qui permet de suivre le cheminement des opérations en identifiant les points de décision et de contrôle. • Ce n’est pas une méthode statistique
Graphique de tendance • Permettent de résumer l’évolution temporelle d’un phénomène • Exemple :
Histogramme • Concerne les variables quantitatives. • Permet d’un seul coup d’œil de connaître l’allure de la distribution des valeurs observées : concentration ou étalement des données, valeurs « suspectes »…. • A ce titre il est intéressant pour : • Vérifier le réglage d’une machine • Vérifier la conformité d’une production selon les spécification (capabilité) • Valider les mesures correctives • …. • Réalisation • Distribution mise en classes • C’est une succession de rectangle ayant comme base les bornes des classes et comme hauteur la densité de classe (effectif / (Borne sup. – Borne Inf. de la classe)
90 80 70 60 50 40 30 20 10 0 Histogramme : exemple Classe ni Densité (*10)[140-160[ 10 5[160-165[ 20 40[165-170[ 30 60[170-175[ 45 90[175-180[ 40 80[180-185[ 35 70[185-190[ 15 30[190-200[ 5 5 140 160 170 180 190 200 © SPI-EAO Faculté de médecine de Nancy 24
Étude de la distribution • L’histogramme permet de représenter les distribution • Les paramètres statistiques permettent de résumer les distributions • Tendance centrale • Moyenne • Médiane • Mode • Position • Quantile • Quartile • Percentile • Dispersion • Étendue • Écart type • Coefficient de variation • Application au repérage des valeurs suspectes
Représentation des distributions • Lois connues : • Loi Normale • Loi Log Normale • Loi de Poisson • … • Permettent de préciser les probabilités de trouver des valeurs dans certains intervalles. • Décision • Pour déterminer si des valeurs sont aberrantes : • On utilise les probabilités en se fixant un risque • On utilise la règle de Tukey : Une donnée peut être appelée valeur aberrante si elle s’écarte d’au moins 1,5 * (Q3-Q1) au dessus du troisième quartile ou en dessous du premier quartile.
Valeurs aberrantes • Théorème de Lapalce_Liapounoff • Les erreurs de mesures sont pour une grandeur donnée et une méthode de mesure répartie suivant une loi normale ou log normale (ce qui revient à une loi normale par changement de variable). • 95% des résultats sont contenus dans 4s • 99,8 % sont contenus dans 6s • Si le nombre de mesure est très grand on doit s’attendre à observer des résultats très éloignés de la moyenne. Ils n’ont qu’une faible probabilité mais font partie de la distribution. • D’autre part des erreurs accidentelles grossières peuvent se produire (un nombre est recopié à la place d’un autre…) dans ce cas le résultat n’appartient pas à la distribution. • Dans une étude, on pourra se demander si les résultats les plus petits ou les plus grands ne sont pas des valeurs aberrantes. Des test statistiques permettent de vérifier si la probabilité d’obtenir un résultat plus grand que xn est inférieure à a. Cependant cela ne doit pas empêcher de réaliser une enquête préalable avant de rejeter ce résultat.
Vérifications préalables • Quel que soit le test statistique, il suppose toujours que x1, x2,… xn sont prélevé au hasard.Avant d’appliquer un test de recherche de valeurs aberrantes, il faut s’assurer qu’il n’y a pas de variation systématique du résultat en fonction de son indice. • Exemple : pour vérifier l’homogénéité d’une production de cathéter on dose un élément déterminé dans 20 échantillons prélevés à la suite le long d’une génératrice. Les résultats classés par ordre d’obtention le long du cathéter sont les suivant : La médiane est de 70. Le test des suite permet de distinguer 2 catégories : les résultats inférieures à la médiane et ceux supérieurs. Tout groupe de résultats consécutifs faisant partie d’une même catégorie constitue une suite. S’il y a une fluctuation lente le nombre de suite R est trop faible par contre R sera anormalement grand s’il y a des fluctuation périodiques rapide. Une table donne les limites inférieures et supérieures de R dans le cas d’une variation aléatoire au niveau de probabilité de 95% et 99% (risque de 5 et 1%). Si R < Ra il y dérive ou groupement de valeurs anormales. Si R > Ra, il y fluctuations rapides.
Table de R n1 et n2 sont les effectif de part et d’autre de la médiane. Par exemple pour n1=n2=10 on a les limites 7- 15 pour un risque de part et d’autre de 5%.
Conclusion : • Dans les résultats précédents on a 9 suites. • C’est à l’intérieur des limites, il n’y a pas de variation systématique • On peut rechercher si 125 est une valeur aberrante par le calcul de la probabilité d’observer une telle valeur ou par la règle de Tukey. • Remarque ; ce ne serait pas le cas si l’on avait observé les mêmes valeurs dans l’ordre : 58-61-62-64-65-70-72-78-78-89-125-85-83-71-72-65-60-60-58-54 : R = 3
Représentation des distributions • Loi quelconque : • Inégalité de Bienaymé - Tchebychev • Propriété de l'écart type qui permet de donner une interprétation générale • Quel que soit la distribution de la variable X de moyenne m et d'écart type s, et quelle que soit la quantité positive k, on démontre que la probabilité d'être à l'extérieur de l'intervalle m + k * s est inférieur à 1/k2. • Ainsi, il y a au plus 25% des individus qui ont des valeurs supérieures à la moyenne + 2 écarts type ou inférieures à la moyenne - 2 écarts type et donc au moins 75% à l’intérieur de cet intervalle. • Si la loi de probabilité du phénomène est connue, cette proportion est plus faible. 1 | X - m | P( | X - m | > k * ) = P( > k) < 2 k © SPI-EAO Faculté de médecine de Nancy 21
Représentation de deux variables quantitatives : nuage de points • Recherche d’une liaison entre deux caractères
Divers types de résultats « Amande à petit ventre » • Importance de la visualisation du nuage de points Forte corrélation positive r > +0,9 Forte corrélation négative r < -0,9 « Amande à gros ventre » Faible corrélation positive Faible corrélation négative Pas de corrélation r voisin de 0
Les cartes de contrôles • C’est l’outil statistique qui permet de suivre les fluctuations d’une caractéristique mesurable ou dénombrable et d’en diagnostiquer les situations non maîtrisées • C’est un outil de qualité de référence normative dans les normes ISO
Cartes de contrôle • Technique graphique utilisée dans les processus de « fabrication » pour : • S’assure de la stabilité de la production. • Limiter la proportion de produits qui ne sont pas conforme aux tolérances. • Deux catégories : • Carte de contrôle pour des grandeurs mesurables : contrôle de qualité par mesure. • Carte de contrôle pour des grandeurs non mesurables ou caractéristiques qualifiables : contrôle de la qualité par attributs. • Pour mettre en œuvre une carte de contrôle il faut répondre aux questions : • Quels types de caractéristiques (qualitatives ou quantitatives) veut-on contrôler ? • Quels instruments de mesures ou calibres doit-on utiliser • Quel type de carte de contrôle doit-on mettre en œuvre ? • Quelle taille d’échantillon doit-on prélever ? • Quelle doit être la fréquence de contrôle ?
Carte de contrôle pour une caractéristique mesurable (variable quantitative) • Consiste à suivre dans le temps deux éléments important de cette caractéristique • La tendance centrale (moyenne) • La dispersion (étendue, écart type, coefficient de variation) • Principales cartes de contrôle utilisées • Carte de contrôle pour la moyenne ( X ) et d’étendue ( R ) • Carte de contrôle pour la moyenne ( X ) et l’écart type (s) • Carte de contrôle pour la médiane et l’étendue • Carte de contrôle pour les valeurs individuelles et l’étendue mobile • Carte de contrôle pour la moyenne mobile et l’étendue mobile • Carte de contrôle pour la somme cumulative de l’écart entre la moyenne d’un échantillon et une valeur cible ^
Stabilité d’un procédé • Un procédé ou une caractéristique particulière est stable si la statistique qui permet d’en évaluer le comportement dans le temps n’est affectée que par des fluctuations aléatoires. On dit que la variabilité est attribuable à des causes communes et cette variabilité est prévisible à l’intérieur de limites établies selon certains critères statistiques
Carte moyenne et étendue • Taille de l’échantillon < 10 • Nombre d’échantillons : environ 20 • Fréquence de contrôle toute les 30 minutes • Calcul • Pour chaque échantillon • Moyenne X • Étendue • Pour l’ensemble des échantillons • Calcul de la moyenne générale X • Calcul de la moyenne des étendues R • Calcul des limites provisoires de contrôle • Cartes des moyennes • LSC X = X + A2R (limite sup de contrôle) • LIC X = X - A2R • Cartes des étendues • LSCR = D4R • LICR = D3R • La probabilité d’être à l’intérieur de l’intervalle correspond à moyenne + 3 s de la moyenne soit 99,74% et de même pour l’étendue Source ASTM Manual of quality control of materials. American society of testing material. Philadelphia Pa 976
Carte moyenne étendue : Diagnostic • On considère qu’une caractéristique de qualité est maîtrisée si non seulement les points associés aux différents échantillonnages dans le temps sont à l’intérieur des limites mais également que les points ne soient pas disposés selon une suite anormale : • Mise en évidence d’une tendance • Fluctuation en dents de scie • Suite de points du même coté • Points se situant près des limites ou de la ligne centrale • Carte présentant des sommets et des creux • Effet cyclique
Carte moyenne écart type • Utilisée si la taille des échantillons est supérieure ou égale à 10. • On utilise alors l’écart type plutôt que l’étendue. • On utilise l’estimateur de l’écart type de l’échantillon, on calcule la moyenne générale et la moyenne des écarts types • Les limites de contrôles sont • pour la carte des moyennes L_C = X + A3 s • Pour la carte des écarts types LSC =B4 s LIC =B3 s
p N å å U = x 2 = n x 2 i i i = = i 1 i 1 T 2 N å x SCE = ( - x ) 2 = U - i N = i 1 ˆ s CV = x Variance et écart type : calcul • Attention aux notations © SPI-EAO Faculté de médecine de Nancy 34
Remarques sur les cartes de contrôles • Les limites LSC et LIC sont calculées à partir soit • De données observées. On a alors une remise en cause des limites au fur et à mesure de l’augmentation du nombre d’échantillon. On doit retirer des calculs des limites les données des échantillons qui sont hors « limites » d’une des deux cartes • De distributions théoriques modélisable. • Dans les formules précédentes, on construit un intervalle de confiance à 99,74% . On peut prendre un intervalle de confiance différent. • Les cartes de contrôles reviennent à faire un intervalle de confiance ici au seuil de risque 0,0026 soit 0,26%. • Les cartes de contrôle permettent de savoir si la qualité est maîtrisée en terme statistique mais ne préjuge pas de la conformité à des tolérances • On peut créer des cartes de contrôles pour les pourcentages : carte p, np …
Calcul de l’indice de capabilité Cp • Un processus statistiquement maîtrisé est caractérisé par X et s • On suppose que le phénomène suit une loi normale • La carte de contrôle des moyennes crée un intervalle de confiance X + 3s • Cette production a, pour les individus un intervalle de confiance X + 3s d’amplitude 6 s . • La capabilité Cp est le rapport entre la différence des limites de tolérance et cette amplitude ^ ^ N ^ ^ Ts _ Ti Cp = ^ 6 s
Carte de contrôle par attributs • Attribut qualitatif binaire : • DP conforme ou non • Les principale cartes de contrôle par attributs sont : • Carte p : carte de contrôle pour la proportion (%) de non conformes • Carte np : carte de contrôle pour le nombre d’unité non conformes • Carte c : carte de contrôle pour le nombre de non conformités • Carte u : carte de contrôle pour le nombre moyen de non conformités par sous groupe
Carte p • Étapes à suivre • Constitution des échantillons • Choix de la taille de l’échantillon (de 50 à 200) • Fréquence d’échantillonnage : doit permettre un suivi réaliste par rapport aux mesures correctives à apporter • Nombre d’échantillon : 20 à 30 • Calcul des proportions (%) • p = Nombre de non conformes / Taille de l’échantillon • Calcul des limites • Représentation graphique • Diagnostic
Exemple • Contrôle du Diagnostic principal • Méthode : Lors de la saisie des RUM, les techniciennes vérifient le DP de 50 RUM chaque jour par rapport au dossier médical informatisé de l’hôpital du bois joli. • Résultats s = racine (0,1032*(1-0,1032)50) Le point 19 est hors limites et est entouré de deux points suspects. On est censé éliminer le point 19 et refaire les calculs.
Carte de contrôle c • L’unité à contrôlé peut être un RUM et ses différentes anomalies (DP, DR, DAS, CMA…), une certaine longueur (1m) de fil… • On enregistre c : le nombre de non conformité par unité contrôlée • Calcul des limites de contrôles • C moyen = somme (ci)/k ou ci est le nombre d’anomalies de l’unité i et k est le nombre d’unités contrôlées • Les limites de contrôles sont • LSC = c moyen + 3 * racine(c moyen) • LIC = c moyen - 3 * racine(c moyen) • Diagnostic • Analyser les points hors limites et apporter les correctifs
Carte de contrôle c • Exemple de contrôle des RUM Nous avons 2 (points 1 et 14) points hors limites.
Tests d’hypothèses • Conformité à une référence. • Cas des contrôles de qualité interne dans le PMSI • Objectif des contrôles : les informations recueillies dans un hôpital doivent permettre d’estimer de manière correcte sa production en points ISA • Remarque : cet objectif n’oblige pas à avoir un classement correcte des séjour en GHM. On peut avoir 100% d’erreur de GHM et un estimation correcte du nombre de points ISA. • Méthode : • Tirage au sort de 100 dossier par semestre. • Réalisation d’un RSS contrôle par le DIM • Comparaison du nombre de points obtenu par le RSS contrôle au nombre de points du RSS initiale • En moyenne la différence doit être nulle • => comparaison de la moyenne observée à la moyenne théorique 0 à l’aide d’un test de Student • Si on met en évidence une différence statistiquement significatives, il y a redressement.
Comparaison de moyennes série appariées • Situation du problème • Variable quantitative • Deux cas habituels • Mesures répétées deux fois chez le même sujet: • Exemple : on s’intéresse à la tension artérielle. On mesure la TAS avant et après effort Tableau des observations Individu Avant Après Après-Avant Jean 140 160 + 20 Sylvie 150 150 0 Sand. 150 140 - 10 Paul 120 150 + 30 .... • Enquête cas/témoin • Exemple : on s’intéresse au taux de cholestérol dans le cancer du poumon. Pour chaque cancéreux observé, on apparie un témoin non cancéreux mais ayant les mêmes caractères que l’on sait influencer le cancer : âge, sexe.... • On peut éliminer les cas où il n’y a pas les deux valeurs. • On calcule les différents paramètres : moyenne, estimateur de l’écart type...
| d | t = 2 s¶ N Comparaison de moyennes séries appariées • Hypothèses : • Si l’effort n’influence pas la tension artérielle, la moyenne des différences (d = Après - Avant) (ou Cas-Témoin) doit être nulle. On est ramené à la comparaison d’une moyenne observée (moyenne des différences) à une moyenne théorique 0. • Hypothèse nulle (H0) : • La moyenne observée des différences d est un estimateur de la moyenne µo. 0 est la moyenne théorique • µo = 0 • Hypothèse alternative • Test unilatéral : • µo # 0 • Test unilatéral • µo > 0 ou (exclusif) µo < 0 suit une loi de Student à N-1 DDL Pour N=100 et alpha =% t = 1,96 • Condition d’application : si N < 30 : Normalité de la distribution des différences • Si t > talpha : on rejette H0. Il y a une différence significative. On lit le degré de significativité dans la table.
Conformité de l’estimation des points ISA • Base du redressement dans les contrôles de qualité du PSMI court séjour • Exemple : l’hôpital du bois jolis lors de son contrôle de qualité à sur 100 dossier une moyenne des différence de valorisation des RSS de 112 points avec un écart type estimé des différences de 16 points. • La différence est-elle significative au seuil de risque 5% (on approxime t5% DDL 99 par 2) • Sachant que l’hôpital du bois joli a réalisé au total 24 000 000 de points pour 20 000 RSS. Quel est son nombre de points redressés. La différence est très significative.L’hôpital sur-cote. Il y a redressement. S = 2 * 1,6 = 3,2 Points ISA redressés = 24 000 000 - (112-3,2)*20 000 = 21 824 000
Carte pour la conformité d’un pourcentage • Lors des contrôles de qualité du PMSI court séjour, pour les établissements participant on estime que le taux de divergence de GHM doit être en moyenne de 10% • Construire une carte de conformité au risque alpha = 5%
Résolution • N= 100 • P = 0,1 => q= 0,9 • LIC = 0,1-1,96 * racine(0,1*0,9/100) = 0,0412 • LSC = 0,1+1,96 * racine(0,1*0,9/100) = 0,1588
Exercice • Dans l’hôpital du bois joli, on a observé lors des contrôles PMSI semestriels les résultats suivants : Représenter les résultats et proposer des outils pour le suivi de la qualité.